Discussion:
Латышско-русский словарь
(слишком старое сообщение для ответа)
Alexis Makarenko
2007-07-23 10:53:16 UTC
Permalink
Hello All!

Латышские словари в Интернете вещь вообще редкая, тем более хорошие.
Однако вот здесь (skazki.times.lv/latruslov.htm) лежит

============
ЛАТЫШСКО-РУССКИЙ СЛОВАРЬ

(15000 слов)

Составили: О.Логинова, А.Гутманис, П.Рогозинников
Художник И.Крепицс
Издательство "АВОТС"
Рига 1990 г.
============

22 htm -- по одному на каждую букву. Связь плохая, качается
отвратительно (даже с докачкой wget'ом), видимо, поэтому здесь
(1.nestor.z8.ru/06/latruscl.zip) многие файлы оборваны.

Зеркало есть skazki.eclub.lv/latruslov.htm, связь тоже не ахти, но
получше.

Я всё-таки выкачал его полностью и склеил в один текстовый utf-файл
(одна строчка -- одна словарная статья).

To Arnold: на свою страницу словарей возьмёшь? Вещь, повторяю, редкая,
а качать трудно. Объём словаря в UTF-8 -- полтора мегабайта. Если не
устраивает UTF-8, переведу в Windows-1251 с заменой латышских букв на
последовательности вида a=, c^, e=, g~, i=, k~ и т.д.

Примеры:

============
badi=t (~u, ~i, ~a, ~a=m; ~i=ju) 1. бодать; 2. тыкать; b. ar pirkstu
тыкать пальцем
badi=ties (обычно З л.: ~a=s; ~i=ja=s) бодаться
====....====
laime счастье; par ~i к счастью; ~es ve=le=jums пожелание счастья,
подразделение; uz labu ~i наугад, наудачу, наобум, на авось
============
--
Alexis
Arnold Ziber
2007-07-24 04:46:19 UTC
Permalink
Mon Jul 23 2007 15:53, Alexis Makarenko wrote to All:

AM> Латышские словари в Интернете вещь вообще редкая, тем более хорошие.
AM> Однако вот здесь (skazki.times.lv/latruslov.htm) лежит
AM> ============
AM> ЛАТЫШСКО-РУССКИЙ СЛОВАРЬ

AM> To Arnold: на свою страницу словарей возьмёшь? Вещь, повторяю, редкая,
AM> а качать трудно. Объём словаря в UTF-8 -- полтора мегабайта. Если не
AM> устраивает UTF-8, переведу в Windows-1251 с заменой латышских букв на
AM> последовательности вида a=, c^, e=, g~, i=, k~ и т.д.
Возьму, кое-какое место есть. Присылай. Hо вот какую кодировку выбрать для
публикации -- не знаю, а обе публиковать мне не бы не хотелось. С одной
стороны, utf-8 корректнее, с другой стороны, ANSI более распространен.

Что скажет All?

WBR, Arnold
Alexis Makarenko
2007-07-24 10:07:13 UTC
Permalink
Hello Arnold!

Tuesday, 24 July 2007, you wrote to me:

AM>> Объём словаря в UTF-8 -- полтора мегабайта. Если не устраивает
AM>> UTF-8, переведу в Windows-1251 с заменой латышских букв на
AM>> последовательности вида a=, c^, e=, g~, i=, k~ и т.д.

AZ> Возьму, кое-какое место есть. Присылай.

Хорошо, эмейлом попозже. Только там, оказывается не все статьи одной
строкой -- некоторые перенесены. По-хорошему, надо бы склеить... что
может затормозить...

AZ> Hо вот какую кодировку выбрать для публикации -- не знаю, а обе
AZ> публиковать мне не бы не хотелось. С одной стороны, utf-8
AZ> корректнее, с другой стороны, ANSI более распространен.

Ну, Юникод уже давно не экзотика. Та же Википедия на нём.

Есть оболочка Dict для словарей (free-dict.narod.ru), словари для неё
на dict.pocketz.ru (там некоторые словари просто в текстовом формате,
какие-то надо распаковывать в текст с помощью makezd -u) так вот она
словари в UTF-8 понимает. Программа, правда, только для карманных
компьютеров, коммуникаторов и смартфонов с Windows Mobile.

Можно, кстати, в этом формате словари хранить -- это просто текстовый
файл из строк вида "слово{два пробела}словарная статья{перевод строки}".
Конечно, отделить слова от статей не всегда может быть легко.

Спецпрограмм для просмотра простого текста в современных "настольных"
Windows тоже не нужно, можно хоть в Блокноте открыть, хоть в браузере
(указав кодировку). Мне нравится View64 Алексея Чернобаева. Прошу
прощения за небольшой офтопик.

,,,^..^,,,
Best regards,
Alexis
Arnold Ziber
2007-07-24 12:39:55 UTC
Permalink
Tue Jul 24 2007 15:07, Alexis Makarenko wrote to Arnold Ziber:

AM>>> Объём словаря в UTF-8 -- полтора мегабайта. Если не устраивает
AM>>> UTF-8, переведу в Windows-1251 с заменой латышских букв на
AM>>> последовательности вида a=, c^, e=, g~, i=, k~ и т.д.
AZ>> Возьму, кое-какое место есть. Присылай.
AM> Хорошо, эмейлом попозже. Только там, оказывается не все статьи одной
AM> строкой -- некоторые перенесены. По-хорошему, надо бы склеить... что
AM> может затормозить...
Хорошо, не торопись.

AZ>> Hо вот какую кодировку выбрать для публикации -- не знаю, а обе
AZ>> публиковать мне не бы не хотелось. С одной стороны, utf-8
AZ>> корректнее, с другой стороны, ANSI более распространен.
AM> Hу, Юникод уже давно не экзотика. Та же Википедия на нём.
Может, тогда обрамить его метатегами в html?

AM> Спецпрограмм для просмотра простого текста в современных "настольных"
AM> Windows тоже не нужно, можно хоть в Блокноте открыть, хоть в браузере
AM> (указав кодировку). Мне нравится View64 Алексея Чернобаева.
Убедил. Мой AkelPad кодировку utf-8 тоже вроде понимает.

AM> Прошу прощения за небольшой офтопик.
Аналогично :)

WBR, Arnold
Alexis Makarenko
2007-07-26 03:32:59 UTC
Permalink
Hello Arnold!

Tuesday, 24 July 2007, you wrote to me:

AM>> Хорошо, эмейлом попозже. Только там, оказывается не все статьи одной
AM>> строкой -- некоторые перенесены. По-хорошему, надо бы склеить... что
AM>> может затормозить...

AZ> Хорошо, не торопись.

Если получится, склею.

AZ> Может, тогда обрамить его метатегами в html?

Он, кстати, так и был сделал -- обрамлен <pre>...</pre>. Можешь
посмотреть в архиве 1.nestor.z8.ru/06/latruscl.zip -- хоть там и
половина файлов обрезана. (Ой, ты ж про _мета_теги, да ладно.)

Но в результате строки не переносятся (wrap) -- а словарные статьи
бывают длинные. Так что я предположил, что там умышленно большие статьи
разбиты.

Можно тогда обрамлять не <pre> и _в начало_ каждой статьи дописать
какой-нибудь <br>. Тогда, с одной стороны, словарные статьи будут
переносится, с другой стороны, получить plain UTF-8 text будет легко
даже вручную в текстовом редакторе с возможностью удаления вертикальных
блоков. Хотя бы в Far'е.

Правда, я бы предпочёл чистый текст, пусть даже как-то обрамленный, но
без внутренних вставок. Ещё варианты?

AZ> Убедил. Мой AkelPad кодировку utf-8 тоже вроде понимает.

Кто такой, где взять?

AM>> Прошу прощения за небольшой офтопик.

AZ> Аналогично :)

С другой стороны, а как формат обсуждать?

,,,^..^,,,
Best regards,
Alexis
Arnold Ziber
2007-07-26 04:52:11 UTC
Permalink
Thu Jul 26 2007 08:32, Alexis Makarenko wrote to Arnold Ziber:

AM> Можно тогда обрамлять не <pre> и _в начало_ каждой статьи дописать
AM> какой-нибудь <br>. Тогда, с одной стороны, словарные статьи будут
Вполне нормальный вариант. Кому надо, уберет регулярной заменой.

AM> Правда, я бы предпочёл чистый текст, пусть даже как-то обрамленный, но
AM> без внутренних вставок. Ещё варианты?
Так открыл броузером и копи-пейст куда надо... Зато смотреть удобно.

AZ>> Убедил. Мой AkelPad кодировку utf-8 тоже вроде понимает.
AM> Кто такой, где взять?
Мне очень нравится этот редактор, сидит тут:
http://akelpad.sourceforge.net/ru/index.php
Схватывает все варианты юникода, все кодовые страницы. Открытый текст,
сопровождается, куча плагинов. Один минус - пока нет регулярных выражений, но
я под это дело держу другие софтины.

WBR, Arnold
Alexis Makarenko
2007-07-26 07:33:49 UTC
Permalink
Hello Arnold!

Thursday, 26 July 2007, you wrote to me:

AM>> Можно тогда обрамлять не <pre> и _в начало_ каждой статьи дописать
AM>> какой-нибудь <br>. Тогда, с одной стороны, словарные статьи будут

AZ> Вполне нормальный вариант. Кому надо, уберет регулярной заменой.

Тогда на этом остановимся. Только строчки постаюсь склеить.

AZ>>> Убедил. Мой AkelPad кодировку utf-8 тоже вроде понимает.

AZ> Один минус - пока нет регулярных выражений

А вот это жаль... Планируются хоть?

И заодно эхотажный вопрос: как регулярные выражения лучше назвать
по-русски? "Регулярные выражения" какая-то малопонятная калька.
"Метасимволы"? -- по-моему, лучше.

Удачнее, по-моему: "макроподстановки", "подстановочные символы".
Какие ещё будут предложения?

,,,^..^,,,
Best regards,
Alexis
Aleksej R. Serdyukov
2007-07-24 07:56:08 UTC
Permalink
24 Jul 07 09:46:18, Arnold Ziber -> Alexis Makarenko:

AZ> для публикации -- не знаю, а обе публиковать мне не бы не хотелось. С
AZ> одной стороны, utf-8 корректнее, с другой стороны, ANSI более
AZ> распространен.

AZ> Что скажет All?

UTF-8. Где она ещё не поддерживается?
Hе хватало только транслитерации в таком словаре, без оригинала. Пора уже
убивать всякие CP1251. Если надо, рядом можно конвертер* положить.

* Преобразователь? Как-то очень сильно звучит. Заменялку? ;-) Скрипт замены?

Good luck.
Check this book: <http://free-culture.cc/>
Alexis Makarenko
2007-07-27 05:08:21 UTC
Permalink
Hello Aleksej!

Tuesday, 24 July 2007, you wrote to Arnold Ziber:

ARS> UTF-8. Где она ещё не поддерживается?

В Far'е без плагинов. :) Мне это мешается.

ARS> Если надо, рядом можно конвертер* положить.

ARS> * Преобразователь? Как-то очень сильно звучит.

Проще: перекодировщик.

ARS> Заменялку? ;-) Скрипт замены?

Это уже напоминает "мокроступы" и "брандмауэер"/"фаерволл". :)
Даже не "мокроступы", а "читалку" и "гляделку" у Войновича (`газета'
и `телевизор', если кто не знает).

,,,^..^,,,
Best regards,
Alexis

Andrey Maximenko
2007-07-24 06:45:10 UTC
Permalink
Hello, Alexis!

AM> Латышские словари в Интернете вещь вообще редкая, тем более хорошие.

Простите за полуоффтоп, ну не мог не вспомнить
одну из своих любимых книг:

---------------------------------------------------------
Иоанна Хмелевская. Все красное
---------------------------------------------------------
- У вас есть польско-датский словарь? - удивилась я, как могла,
невинно.
- У меня есть все словари, - снизошел Бобусь. - Культурный человек
должен уметь справляться с любым языком.
- Еще нужно быть культурным человеком, - свирепо пробормотала Зося
себе под нос.
- Но ведь тут, пожалуй, нет кулинарных рецептов, - с доброжелательной
печалью сказала я. - Здесь в основном документы совсем другого содержания.
Бобусь казался несколько озадаченным. Накрывающая на стол Алиция
замерла, в экстазе ожидая продолжения: она знала, к чему я клоню.
- То есть? - высокомерно спросил Бобусь.
- Ведь польско-датского словаря не существует. Есть только идиотские
разговорники для туристов, в которых в основном речь идет о еде. Вам будет
довольно трудно ими пользоваться...
---------------------------------------------------------
Читал эту книгу в переводе на русский язык в двух абсолютно разных
переводах.
Кстати, в Инете лежит только перевод М. Кронгауз (который был в "Смене").
Второго так и не нашёл - перечитываю иногда в бумажном варианте :-) .

With best regards, Andrey Maximenko
Alexis Makarenko
2007-07-24 09:25:03 UTC
Permalink
Hello Andrey!

Tuesday, 24 July 2007, you wrote to me:

AM>> Латышские словари в Интернете вещь вообще редкая, тем более хорошие.

AM> - Ведь польско-датского словаря не существует. Есть только идиотские
AM> разговорники для туристов, в которых в основном речь идет о еде. Вам
AM> будет довольно трудно ими пользоваться...

Ну, я-то искал не какой-нибудь латышско-исландский, а латышский вообще.
В ru.linguist'е есть человек из Латвии, но и он смог посоветовать только
онлайновый:

===============================,,,^..^,,,===============================
News: fido7.ru.linguist
From: alexander smishlajev <2:5100/14.8>
To: Alexis Makarenko
Date: Fri, 21 Oct 2005 11:17:48 +0400
Subj: Диакритики в Фасмере
------------------------------------------------------------------------
единственный известный мне электронный словарь - это tildes
datorva=rdni=ca (a= - a macron, i= - i macron). можно ли его назвать
хорошим - не знаю; лично мне почему-то не очень нравится (я вообще
бумажным больше доверяю), хотя, вроде, из солидных словарей составлен.
на вебе он есть по адресу http://www.letonika.lv/DictForm.aspx -
английский бесплатно, русский и немецкий по подписке.

а еще я часто пользуюсь терминологическим словариком на
http://www.termini.lv/
========================================================================

А так мне попадались в лучшем случае наподобие
ai1.mii.lu.lv/pamatv/pamatv.htm -- где всего полторы тысячи слов, да
ещё латышско-русский -- только графикой (!) и без грамматических помет.

А интерес к латышскому у меня отчасти из-за того, что я сам на 1/16
прибалт по материнской линии. Правда, скорее литовец, чем латыш. :)

И ещё меня эти языки близостью к славянским привлекают. Латышский
мне даже удаётся, хотя и с большим трудом, воспринимать как "сильно
испорченный русский". :) С германскими или романскими такое не
выходит. :)

Правда, я ими не владею -- так, баловство на уровне чтения текстов по
методу Ильи Франка.

,,,^..^,,,
Best regards,
Alexis
Loading...