Discussion:
Словарь Фасмера
(слишком старое сообщение для ответа)
Vadim Zelenkov
2007-05-23 18:24:53 UTC
Permalink
Добрый день!

Факсимильное воспроизведение, четыре тома, pdf, около 8 мег каждый.

http://imwerden.de/cat/modules.php?name=books&pa=showbook&pid=1095
http://imwerden.de/cat/modules.php?name=books&pa=showbook&pid=1096
http://imwerden.de/cat/modules.php?name=books&pa=showbook&pid=1097
http://imwerden.de/cat/modules.php?name=books&pa=showbook&pid=1098

xposted в ru.linguist

В.З.,
http://vadim-i-z.livejournal.com/
--
Отправлено через сервер Форумы@mail.ru - http://talk.mail.ru
Alexis Makarenko
2007-05-24 09:43:49 UTC
Permalink
Hello Vadim!

Thursday, 24 May 2007, you wrote:

VZ> Факсимильное воспроизведение, четыре тома, pdf, около 8 мег каждый.

VZ> http://imwerden.de/cat/modules.php?name=books&pa=showbook&pid=1095

Причём издание 1986--1987 гг., в отличие от издания, выложенного
Арнольдом в дежавю (то 1964 г.). Интересно, какие отличия между ними?

Объём, правда, сравнивый (в дежавю 41 Мб). Причём написано, что внутри
PDF'a джейпег -- как же его ужали сильнее дежавю?..

,,,^..^,,,
Best regards,
Alexis
Vadim Zelenkov
2007-05-24 16:40:54 UTC
Permalink
Добрый день!
24 мая 2007 года Alexis Makarenko писал(а), обращаясь к Vadim Zelenkov:

VZ>> http://imwerden.de/cat/modules.php?name=books&pa=showbook&pid=1095

AM> Причём издание 1986--1987 гг., в отличие от издания, выложенного
AM> Арнольдом в дежавю (то 1964 г.). Интересно, какие отличия между ними?

AM> Объём, правда, сравнивый (в дежавю 41 Мб). Причём написано, что внутри
AM> PDF'a джейпег -- как же его ужали сильнее дежавю?..

По ссылке есть координаты оцифровщика.

В.З.,
http://vadim-i-z.livejournal.com/
--
Отправлено через сервер Форумы@mail.ru - http://talk.mail.ru
Arnold Ziber
2007-05-25 03:37:12 UTC
Permalink
Thu May 24 2007 14:43, Alexis Makarenko wrote to Vadim Zelenkov:

VZ>> Факсимильное воспроизведение, четыре тома, pdf, около 8 мег каждый.

VZ>> http://imwerden.de/cat/modules.php?name=books&pa=showbook&pid=1095

AM> Причём издание 1986--1987 гг., в отличие от издания, выложенного
AM> Арнольдом в дежавю (то 1964 г.). Интересно, какие отличия между ними?
Добрый человек 4u4undr собственноручно прислал мне эти образы, и я
внимательнейшим образом их изучил. Заявляю -- никаких отличий. С точностью до
номера страницы и знака переноса. Разница лишь в том, что на сайте с Фасмером
текст подслеповат (сделан с гифов 300 dpi), соответственно наличествуют
подмены символов. А в новом варианте сканирование выполнено в 600 dpi и текст
очень, очень чёткий. Как только выдастся свободная минутка на полдня, заменю
образы на сайте.
(Sic -- в томе 4 напечатано "Москва, Прогрес, 1987" - с одной "с") :)

AM> Объём, правда, сравнивый (в дежавю 41 Мб). Причём написано, что внутри
AM> PDF'a джейпег -- как же его ужали сильнее дежавю?..

В пэдээфе алгоритм сжатия образов страниц примерно такой же, как и в дежавю
(точнее, наоборот). Так что особых отличий нет и не будет. Споры между
дежавюшниками и пэдээфниками мне сильно напоминают споры между
остроконечниками и тупоконечниками у Свифта...

WBR, Arnold
Arnold Ziber
2007-05-31 08:24:21 UTC
Permalink
Fri May 25 2007 09:37, Arnold Ziber wrote to Alexis Makarenko:

AM>> Причём издание 1986--1987 гг., в отличие от издания, выложенного
AM>> Арнольдом в дежавю (то 1964 г.). Интересно, какие отличия между ними?

AZ> Добрый человек 4u4undr собственноручно прислал мне эти образы, и я
AZ> внимательнейшим образом их изучил. Заявляю -- никаких отличий. С
AZ> точностью до номера страницы и знака переноса. Разница лишь в том, что на
AZ> сайте с Фасмером текст подслеповат (сделан с гифов 300 dpi),
AZ> соответственно наличествуют подмены символов. А в новом варианте
AZ> сканирование выполнено в 600 dpi и текст очень, очень чёткий. Как только
AZ> выдастся свободная минутка на полдня, заменю образы на сайте.
Докладываю -- выдалась и заменил. Теперь образы гораздо разборчивее. Отдельно
на сайте даны ссылки на те страницы, которые не вошли в chm версию (см. ниже)

[ От редакции | Предисловие (Б. А. Ларин) | Предисловие автора | Послесловие
автора ]
[ Указатель литературы и хронологические данные | Языки и диалекты | Прочие
сокращения | Hекоторые исправления ]
[ Указатель ]
Дополнения О. H. Трубачева к 2-му изданию
[ Том 3 | Том 4 ]

Вот не знаю, попытаться начерно расшифровать ещё и указатель, или это никому
не нужно. Там более 150 страниц, одних только групп языков три десятка, а
самих языков без счету (штук триста точно).

WBR, Arnold
Alexis Makarenko
2007-06-05 12:43:59 UTC
Permalink
Hello Arnold!

Thursday, 31 May 2007, you wrote:

AZ> Вот не знаю, попытаться начерно расшифровать ещё и указатель, или
AZ> это никому не нужно. Там более 150 страниц, одних только групп
AZ> языков три десятка,

Можно расшифровать сначала только эти 32 группы языков. Работы немного,
но уже полезно.

AZ> а самих языков без счету (штук триста точно).

По-моему, там далеко не каждая группа на десять подзаголовков (не
отдельных языков) делится. Надо будет повнимательнее посмотреть.

,,,^..^,,,
Best regards,
Alexis
Alexis Makarenko
2007-06-06 10:33:29 UTC
Permalink
Hello Arnold!

Thursday, 31 May 2007, you wrote:

AZ> Докладываю -- выдалась и заменил. Теперь образы гораздо разборчивее.
AZ> Отдельно на сайте даны ссылки на те страницы, которые не вошли в chm
AZ> версию (см. ниже)

Только тут такая вещь: раньше файлы *.djbz шли через каждые 10 страниц и
были такими же маленькими, как и *.djvu. А теперь этих файлов по одному
на каждый том, и их размер приближается к мегабайту. Так что теперь
онлайновый просмотр для тех, у кого медленный интернет или платный
трафик стал менее удобным.

И пожелание: как для Черных сделано "Скачать все HTML-файлы одним
RAR-архивом (300 кбайт)", так и для Фасмера такое было бы удобно сделать.

И, разумеется, большущее спасибо!

,,,^..^,,,
Best regards,
Alexis
Alexis Makarenko
2007-06-07 10:41:37 UTC
Permalink
Hello All!

Wednesday, 6 June 2007, I wrote to Arnold Ziber:

AZ>> Докладываю -- выдалась и заменил. Теперь образы гораздо разборчивее.

Более того, они с распознанным текстовым слоем! Хотя там только русские
и латинские буквы (и всякие цифры и знаки препинания), и нет ударений,
греческих, редких и устаревших букв, но и это уже замечательно!

AM> И пожелание: как для Черных сделано "Скачать все HTML-файлы одним
AM> RAR-архивом (300 кбайт)", так и для Фасмера такое было бы удобно сделать.

В первую очередь я имел в виду файлы, лежащие в vasmer.narod.ru/p1/ --
vasmer.narod.ru/p4/ и те, что в корне, кроме p001.htm -- p912.htm. Их
немного. Впрочем, и p001.htm -- p912.htm запаковываются всего лишь в
два мегабайта с хвостиком...

AM> И, разумеется, большущее спасибо!

,,,^..^,,,
Best regards,
Alexis
Alexis Makarenko
2007-08-03 09:51:26 UTC
Permalink
Hello Arnold!

Thursday, 7 June 2007, I wrote:

AZ>>> Докладываю -- выдалась и заменил. Теперь образы гораздо разборчивее.

AM> Более того, они с распознанным текстовым слоем! Хотя там только
AM> русские и латинские буквы (и всякие цифры и знаки препинания),
AM> и нет ударений, греческих, редких и устаревших букв, но и это уже
AM> замечательно!

Так: в предыдущей версии Фасмера текстовый слой был, а в новой
(пережатой заново с качеством выше) его уже не стали создавать?

,,,^..^,,,
Best regards,
Alexis
Arnold Ziber
2007-08-03 11:10:27 UTC
Permalink
Fri Aug 03 2007 14:51, Alexis Makarenko wrote to Arnold Ziber:



AM> Так: в предыдущей версии Фасмера текстовый слой был, а в новой
AM> (пережатой заново с качеством выше) его уже не стали создавать?

Да, похоже, так. Я, когда обнаружил это, даже не стал говорить об этом
источнику: текст и так имеется (старостинский). К чему дублировать?

WBR, Arnold
Alexis Makarenko
2007-08-07 11:59:52 UTC
Permalink
Hello Arnold!

Friday, 3 Aug. 2007, you wrote to me:

AM>> Так: в предыдущей версии Фасмера текстовый слой был, а в новой
AM>> (пережатой заново с качеством выше) его уже не стали создавать?

AZ> Да, похоже, так. Я, когда обнаружил это, даже не стал говорить
AZ> об этом источнику: текст и так имеется (старостинский). К чему
AZ> дублировать?

Чтоб в одном месте (файле) всё было, а так согласен. Тем более, что есть
юникодный старостинский текст в исходном формате словарей Lingvo -- там,
напоминаю, гораздо лучше сохранены диакритики.

,,,^..^,,,
Best regards,
Alexis

Arnold Ziber
2007-06-12 04:14:02 UTC
Permalink
Wed Jun 06 2007 15:33, Alexis Makarenko wrote to Arnold Ziber:

AM> Только тут такая вещь: раньше файлы *.djbz шли через каждые 10 страниц и
AM> были такими же маленькими, как и *.djvu. А теперь этих файлов по одному
AM> на каждый том, и их размер приближается к мегабайту. Так что теперь
AM> онлайновый просмотр для тех, у кого медленный интернет или платный
AM> трафик стал менее удобным.
Тут, понятно, не место обсуждать эту тему, но если у тебя или у кого-то из
подписчиков есть рецепт, как это побороть, скинь мне на ***@kaluga.ru,
пожалуйста. Я получил дежавю одним готовым bundle файлом и перед загрузкой на
сайт выполнил Save as... Indirect.

AM> И пожелание: как для Черных сделано "Скачать все HTML-файлы одним
AM> RAR-архивом (300 кбайт)", так и для Фасмера такое было бы удобно сделать.
Сделано. Получилось 4.8 Мб, в требования народа.ру уложился...

AM> И, разумеется, большущее спасибо!
Hе за что :)

WBR, Arnold
Alexis Makarenko
2007-06-27 11:22:26 UTC
Permalink
Hello Arnold!

Tuesday, 12 June 2007, you wrote to me:

AM>> Только тут такая вещь: раньше файлы *.djbz шли через каждые
AM>> 10 страниц и были такими же маленькими, как и *.djvu. А теперь
AM>> этих файлов по одному на каждый том, и их размер приближается
AM>> к мегабайту.

AZ> Тут, понятно, не место обсуждать эту тему, но если у тебя или у
AZ> кого-то из подписчиков есть рецепт, как это побороть, скинь мне на
AZ> ***@kaluga.ru, пожалуйста. Я получил дежавю одним готовым bundle
AZ> файлом и перед загрузкой на сайт выполнил Save as... Indirect.

Боюсь, тут только пережимать заново, и не уверен, что можно это сделать
без потери качества (хотя, может, и при пережатии качество почти не
упадёт). Место обсуждать -- например, fido7.ru.ocr. Кстати, порылся
в её архивах на Гугле -- нашёл кое-что эхотажное. Но об этом попозже
напишу. :)

,,,^..^,,,
Best regards,
Alexis
Loading...