Discussion:
Словарь Фасмера и указатель языков
(слишком старое сообщение для ответа)
Arnold Ziber
2007-08-02 04:12:04 UTC
Permalink
Hi All,

Hекогда Alexis Makarenko написал по поводу сайта http://vasmer.narod.ru
Только тут такая вещь: раньше файлы *.djbz шли через каждые 10 страниц и
были такими же маленькими, как и *.djvu. А теперь этих файлов по одному
на каждый том, и их размер приближается к мегабайту. Так что теперь
онлайновый просмотр для тех, у кого медленный интернет или платный
трафик, стал менее удобным.
Улита едет, когда-то будет... Добрый человек 4u4undr безропотно пережал все
четыре тома с уменьшенными размерами страничных индексов. Теперь их величина
не превышает 30 кб. Все html файлы перегенерированы под новые дежавюшки,
проект перезалит. Всё вместе составляет 134 мегабайта. Если кто что уже
скачал, заново скачивать не следует, для локального просмотра ничего нового не
добавилось. Только для html-ссылок и онлайновых справок.

Обращаюсь с просьбой к All: если у кого-то будет полдня свободного времени, то
можно с пользой потратить его на составление оглавления перечня языков
(указателя), стр. 575-851.
http://vasmer.narod.ru/p4/d575.htm
Это может быть Word или Excel таблица с четырьмя графами: группа языков,
собственно язык и номер страницы начальный-конечный. Можно и текст с
разделителями, все равно.

Hапример:
I. Балтийские языки;а. Литовский;575;607
I. Балтийские языки;б. Древнепрусский;607;613
I. Балтийские языки;в. Латышский;613;633
II. Индийские;а. Древнеиндийский;634;653
II. Индийские;б. Пракрит и новоиндийские;653;653
и т.д. вплоть до
XXVIII. Кавказские;а. Севернокавказские;851;851

Волонтеров прошу отмечаться в эхе или на мой e-mail.

WBR, Arnold
Alexis Makarenko
2007-08-02 05:31:46 UTC
Permalink
Hello Arnold!

Thursday, 2 Aug. 2007, you wrote:

AZ> Улита едет, когда-то будет... Добрый человек 4u4undr безропотно
AZ> пережал все четыре тома с уменьшенными размерами страничных
AZ> индексов. Теперь их величина не превышает 30 кб. Все html файлы
AZ> перегенерированы под новые дежавюшки, проект перезалит. Всё вместе
AZ> составляет 134 мегабайта.

Замечательно! Правда, общий объём, похоже, вырос -- раза в полтора.
В связи с чем вопрос -- так ли уж необходимо 600 dpi? Может, если
300 dpi недостаточно, хватило бы 400?

AZ> Обращаюсь с просьбой к All: если у кого-то будет полдня свободного
AZ> времени, то можно с пользой потратить его на составление оглавления
AZ> перечня языков (указателя), стр. 575-851.
[...]
AZ> Волонтеров прошу отмечаться в эхе или на мой e-mail.

Не могу обещать, что руки дойдут. :) Но занялся бы с удовольствием.

,,,^..^,,,
Best regards,
Alexis
Arnold Ziber
2007-08-02 04:45:52 UTC
Permalink
Thu Aug 02 2007 10:31, Alexis Makarenko wrote to Arnold Ziber:

AZ>> Улита едет, когда-то будет... Добрый человек 4u4undr безропотно
AZ>> пережал все четыре тома с уменьшенными размерами страничных
AZ>> индексов. Теперь их величина не превышает 30 кб. Все html файлы
AZ>> перегенерированы под новые дежавюшки, проект перезалит. Всё вместе
AZ>> составляет 134 мегабайта.
AM> Замечательно! Правда, общий объём, похоже, вырос -- раза в полтора.
AM> В связи с чем вопрос -- так ли уж необходимо 600 dpi? Может, если
AM> 300 dpi недостаточно, хватило бы 400?
Hет, 600 dpi -- это обязательное условие. Старая версия 300 dpi путала
"о-огонек" и "о-седилья", рубила индийскую диакритику и даже путала "и" с "н",
не факт, что при 400 dpi это исчезло бы. Что до существенного увеличения
общего объема, это произошло из-за того, что 4u4undr во второй версии заложил
максимальное качество распознавания. Пусть будет. Изменить число dpi без
пересканирования вообще практически невозможно, а кто ж будет пересканировать
такой объём...

AZ>> Волонтеров прошу отмечаться в эхе или на мой e-mail.
AM> Hе могу обещать, что руки дойдут. :) Hо занялся бы с удовольствием.
Заранее спасибо! Если получится, укажи тут отработанный интервал страниц,
чтобы не делать дважды одну и ту же работу.

WBR, Arnold
Alexis Makarenko
2007-08-02 06:37:06 UTC
Permalink
Hello Arnold!

Thursday, 2 Aug. 2007, you wrote to me:

AM>> В связи с чем вопрос -- так ли уж необходимо 600 dpi? Может, если
AM>> 300 dpi недостаточно, хватило бы 400?

AZ> Hет, 600 dpi -- это обязательное условие. Старая версия 300 dpi
AZ> путала "о-огонек" и "о-седилья",

Понятно.

А можно пример, где эти символы различаются? Я думал, что это просто
типографские варианты О носового (в одних книгах с огонком, в других
с седилью), причём огонок правильнее.

У Старостина, кстати, везде седиль распознана как огонок, даже во
французских словах. :)

AZ> Что до существенного увеличения общего объема, это произошло из-за
AZ> того, что 4u4undr во второй версии заложил максимальное качество
AZ> распознавания.

Т. е. качество выше, чем у исходного PDF (который был раза в четыре
меньше, получается)?

AZ> Пусть будет. Изменить число dpi без пересканирования вообще
AZ> практически невозможно,

Да, там ведь картинка однобитовая. Приходят в голову варианты с
переводом в градации серого, сжатием и переводом в монохром (если
это вообще возможно)... но это, конечно, лучше, например, в ru.ocr
спрашивать или почитать архивы (там, помнится, FAQ есть).

,,,^..^,,,
Best regards,
Alexis

Loading...