From: (Alexander I. Lebedev) <ail-f@scon155.phys.msu.su>
Newsgroups: fido7.ru.unix
Subject: Словари русского языка для ispell
Привет!
Хочу представить вашему вниманию словари русского языка для ispell, которые
могут быть полезны всякому человеку, желающему грамотно писать по-русски.
- Александр
------------------------
Словарь русского языка для ispell
Версия - 0.99e5
Автор: Александр Лебедев (swan@mch.chem.msu.su)
Предлагаемый орфографический словарь русского языка представляет интерес
прежде всего для пользователей UNIX, в котором набор средств для проверки
правописания весьма ограничен. Однако словарь может быть полезен и для
пользователей, работающих в других операционных системах, в частности DOS,
OS/2 и Windows (в DOS-окне), поскольку словарь поддерживает пять различных
кодировок русских букв (см. ниже). Встроенные в ispell функции позволяют
считать его весьма удобным средством для работы с текстами, подготовленными
в редакторе TeX, а также с файлами в формате HTML. Кроме этого, словарь
может использоваться в локальных и глобальных поисковых системах, строящихся
на основе программ, подобных HTDig.
Исторически предлагаемый словарь возник из небольшого словаря русского
языка для ispell, составленного Нилом Далтоном (Neal Dalton) в 1992 г.
После тщательной проверки и исправления примерно 4000 ошибок в словаре
Нила Далтона (в этой части работы использовался орфографический словарь
русского языка, выпущенный Институтом русского языка АН СССР), в словарь
были добавлены отсутствовавшие в нем правила образования форм
существительных, прилагательных, причастий, наречий, изменены правила
формирования окончаний глаголов, так что affix-файл можно считать
переписанным заново. Одновременно в словарь было добавлено большое число
слов. Все слова в настоящем словаре проверены с помощью электронного
орфографического словаря "Корректор" (120 тысяч слов), а обнаруженные
расхождения выверены по орфографическому словарю, справочнику Зализняка
("Грамматический словарь русского языка: словоизменение", 100 тысяч слов)
и "Сводному словарю современной русской лексики" (170 тысяч слов). Все
новые слова, добавляемые в словарь, проходят проверку с помощью
орфографических словарей (в специальных областях -- энциклопедий).
Слова, не найденные в этих изданиях, добавляются если они действительно
широко используются и лишь при условии, что в их написании нет никаких
сомнений. В настоящей версии объем словаря составляет более 103.8 тысяч
базовых слов, а полное число образуемых словоформ увеличилось до 988.5 тысяч
(против 52 тысяч в словаре Нила Далтона).
Отличительной чертой данного словаря от всех известных автору других
орфографических словарей является то, что начиная с версии 0.99c0 в него
включена полноценная поддержка буквы ё (другие словари просто заменяют
букву ё на букву е). Это может быть очень полезно для лиц, занимающихся
подготовкой литературы для детей младшего возраста, изданий для
иностранцев, орфографических справочников -- там, где правила требуют
использования буквы ё.
Словарь base.koi, а также четыре дополнительных словаря (computer.koi,
geography.koi, rare.koi, science.koi) и файл russian.aff.koi поставляются
в кодировке koi8-r. Для преобразования текстов в другие поддерживаемые
кодировки -- cp866 (alt), iso-8859-5, cp1251 (win) и maccyrillic --
в комплект включен скрипт-перекодировщик trans, написанный Владимиром
Воловичем.
Внимание! В словарь rare.koi выделены некоторые редкие слова, написание
которых мало отличается от широко распространенных слов (например, пара
слов шоссе--шассе) и включение которых в основной словарь может приводить
к пропуску ошибок. По умолчанию эти слова не включаются в словарь. Если
эти слова вам действительно могут понадобиться, уберите значок # в конце
строки dict = ... в Makefile.
Словарь постоянно совершенствуется, дополняется и корректируется.
Последнюю версию словаря можно найти на сервере:
ftp://scon155.phys.msu.su/pub/russian/ispell/rus-ispell.tar.gz
Файлы-заготовки для пользователей DOS в кодировках cp866 и cp1251 можно
найти на сервере:
ftp://scon155.phys.msu.su/pub/russian/ispell/msdos/
Рекомендации по установке словарей см. в файле README.koi в пакете.