Date: Sat, 09 Jun 2001 12:55:36 +0400
From: Ilya Soldatkin <arc@bob.techcen.zgrad.su>
Newsgroups: fido7.ru.perl
Subject: Lingua::RU::Antimat - модуль для замены матершинных слов
Привет, Stephen!
Можете посмотреть на мой модуль для замены мата на какое-нибудь более
приличное слово.
www.tcen.ru/antimat
Это почти то, что Вы хотите.
Заменяет безусловно не все, но довольно много. Английские буквы тоже
распознает, за исключением многосложных гласных (я=>ja, ю=>ju).
Hачал я это писать в январе этого года, только не для гостевой, а для чата. :)
Сделал практически все, за исключением оформления веб-страничек. Так что,
таким убогим оформлением пока не придирайтесь, через несколько дней будет
лучше.
Добавлял я слова в модуль следующим образом, брал текст из гостевой книги, где
можно ругаться матом, и смотрел какие слова в этом тексте заменены, а какие -
нет. Когда кол-во bip'ов стало меня удовлетворять - закончил. Поэтому вполне,
возможно, что какие-то слова, я пропустил (особенно редко используемые
окончания).
SA> тупо в лоб: брать маты из словаря и искать в тексте
SA> проблема: начинают заменять буквы на схожие латинские
SA> всё бы ничего, могу поставить вначале перекодировку в русский алфавит, но
SA> мне надо не отсеять тексты с матами, а замаскировать маты, чем-нить типа
SA> [censored].
SA> если я перекодирую, то маскировать придётся прямо в перекодированном
SA> тексте.
С уважением,
Илья Солдаткин