Пояснение | Поисковый механизм выгодно отличающийся тем, что может индексировать что угодно (HTML, DVI, PS, PDF, troff, RTF, Microsoft Word/Excel, SGML и т.д.), где угодно (HTTP, FTP, NNTP и т.д.). Индексы хранятся в GDBM базе. Для индексации 100 тыс. документов, объемом 1.5 GB достаточно Pentium 650MHz с 256MB ОЗУ, присутствует возможность распределения нагрузки на несколько машин.
harvest-ng - попытка переписать Harvest на Perl с сохранением общей архитектуры.
Документация пользователя Harvest на русском языке. |