В таблице приведены основные возможности, поддерживаемые поисковой машиной и грамматическим движком. Текущие нововведения отражаются в разделе новостей. Полное детальное описание всех возможностей движка доступно в разделах по консольной утилите φaind, оконной поисковой системе Integra, и пакете для разработчиков SDK.
Дополнительно доступны результаты статистического анализа лексикона и различных текстовых корпусов.
| Форматы архивов | rar zip gzip bzip2 7zip tar tgz cab arj chm lzh ace iso |
| Типы файлов | txt (ascii, utf-8, utf-16), rtf, pdf, html, xml, MS Word, MS Excel, PowerPoint, Visio, MS Access, OpenOffice, TeX, комментарии и тэги в файлах MP3, Ogg Vorbis, WMA/WMV, JPEG, TIFF, SVG, PNG, текстовая информация в DBF, DLL, LIB, DVI, DjVu, документы MDI (MODI), MS Reader LIT |
| Виды поиска | жесткие диски, CD/DVD, локальная сеть, веб-сайты и ftp-серверы интернета (есть встроенный сканер открытых портов), внешние поисковики |
| Индексатор | встроенная индексная база данных, большое количество режимов работы, каталогизатор CD/DVD, возможность создания очень компактных индексов с очень большой скоростью поиска, индексатор допускает использование при поиске регулярных выражений и нечеткого поиска » |
| Авторубрикатор | два алгоритма классификации документов, включая обучаемый по эталонным текстовым файлам » |
| Языки | сменные словари для русского, английского, французского, испанского, базовая поддержка Юникода; см. подробнее и примеры |
| Объем словаря | русский: ~164 500 статей, 625 тыс. связей, из них 482 тыс. синонимов английский: ~69 000 статей, 595 тыс. связей, из них 409 тыс. синонимов китайский: ~125 000 статей французский: ~20 000 статей испанский: ~52000 статей |
| Кодировки текста | все основные (включая разновидности utf, iso-8859, кириллицу, азиатские и пр.) » |
| Платформы | x86 и x64; Windows 9x/NT, .NET, Linux |
| Автоопределение кодовой страницы | для русского, английского и французского языков |
© Elijah Koziev 2010
Поисковая система
SDK Поисковой системы
Экранный переводчик
|
|
изменено 11-Dec-11 | ||||||||||||||||||||||||||||||||||||||