Aaa » учет синтаксиса при поиске allow_partial » допускать пропуск слов паттерна запроса allow_audio » извлекать текстовые тэги (комментарии) из аудио-файлов allowraw » пытаться извлечь текстовую информацию из файлов неизвестного формата allow_gfx » извлекать текстовые тэги (комментарии) из графических файлов allow_video » извлекать текстовые тэги (комментарии) из видео-файлов allow_exec » извлекать информацию о версии из исполняемых файлов Ccase » учитывать регистр букв при поиске cdrom » искать на CD/DVD correlate » проверка грамматического согласования cp » задание кодировки для документов Ddcache » управление кэшем распакованных файлов dir » задание области поиска: каталоги для просмотра distance » задание максимального расстояния между словами при фиксации контекста dynforms » включение сложного морфологического анализатора datamine freq » автореферирование документа datamine topic » выявление темы документа Eecho_topic » печатать категории документов empty » отбирает пустые файлы engine » обращение к внешнему поисковику exec » исполнение команд для найденных файлов Ffile » задание области поиска: отдельные файлы flist » задание области поиска: файл со списком имен файлов для обработки force_txt » считать, что файлы в формате plain text Hhref » следовать по гиперссылкам при сканировании веб-страниц httpd » управление HTTP сервером hidden_query_fields » задание параметров для GET-запроса Iignore_contents » не анализировать содержимое файлов iname » фильтр: задание маски для имени файла без учета регистра index » управление индексатором index create_domain » объявление нового индекса Llan » искать в доступных в локальной сети ресурсах language » загружать морфологические анализаторы только для указанных языков lexems_margin » формирование отображаемого контекста фиксации - число показываемых лексем listfiles » формирование результатов поиска в разных форматах links » фильтр типов связей при сопоставлении по тезаурусу locate » поиск ключевых слов везде Mmaxdepth » максимальное число последовательных скачков по гиперссылкам modif » фильтр: дата модификации файла mycomp » искать на всех дисках компьютера mydocs » искать в папке "Мои документы" текущего пользователя minbound » минимальная достоверность принимаемых результатов maxtraffic » ограничение на использованный интернет-трафик multiword » поиск слов из справочника в документах maxhitcount » максимальное кол-во находимых контекстов при поиске Nname » фильтр: задание маски для имени файла notname » фильтр: задание маски для имен игнорируемых файлов |
Oocr » включать подсистему распознавания ok » исполнять для каждого найденного файла команду с подтверждением onceperfile » искать все контексты в каждом файле или только первый ordered » строго следовать заданному в запросе порядку слов паттерна Pprefer_cp » список предпочитаемых кодировок документов preprocess » доп. обработка текста до поиска/индексирования printfn » печатать список имен найденных файлов на консоли Qquery_filemasks » маски файлов для индексного описка Rraw_ext » расширения двоичных файлов для извлечения текста recurse » рекурсивно обходить подкаталоги regex » паттерн запроса - регулярное выражение rename » переименование индекса report » статистический анализ обрабатываемых документов rx » паттерн запроса - набор регулярных выражений для слов rooting » при сравнении отбрасывать аффиксы (сравнивать корни) Ssame_domain » при следовании по гиперссылкам не выходить за рамки исходного домена sample » паттерн запроса - набор слов semnet » работа с семантической сетью set_comment » задание комментария для индекса showcontext » найденные контексты печатать в консоли soundex » нечеткий поиск size » фильтр: размер файла stems » использовать стемминг при поиске store_all_files » обрабатывать все файлы (не только текстовые) store_download » распакованные и скачанные файлы сохранять во временном каталоге strip_accents » убирать диактрические значки (акценты) stripdecor » обработка тэгов разметки в HTML и XML sort » сортировка результатов поиска по разным критериям subst_shares » делает файловые пути в результатах сетевыми target_content » искать в содержимом документа target_filename » искать в именах файлов topic_db администрирование с авторубрикатора topic_db load_xml FFF » задание списка рубрик topic_db train FFF » обучение авторубрикатора topic_db dump_topics » вывод списка рубрик topic_db dump_topic TTT » вывод логики для заданной рубрики topic_db purge » полная очистка БД рубрикатора topic_db save_xml FFF » сохранение базы рубрикатора в XML файле translit » использовать транслитерацию try_translit » при поиске использовать транслитерированную форму запроса Uunpack » разрешение обрабатывать архивы uri » область поиска: HTTP, FTP серверы urimask » регексп-фильтры на гиперссылки urinotmask » запрещающие регексп-фильтры на гиперссылки Vverbose » печатать разнообразную информацию в консоли по ходу поиска version » напечатать текущую версию поискового движка Wwhereis » файловый поиск везде wildcards » упрощенные регулярные выражения с символами * и ? wordforms » включать учет морфологии при поиске
|
Процедурный API поисковой системы
Скачать SDK поисковой системы с примерами и другие компоненты можно здесь 
© Mental Computing 2010
|
|
изменено 07-Jun-10 |