Так как речь далее будет идти об версии поисковой системы под Linux, то прежде всего нужно скачать с сайта архив - для 32-битной Linux или для 64-битной. Далее нужно просто распаковать их в подходящее место.
В состав архивов уже входит все необходимое, в том числе морфологический модуль, поэтому утилита готова к использованию. Конфигурационный файл faind.ini содержит такие настройки, что индексные базы будут сохраняться в домашнем каталоге текущего пользователя.
В дальнеших примерах будет использован интерактивный режим, для активации которого необходимо запустить программу с ключом -console. Это позволяет вводить командную строку много раз без перезапуска утилиты и сопутствующей загрузки словарных модулей.
Прежде всего, убедимся, что индексных баз еще нет. Информация о созданных полнотекстовых и прочих индексах хранится в базе данных, которая создается при первом запуске утилиты. Введите команду -index domains, которая выводит список актуальных индексных баз:
Теперь создадим полнотекстовый индекс. Создание индекса происходит в несколько шагов, позволяющих
контролировать различные параметры. Сначала создается пустая индексая база с помощью команды
-index create_domain. Кроме названия индекса (в примере это solarix),
можно задавать дополнительные управляющие флаги, включая тип движка индексатора. Так как версия под Linux скомпилирована
с единственным доступным движком, то достаточно указать только имя создаваемого индекса.
На втором шаге выполняется индексирование группы документов. Список мест расположения индексируемых документов в документации именуется область поиска, так как точно также задается список документов для поиска без использования индекса.
Область поиска, или в нашем случае
индексирования, содержит как перечень папок с документами, так и пути
к отдельным документам, маски для фильтрации файлов по имени, размеру,
дате, и также параметры для выделение текстового содержимого
из файлов разных форматов. В простейшем случае можно указать путь к
каталогу с документами с помощью команды -dir, предоставив остальное
на выбор самого движка:
После завершения индексирования будет выведена небольшая статистика, а с помощью команды -index info можно проверить состояние индексной базы.
Все операции с участием созданных индексов выполняются путем указания имени индекса, которое мы задали в самом начале командой -index create_domain. Таким образом, пользователь избавлен от необходимости помнить места расположения файлов индексной базы данных. Движок позволяет создавать неограниченное число отдельных индексных баз, к которым можно обращаться по именам. Более того, в команде -index domain можно указывать список имен индексов, таким образом выполняя поиск по группе индексов одной командой. В простейшем случае для поиска в документах в одном конкретном индексе достаточно задать его имя, и задать ключевое слово командой -sample:
Использованная в этом поисковом запросе команда -wordforms дает движку указание подключать блок русской морфологии, чтобы корректно найти все грамматическое формы существительного. Существуют и другие команды для настройки морфологии поиска.
Запрос в данном примере выдает только имена файлов, в которых присутствует ключевое слово или любая из его
грамматических форм:
С помощью команды -listfiles можно вывести список найденных файлов в текстовый файл одного из нескольких допустимых форматов. А команда -index touchfiles заставит движок также открыть каждый из найденных документов и найти в нем точное место, где встретилось ключевое слово.
Список всех команд поискового движка
Описание консольной поисковой утилиты
© Elijah Koziev 2010
Поисковая система
SDK Поисковой системы
Экранный переводчик
|
|
изменено [an error occurred while processing this directive] | ||||||||||||||||||||||||||||||||||||||