Поисковая система: область поиска

Диалоговое окно задания области поиска

Область поиска (search domain) это имена файлов, каталогов, адреса веб-ресурсов (см. подробное техническое описание в поисковом движке). Все параметры области поиска вводятся в одном окне, для удобства использования множество дополнительных параметров (например - работа с кодировками файлов, опции сетевого паука) собраны в группы на отдельных вкладках.

Необходимо заметить, что допускается поиск как в индексированных областях (индексах - см. об индексировании и технические детали индексатора), так и в произвольных неиндексированных. Индексирование документов позволяет очень быстро находить файлы по ключевым словам при многократных поисках, но требует дополнительных ресурсов на поддержку индексной базы - как дискового пространства, так и оперативной памяти.

Рассмотрим задание области поиска без индексирования. Этот вариант подходит для случаев разового поиска, когда построение и сохранение индексной информации является неэффективным (см. бенчмарки поискового движка).

После запуска программы появляется главное окно (если, конечно, в конфигурации не выбрано отображать поисковик в панели задач):

главное окно поисковика

Использованные при поиске области (несколько последних) отображаются в выпадающем списке на главной форме, что позволяет быстро выбирать среди наиболее часто используемых областей.

Нажатие указанной на скриншоте кнопки выводит диалог для быстрого выбора области поиска:

Выбрав "Другие варианты", Вы откроете форму задания области поиска, на которой сразу по умолчанию активирована вкладка со списком источников документов:

форма задания области поиска - добавление источников данных

Необходимо также заметить, что индексирование документов также включает на определенном этапе формирование области поиска с помощью вышеописанной формы.

Кроме задания источников документов, другие вкладки позволяют определять кодировки текста, фильтры файлов, параметры работы в Интернете для сетевого паука, и другие опции.

Добавление источников документов

Указанные на скриншоте кнопки позволяют добавлять в список папки (поиск в них будет выполняться рекурсивно, то есть вложенные папки будут просмотрены автоматически), отдельные файлы, адреса веб-ресурсов, некоторые другие источники документов. Хотя Интегра - это преимущественно локальная поисковая система, она позволяет также работать с ресурсами в сети (в том числе искать доступные ресурсы с помощью встроенного сетевого сканера) и интернет-ресурсами (то есть выполнять поиск на веб-серверах).

Группа кнопок слева от списка позволяет добавлять в список пути к CD/DVD диску, папке "Мои документы", все установленные жесткие диски или выполнить поиск доступных сетевых ресурсов с помощью встроенного сканера сети.

Допустим, мы добавили в список имя каталога с некоторыми документами:

область поиска - форма ввода

В нижнем поле можно ввести произвольное имя для области и сохранить ее определение в произвольном файле на диске. Это позволит в дальнейшем быстро загрузить определение области поиска - к примеру, выбрав нужную область из списка на вкладке "История" и нажав кнопку "Загрузить":

история областей поиска

Программа сама ведет список именованных сохраненных областей. Двойной клик на имени области (в списке на вкладке История) или нажатие на обведенную кнопку загружает определение области поиска без необходимости вспоминать, в каком файле на диске она была сохранена.

Связь с API поискового движка

Все параметры, заданные пользователем на форме области поиска, в том числе - элементы списка источников документов, преобразуются в команды поискового движка, полное описание которых можно найти в соответствующем разделе технической документации.

Где скачать поисковую систему и SDK

Скачать SDK поисковой системы с примерами и другие компоненты можно здесь поисковая система

  © Mental Computing 2010
изменено 04-Jun-10