Рассмотрим простой пример - имеется несколько дисков с текстовыми файлами, содержащими архивы компьютерного журнала. Чтобы осуществлять по ним быстрый поиск, сначала выполняем индексирование (см. подробнее об индексаторе поисковика). Последовательность действий такая.
1. Создание нового индекса для одного CD, указание опций для морфологии и дополнительного накопления статистики (чтобы выполнять ранжирование результатов поиска):

2. Кнопка CD/DVD начинает индексирование документов на диске (кнопка Далее позволяет явно указать источник документов, но в данном случае это просто потребует дополнительных манипуляций):

3. Обработка файлов на диске будет продолжаться некоторое время, которое зависит от характеристик компьютера (см. бенчмарки поискового движка). По завершении индексирования в списке доступных индексов появится только что созданный:

4. Теперь созданный индекс можно использовать для поиска документов по ключевым словам. Выполним поиск словосочетания "теория информации" (см. подробнее о параметрах паттерна запроса) по созданному индексу (компакт-диск должен быть в приводе, чтобы вывести фрагменты текста с найденными словами):

Результаты поиска (верхняя часть - список документов и фрагменты текста, в которых встретилось заданное словосочетание, нижняя часть - область быстрого просмотра выбранного документа):

Поиск заданного набора слов будет выполняться в документах наиболее распространенных форматов (см. характеристики текущей версии поисковой системы), например поиск "автоматизированные системы документооборота" обнаружит соответствующий файл формата PDF:

Скачать SDK поисковой системы с примерами и другие компоненты можно здесь 
© Mental Computing 2010
|
|
изменено 04-Jun-10 |