Поисковая система: варианты запросов

Ввод паттернов запроса

Паттерн запроса это, упрощенно говоря, группа слов, которые нужно найти.

Поисковик Интегра поддерживает все виды паттернов запросов, которые понимает поисковая утилита φaind, так как используется один и тот же исходный код поискового движка (см. о встроенном поисковом движке). Для удобства пользователя выделены 3 вида паттернов:

Образец текста для поиска можно вводить непосредственно в поле главного окна программы:

ввод паттерна поискового запроса

Нажатие Enter запускает поиск, что обычно является наиболее удобным режимом.

Кроме этого, программа запоминает последние введенные запросы, и Вы можете выбрать образец из выпадающего списка (истории запросов).

Обратите внимание, что можно вводить любые Unicode-символы - для отсутствующих в раскладке клавиатуры проще всего воспользоваться стандартной утилитой charmap (см. технические детали работы с юникодом в поисковом движке):

паттерн поискового запроса с диакритическими значками

Справа от поля ввода текста есть кнопка, которая вызывает на экран форму для ввода дополнительных параметров паттерна запроса (см. ниже подробное описание).

Умолчания

После инсталляции поисковая система в зависимости от наличия установленного словаря активизирует следующие умолчания для параметров паттерна:

1. Если словарь не установлен. Поисковая система будет имитировать работу морфологического анализатора через регулярные выражения. К вводимым словам запроса автоматически будут добавляться суффиксы .* , которые позволяют для английского (и некоторых других) языка находить большинство словоформ.

2. Если словарь установлен. Активизируется использование морфологического анализатора.

Кроме того, для любого из вариантов установки по умолчанию устанавливается режим поиска группы слов в границах одного предложения (это соответствует команде -distance=s поискового движка).

Для ускорения поиска по индексу по умолчанию поисковик не будет отображать фрагменты текста, в которых найдены искомые слова, только имена соответствующих файлов.

Вы можете переопределить все эти умолчания. Для этого откройте диалог задания дополнительных параметров поиска, установите все нужные параметры и нажмите кнопку "Умолчания":

задание значений по умолчанию для паттерна запроса

Логические операторы

Вы можете использовать обычные логические операторы и группировать выражения круглыми скобочками:

Для обозначения основных логических операций используются английские слова: AND - "и", OR - "или", AND - "не".

Примеры использования логических операторов в запросах см. здесь.

 

Группа слов

Это вариант принимается по умолчанию, если установлен морфологический анализатор. Соответствует опции -sample поискового движка (см. описание паттерна запроса). Обрабатываемый текст разбирается на отдельные слова и происходит сопоставление введенных в поле паттерна слов и имеющихся.

По умолчанию слова должны размещаться в пределах одного предложения, но можно ввести величину расстояния (в словах).

Если отметить флаг "словоформы", то для поиска загружается словарь и выполняется сопоставление базовых форм слов, что позволяет искать слова независимо от их грамматической формы (см. описание опции -wordforms в поисковом движке).

 

Группа регулярных выражений

Соответствует двум опциям -rx -sample в поисковом движке (см. описание паттерна запроса).

Обрабатываемый текст разбивается на слова, и выполняется их сопоставление с введенными регулярными выражениями. Это позволяет искать всевозможные грамматические формы слов, отсутствующие в словаре, а также выполнять поиск похожих на заданное слов.

Данный вид паттерна допускает использование упрощенного синтаксиса. Если Вы зададите поиск ключевых слов "спирал галакт", то поисковик будет автоматически рассматривать фактически как "спирал(.*) галакт(.*)", то есть найдет все фразы, в которых присутствуют данные фрагменты слов. Таким способом имитируется работа морфологического анализатора, если словарь не установлен.

Данный вид запросов нормально работает при поиске по индексу, хотя и намного медленнее, чем основной тип запросов.

Строка-регулярное выражение

Используется опция -regex поискового движка. Синтаксис регулярных выражений описан здесь. Каждый обрабатываемый файл рассматривается как одна строка, разбивка на слова не производится.

Данный тип запроса не совместим с индексным поиском, так как в индексе документы хранятся (если опустить детали) в раздробленном на слова виде.

Связь с API поискового движка

Все параметры, заданные пользователем на форме запроса, преобразуются в команды поискового движка, полное описание которых можно найти в соответствующем разделе технической документации.

Где скачать поисковую систему и SDK

Скачать SDK поисковой системы с примерами и другие компоненты можно здесь поисковая система

  © Mental Computing 2010
изменено 04-Jun-10