Персональная поисковая система и каталогизатор

Краткое описание

Внешний вид главного окна

Основные возможности

Совместная работа с утилитой φaind

Встроенный поисковый движок

 

Версии

Конфигурация

Настройка морфологического анализатора

Подключенные модули расширения

Интеграция с файловыми менеджерами

 

Скриншоты

 

Область поиска

Встроенный сетевой сканер

Индексирование и каталогизатор

       Индексирование документов

       Каталогизатор

Быстрый файловый поиск

Запросы

Кодировки текста, языки, локализация

Авторубрикатор

 

Примеры поиска

   Логические операторы в запросах

   Расширенные грамматические возможности

   Поиск на веб-серверах

Краткое описание

Это персональная поисковая система для поиска текста в документах разных форматов на персональном компьютере, в локальной сети, а также на веб-сайтах и FTP-серверах (при поиске на сайтах используется встроенный паук), а также каталогизатор дисков и других источников документов. Она предназначена для повседневного использования обычными пользователями (в отличие от консольной поисковой утилиты φaind, предназначенной скорее для администраторов и разработчиков программных систем). Для этого мы разработали простой графический интерфейс, напоминающий панель обычных интернет-поисковиков, а также предусмотрели автоматическую настройку параметров поиска после установки программы. 

Выдаваемые поисковой системой результаты - список файлов, в которых был найден заданный образец текста (паттерн запроса), также напоминают страницу результатов многих поисковых систем Интернета (см. скриншоты):

результаты поиска

Вместе с этим, поисковая система позволяет при желании настраивать достаточно много параметров поиска и индексирования, если параметры по умолчанию по каким-либо причинам не устраивают. В качестве примера можно привести кодировки текста, которые для некоторых форматов файлов подбираются программой с переменным успехом, так что пользователю может понадобится возможность задания кодировки.

Кроме собственно поиска файлов в программе есть простой в использовании каталогизатор дисков (а также веб-сайтов и ресурсов локальной сети).

Отличительной особенностью является встроенная мощная грамматическая машина, которая поддерживает специфические особенности русского языка. Например, для запроса "искривление пространства" будут также найдены документы с текстом "пространственное искривление", "искривляющий пространство" и д.р., а для запроса "стричь" будут найдены документы со словами "стрижка", "подстригать", "подстригавшийся".

Основой данной поисковой утилиты служит движок φaind, об основных возможностях которого можно прочитать здесь. Впрочем, некоторые возможности, которые реализованы в поисковом движке φaind, отсутствуют в программе Integra по той причине, что их использование вряд ли понадобится в обыденной практике. Если Вам все-таки нужны тонкие инструменты для выполнения серьезной работы, связанной с поиском текста и извлечением знаний, то хорошим выбором будет использование поисковой утилиты φaind, которую можно бесплатно скачать нашего сайта. Она работает в командной строке MS Windows и может функционировать как составная часть сложных скриптов (batch-файлов), формировать результаты поиска в нескольких форматах и размещать их в SQL базе данных. Если Вы являетесь разработчиком и Вам необходим поисковый сервис в своей программе, то рекомендуем посетить раздел для разработчиков.

Поиск документов - кратко

Если не вдаваться в тонкости, для поиска файлов нужно определиться с двумя вещами: 1) по каким словам искать, 2) в каких файлах искать. Первый пункт плана также называется паттерном запроса. Второй пункт - область поиска.

Внешний вид главного окна

Обычный вид главного окна поисковой системы после установки:

главное окно поисковой системы

 

Это так называемый компактный режим. Можно переключиться в режим с множеством окон:

интерфейс поисковой системы с множеством окон


Другой режим - интеграция в системную панель задач Windows, порядок включения которого описан здесь:

интеграция поисковика в панель задач

Вы можете менять режим внешнего вида программы в любой момент (потребуется только перезапуск программы) с помощью диалогового окна конфигурирования.

Основные возможности

Список реализованных в текущей версии возможностей приведен здесь. Следует заметить, что все богатство опций управления поисковым движком φaind в программе Integra недоступно в явном виде - чтобы не создавать проблем неопытному пользователю.

Два основных режима работы поисковой системы -

1. поиск с предварительным индексированием и

2. поиск без индексирования.

Выбор одного из этих режимов зависит от конкретной ситуации: главным образом, для многократного поиска по неизменной группе документов (типичный пример - файлы на компакт диске) лучше подходит предварительное индексирование, поскольку в этом случае повторный поиск по ключевым словам происходит существенно быстрее. Если же необходим разовый поиск, то создание индекса будет лишь потерей времени (и места на диске). Второй вариант охватывает также такие случаи, как поиск по часто изменяющимся веб-сайтам, индексирование содержимого которых также может быть нерациональным. Другой случай - необходимость быстро найти документ среди, к примеру, группы Excel'евских и Word'овых файлов на расшаренном сетевом ресурсе или на компакт-диске.

Индексирование коллекции компакт-дисков, осуществляемое каталогизатором, позволяет работать с очень большими объемами данных, находящимися на всевозможных сменных носителях:

каталогизатор

Встроенный индексатор хранит информацию на диске в собственном формате и не нуждается в каких-либо системах управления базами данных. Он умеет создавать оптимизированные индексы как для неменяющихся файлов, например компакт-дисков и DVD (см. пример), так и для меняющихся документов, например на локальном жестком диске или ресурсе локальной сети (см. пример). В последнем случае поисковик может автоматически отслеживать изменения в соответствующих каталогах и обновлять индексы без команды пользователя, во время простоя системы.

Где скачать поисковую систему и SDK

Скачать SDK поисковой системы с примерами и другие компоненты можно здесь поисковая система

  © Mental Computing 2010
изменено 04-Jun-10