Быстрый поиск информации и ее консолидация из различных источников позволяет решать многочисленные проблемы, стоящие перед предприятиями, обладающими гигантскими объемами данных. И поисковые технологии, на основе которых создаются корпоративные системы обработки и поиска информации не стоят на месте, развиваясь быстрыми темпами. Прямой поиск уже давно уступил дорогу поиску с предварительной индексацией. Простейшие фразовые запросы тоже остались в прошлом – в чести учет морфологии, синонимов, важных слов и прочих «опциональных атрибутов».
На горизонте маячит «персонализированный поиск» от Google и полная интеграция программ-поисковиков с WWW. Но это больше относится к сфере Интернета. А уже сейчас фразовый поиск дополняется поиском документов похожих по содержанию и смыслу, что дает возможность сократить поисковую сессию до минимума и значительно упрощает сам процесс получения нужного пользователю результата. Для корпоративного сектора важна скорость работы, адекватность и четкое понимание того, какие именно плюсы даст развертываемая на предприятии система и какие проблемы позволит решать новая технология.
Быстрый поиск. Фразовый поиск далеко не всегда решает проблему быстрого поиска требуемой информации. Сказываются временные затраты на подбор правильных ключевых слов и на просмотр ненужных документов в результирующем списке. Уменьшить время поиска можно. И одним из вариантов [самым действенным] является использование поиска документов похожих по содержанию. Это позволяет сократить время поисковой сессии до минимума и дает точные, адекватные результаты.
Размытость информационного наполнения. В информационной системе предприятия могут находиться документы из различных источников, содержащие похожую или идентичную информацию. Один и тот же текст может быть с разными заголовками, с небольшими изменениями или дополнениями, что вносит определенную путаницу при его использовании. Существующие технологии поиска похожих по содержанию документов решают и эту проблему путем сравнения поступающих в базу предприятия документов с уже содержащимися там данными и выявления дублей.
Различные источники информации. Информация на предприятии содержится как на дисках компьютеров, подключенных к локальной сети, так и в базах данных и различных информационных системах. Это создает определенную проблему их поиска – в различных источниках и различными программными средствами. На данный момент технологии поиска позволяют консолидировать информацию из различных источников, что дает возможность структурировать информационные составляющие любого крупного предприятия под управлением одной поисковой системы без нужды переводить документы и данные в какой-либо единый формат.
Отчет похожести документов. Достаточно распространенное явление – содержащиеся в информационной базе предприятия дублирующие друг друга документы из различных источников или внесенные разными людьми. Технологии поиска похожих документов позволяют определить дубли при помощи построения анализа похожести. Такая полезная функция дает возможность выделить повторяющиеся документы и удалить их из базы без потери нужной информации.
SoftInform Search Technology. Все эти, а также множество других проблем позволяет решать технология поиска SoftInform Search Technology от компании СофтИнформ. Она включает в себя все инструменты, необходимые для структуризации разрозненной информации в рамках предприятия и предоставляет собой эффективное решение любых проблем поиска и консолидации информации.
Основным преимуществом и отличием SoftInform Search Technology от существующих аналогичных технологий и систем поиска является запатентованная компанией СофтИнформ функция поиска документов, похожих по содержанию на текст запроса. Именно эта уникальная возможность технологии СофтИнформ и позволяет наиболее эффективно решать большинство проблем обработки и поиска информации на предприятии.
С помощью SoftInform Search Technology в считанные доли секунды можно найти любой документ, расположенный на жестком диске компьютера, в базе данных или в информационной системе предприятия. Высокая скорость индексирования (до 6 Гб/час), малый размер индекса (15-20% от реального объема текстовой информации), поддержка практически всех распространенных форматов текстовых файлов (включая .pdf и .html) и корректная работа с архивами делают SoftInform Search Technology незаменимым инструментом поиска информации.
Системы на базе SoftInform Search Technology легко интегрируются в информационную структуру предприятия, подключая различные источники данных, и имеют архитектуру клиент-сервер. Внедрение таких систем не требует изменения существующих бизнес-процессов и позволяет максимально сохранить инвестиции компании, вложенные в существующую информационную инфраструктуру. В тоже время поисковые системы от СофтИнформ позволяют объединить разрозненные корпоративные приложения и данные в единую информационную систему, что приводит к более эффективному решению бизнес-задач.