и коллективного пользования. Однако их
Навигация упрощается
с помощью папок личного и коллективного пользования. Однако их поиск и фильтрация ограничены
лишь отбором и сортировкой по атрибутам
и тексту .
Специфический метод хранения реализован в пакете Lotus Notes в виде так называемой базы
документов, в состав которой входит как однотипная, так и разнотипная информация,
сохраняемая в одном файле. Документы допускают внутреннюю структуризацию на основе
формуляров путем выделения и добавления в них полей. Навигацию в базе
упрощает наличие страниц и категорий.
Многие современные системы в дополнение к файловой
системе используют библиотеки документов, содержащие в БД их карточки с
атрибутами и ключевыми словами.
Поиск и фильтрация производится по запросам на основе контекстного
поиска: по атрибутам, по ключевым словам и по полному содержанию текста на основе
индекса(Рис.2).
Рис.2. Классификация методов информационного поиска.
При использовании механизма четкого поиска (например, DOCS OPEN) в запросе
не должно быть орфографических ошибок, а в тексте документа - неточностей распознавания.
Морфологический разбор позволяет упростить формирование запросов и улучшить отбор информации.
Реализация на основе нейронных сетей и искусственного интеллекта технологии
нечеткого поиска по полному содержанию документа (например, технология адаптивного
распознавания образов APRP в пакете Excalibur EFS) не требует идентичности искомых фраз содержимому
файла и, кроме того, исключает потребность в
исправлении ошибок после распознавания текста.Результаты выборки при этом наилучшим
образом согласованы с терминами или фразами запроса пользователя.
Фирмы-производители реляционных СУБД (в частности ORACLE) проповедуют другие схемы
хранения - текстовые и универсальные базы данных (БД). При этом тексты документов
располагаются в символьных
полях переменной длины,а расширенные средства SQL-поиска формируют
смешанные запросы. Для хранения произвольной информации, в том числе
мультимедиа, используются поля бинарных объектов большой длины BLOB и/или
Содержание Назад Вперед