"переводится" в текст с последующим исправлением ошибок распознавания.
При массовом наборе однотипных документов используются электронные формы,
которые обеспечивают структуризацию документа путем выделения частей текста и добавления
полей (атрибутов), что позволяет упростить заполнение документов и выполнить необходимые
вычисления. Информация в офис поступает и путем импорта файлов с магнитных
носителей или по внешним телекоммуникациям (факсы, сообщения электронной почты и т.п.).
Внесение данных сопровождается классификацией документов путем задания атрибутов и
ключевых слов, аннотированием их содержания. При этом для ускорения последующего контекстного
поиска производится полнотекстовое индексирование документов.
Важное значение для организации эффективного управления неструктурированными документами
имеют методы хранения информации, навигации, поиска и фильтрации документов.(Табл.1)
Методы хранения информации, навигации, поиска и фильтрации документов | ||
Файловая система | Каталоги и папки | По именам и параметрам файлов |
Почтовые ящики | Личные и коллективные папки | По атрибутам и тексту сообщения |
База документов (Lotus Notes) | Страницы, базы документов и категории | По атрибутам и тексту сообщения |
Библиотеки документов | Проекты(папки) | По атрибутам, ключевым словам и тексту |
Гипертекст | Гиперссылки | По гипертексту |
Текстовая база данных | Таблицы и представления | По атрибутам и тексту |
Универсальная база данных | Таблицы и представления | По атрибутам и бинарным объектам |
Документы могут храниться просто в файловой системе, и при этом система
каталогов служит средством группирования и навигации в хранилище документов. В
современных ОС типа Windows 95 реализованы функции задания длинных имен каталогов и файлов в
качестве названий папок и документов.
Ряд систем, основанных на электронной почте, хранят документы в почтовых ящиках в
виде сообщений с присоединенными файлами.