Никаких фокусов!
Задача организации удобного хранения документов кажется простой, и действительно до какого-то момента можно обойтись простым файл-сервером. Но наступает час «икс» и вы понимаете, что складывать документы в папку на сервере уже не выход: нужные файлы всё сложнее находить, они теряются или удаляются по ошибке, а администрирование доступа превращается в нетривиальную задачу. Хранилище вашего контента все больше напоминает «свалку», в которой полно устаревших документов, хаос и анархия. Но придуман отдельный класс программного обеспечения — системы управления корпоративным контентом. Электронные архивы — одно из направлений развития таких систем.
Штрихкоды на каждый документ
Первый шаг к порядку — организация системы идентификации документов. Каждый документ должен иметь уникальный идентификатор. Обычно это число или комбинация букв и цифр. Дополнительной смысловой нагрузки такие идентификаторы обычно не ненесут, максимум, что стоит сделать — придумать какой-нибудь уникальный префикс, который позволит автоматически выполнять проверку «свой-чужой». Идентификатор должен явно присутствовать на документе, обычно на первой странице. Чтобы обеспечить его автоматический поиск и считывание используются штрихкоды. Штрихкод — это графический образ идентификатора в виде черточек и квадратиков.
Иногда их потребуется распечатать
Штрихкоды могут внедряться в документы еще на стадии их подготовки в системе электронного документооборота или учетной системе (например, 1С). На входящие документы придется наклеивать готовые этикетки со штрихкодами, которые заранее распечатываются в типографии или по месту с помощью этикеточных принтеров. Также такие принтеры позволят оперативно распечатать дубликат штрихкодовой этикетки, что может понадобиться в случае замены устаревшего документа его актуальной версией. Такая замена в наших электронных архивах автоматизирована.
Только качественные быстрые сканеры
Мы поможем подобрать правильные сканеры. От их скорости и наличия дополнительных функций зависит удобство и качество работы сотрудников, отвечающих за наполнение электронного архива. Например, есть сканеры, обнаруживающие захват двух «слипшихся» страниц. Это удобно.
Очень важно передать на обработку в электронный архив максимально качественный скан-образ. От этого зависит будет ли найден и распознан штрихкод-идентификатор, выполнится ли автоматическая ориентация страниц и надлежащим ли образом распознается текст документа.
Очень важно передать на обработку в электронный архив максимально качественный скан-образ. От этого зависит будет ли найден и распознан штрихкод-идентификатор, выполнится ли автоматическая ориентация страниц и надлежащим ли образом распознается текст документа.
Распознавание на грани фантастики
Электронный архив автоматизирует всё, что только можно. Предположим, что было отсканировано несколько документов одной стопкой. Вот, что происходит, когда файл с несколькими документами внутри поступает в электронный архив:
- программа распознавания постранично обрабатывает поступивший файл, выполняется автоориентация, устранение перекосов и шумов;
- если на странице найдены штрихкоды, то они проверяются на «свой-чужой»;
- если какой-то из штрихкодов определен как «свой», то программа понимает, что начался новый документ, другими словами происходит формирование набора файлов по принципу «один документ — один файл»;
- весь текст документов автоматически распознается, это позволит в будущем выполнять полнотекстовый поиск;
- при необходимости документ передается на автоматизированное атрибутирование, в рамках которого оператор может проверить сформированный документ и присвоить ему дополнительные атрибуты;
- в завершение файл автоматически передается в подсистему хранения, но это только первая часть Мерлезонского балета...
Надежное структурированное хранение
Файл скан-образа поступает в подсистему хранения электронного архива. До того, как он станет доступен конечным пользователям, ему предстоит долгий путь. Минуты на полторы-две. За это время:
- его атрибутивная карточка заполняется данными, которые по специальному запросу передаст в электронный архив учетная система (или СЭД);
- устанавливается связь с «родительским» документом и справочниками системы;
- выполняются различные проверочные и контрольные обработки;
- файл автоматически маршрутизируется в так называемую «целевую библиотеку», где он размещается в соответствующем наборе* документов;
- на файл выдаются права доступа и он становится виден пользователям архива.
Быстрый и удобный поиск документов
Для того, чтобы найти документ на файл-сервере, надо или помнить, где он лежит, или помнить название файла, которое, остается надеяться, когда-то было дано ему осмысленно.
В электронном архиве все проще. У каждого файла есть штрихкод и атрибутивная карточка со множеством параметров. Поэтому существует множество вариантов поиска документов в архиве:
В электронном архиве все проще. У каждого файла есть штрихкод и атрибутивная карточка со множеством параметров. Поэтому существует множество вариантов поиска документов в архиве:
- по любому сочетанию атрибутов;
- по штрихкоду (именно так получают файл смежные информационные системы);
- по содержимому самого документа.
Удовольствие от использования
По каждому документу в электронном архиве ведется история изменений (журнал версий).
Между документами автоматически устанавливаются информационные связи: можно «потянуть» за один документ и вытащить все связанные с ним файлы.
Можно передать в архив перечень штрихкодов и получить на выходе подборку найденных файлов и Excel-реестр с атрибутами.
Новые структуры хранения создаются на лету, добавление нового атрибута в карточку в связи с изменением бизнес-требований — минута, поиск документа — секунды!
Между документами автоматически устанавливаются информационные связи: можно «потянуть» за один документ и вытащить все связанные с ним файлы.
Можно передать в архив перечень штрихкодов и получить на выходе подборку найденных файлов и Excel-реестр с атрибутами.
Новые структуры хранения создаются на лету, добавление нового атрибута в карточку в связи с изменением бизнес-требований — минута, поиск документа — секунды!