ИСОГД города Тюмени. Решение задачи инвентаризации и внесения сведений

Аватар пользователя Власов Алексей
Власов Алексей

В рамках выполнения комплексного проекта г. Тюмени были обработаны и размещены в информационной системе значительные объемы документов и пространственных данных. Данная статья дает обзор этой непростой, но интересной работы, а также содержит рассказ о сложностях, с которыми мы сталкивались и о том, как мы их преодолевали.

В г. Тюмени уже долгое время ИСОГД ведется в автоматизированном режиме на основе базы данных Oracle. В систему вносятся не только сведения, но и сами отсканированные изображения документов.

На начало данной работы имелась инвентаризационная опись части документов, подлежащих размещению в ИСОГД. Сами данные хранились в бумажных папках, сгруппированных по отдельным объектам строительства, а также по этапам появления в архиве градостроительных документов: папки «Разрешения на строительство», папки «Разрешения на ввод объекта в эксплуатацию», папки «Градостроительные планы земельных участков». В каждой папке, помимо этих типов документов, содержались прочие документы, которые были переданы в комплекте с данными документами. Также часть документов более раннего периода была передана из других архивов и хранилась в иной структуре папок. В общем случае каждая папка представляла собой некоторое пообъектное дело.

Таким образом, с одной стороны, бумажный архив был аккуратно структурирован, с другой стороны – различные периоды времени были представлены различными группами папок, что существенно затрудняло создание единообразных алгоритмов их обработки.

На начало выполнения работ перед нами стояли следующие задачи:

  • Определить перечень документов, подлежащих размещению в ИСОГД из числа хранящихся в пообъектных делах.
  • Выявить группировку документов по земельным участкам, для группировки их по книгам хранения 8 раздела ИСОГД.
  • Отсканировать документы.
  • Зарегистрировать отсканированные документы в 8 разделе ИСОГД, заполнив атрибутивные поля и установив связи между объектами.
  • Проверить качество выполнения работ перед сдачей заказчику.

Оцифровка и первичная обработка

После изучения был выбран вариант совмещения задачи определения перечня документов для размещения в ИСОГД (из папки пообъектного дела) со сканированием, т.е. это выполняли не два различных специалиста, а один человек.

Для выдерживания сроков работы было одновременно задействовано около 10 человек, работа сначала велась 5 дней в неделю, а затем и по субботам.

Для всех участников процесса была создана единая инструкция с алгоритмом для определения всех типов документов, но на 100% с этой задачей нам справится не удалось, т.к. по мере обработки папок мы сталкивались с документами, про которым нельзя было однозначно решить, размещать их или нет. Правило «80/20» здесь выполнялось в полной мере, т.е. мы знали, что делать примерно с 80% документов и делали это очень быстро (около 20% времени), а вот остальные 20% документов тратили остальные наши силы и время. Постоянная корректировки инструкции и инструктаж исполнителей занимали на первых порах много времени (и это было очень важно – обеспечить обработку всех документов исполнителей по единым правилам).

В итоге компромиссным решением стало выделение одного наиболее квалифицированного специалиста как ответственного за решение вопроса со «сложными» документами, он же консультировал всех остальных специалистов, принимал решения, а в сложных ситуациях согласовывал решения с представителями заказчика.

Основными сложностями при выполнении оцифровки (сканирования) бумажных документов были:

  • Наличие документов со сшитыми страницами (невозможно разделить на отдельные листы для быстрой обработки потоковым сканером). Такие документы обрабатывались постранично на планшетном сканере А4, что существенно замедляло темп работы. В основном, это были документы результатов экспертизы проектной документации.
  • Широкоформатные документы (А3 и более), которые возможно обработать только на широкоформатном протяжном сканере. Когда один поточный сканер оказался «узким местом» в цепочке обработки нам пришлось привезти и установить второй сканер А0.
  • Ветхость части сканируемых документов – некоторым документам в архиве уже несколько десятков лет. Эти документы сканировались с помощью вспомогательных прозрачных листов, идущих в комплекте со сканером. Обработка таких документов была самая медленная из всех. При этом до начала работ очень сложно оценить долю таких документов (не просматривая все документы, подлежащие обработке).

Это был первый этап работы «конвейера по обработке». На выходе мы имели сканы документов в формате PDF, а также связанную с ним атрибутивную информацию о том, когда, кем и из какого архивного места он был взят и отсканирован. Также исполнители выполняли первоначальную классификацию документов — по выбранным 14 типам, например, «Разрешение на строительство», «Акт приемка ОКС», «Заключение экспертизы проектной документации» и т.д.

Здесь мы столкнулись с тем, что при наличии инструкции все равно возникают риски ошибок исполнителей (человеческий фактор). Мы страховались от этого риска выборочной ручной проверкой изображений и дублированием информации при вводе. Это позволяло автоматически выявить неверно внесенные атрибуты «по горячим следам».

Регистрация и обработка сведении документов

Регистрацию документов можно разделить на два больших блока:

  1. Создание книг хранения в 8 разделе ИСОГД (для соответствующего земельного участка).
  2. Регистрация документов в ИСОГД (заполнение полей карточки) и размещение в соответствующей книге хранения.

Начнем со второго блока, т.к. в нем сложности были в основном организационные и технические. По итогам предыдущего этапа «конвейера по обработке» мы уже имели скан документа. Обычно сканирование и регистрация в ИСОГД происходит в один момент времени, но мы вынуждены были отделить сканирование, чтобы наиболее эффективно использовать время сотрудников и максимально плотно использовать сканеры на территории заказчика. Изучив текущий процесс регистрации документов в информационной системе, мы обнаружили некоторые узкие места в производительности, когда сотруднику приходится дожидаться открытия или сохранения карточек. Поэтому было приняты следующие решения:

  • Обработка сканов выполняется удаленно.
  • При обработке сведений из сканов информация вносится в промежуточную информационную систему.
  • Введенные сведения со сканов должны использоваться для автоматической регистрации документов в информационной системе заказчика.

Удаленная обработка сканов позволила нам подключить к этой работе значительное количество наших квалифицированных сотрудников в Омске и гибко управлять их загрузкой. Использование несложной промежуточной структуры в MS Access и MS Excel, позволяло работать быстро и в тоже время контролировать качество вводимых данных (т.е. мы могли выполнять контроль этих данных до выполнения их загрузки в информационную систему заказчика). Автоматическая регистрация документов (с помощью скриптов БД) позволяла исключить потери времени при работе с интерфейсом информационной системы заказчика и загрузить уже проверенные и обработанные данные в информационную систему единовременно.

Чтобы дать понять объемы данных, приведу следующий пример: при объеме в 30000 документов увеличение времени обработки одного документа в среднем на 1 секунду (!) увеличивает итоговое время на 500 минут или 8.3 человека/часа. Т.е. это целый рабочий день специалиста. А одна минута задержки выливается в 60 дней, т.е. в 3 рабочих месяца. Поэтому вопрос контроля процесса работ и его оптимизации стоял очень остро.

Также стоит отметить, что для некоторых типов документов мы извлекали дополнительные сведения для внесения их в атрибутивные поля иных объектов системы и для установления связей. В частности, из документов разрешений на строительство и разрешений на ввод извлекались характеристики зданий (строительный объем, этажность и пр.).

Слой с земельными участками

Основная часть документов помимо пространственного объекта земельного участка связывалась еще с пространственным объектом здания и пространственным объектом адресной точки.

Карточка связанной с документом геометрии

Первый блок включал в себя создание книг хранения для размещения документов. Сложности тут были в основном методологические. Здесь с одной стороны были требования законодательства о том, что книга хранения создается на отдельный земельный участок, с другой стороны, была реальность, когда в части папок отсутствовали сведения о кадастровом номере земельного участка или этих участков было несколько, например, при строительстве комплекса объектов не смежных земельных участках, или было описание и схема, не позволяющая однозначно идентифицировать местоположение участка на местности. Здесь также примерно для 90% участков мы смогли идентифицировать их по кадастровому номеру и внести в систему автоматически, а для оставшихся 10% участков мы анализировали смежные документы из книги хранения, имеющиеся у заказчика информационные слои и реестры, и по ним, подобно сыщикам, определяли, о каком участке речь и какое дело о земельном участке следует создать. Здесь нам в особо запутанных вопросах сильно помогали сотрудники заказчика, которые хорошо знали территорию и могли дать дополнительную информацию.

Карточка книги хранения (дело о земельном участке)

Таким образом, на этом этапе «конвейера обработки» мы имели всю необходимую атрибутивную информацию по каждому документу, а также структуру дел о земельных участках.

Внесение информации в систему и контроль качества

По мере обработки документов на предыдущем этапе «конвейера» мы выполняли периодические загрузки их в основную информационную систему заказчика. Для этого были разработаны инструменты, которые автоматически загружали сведения. Здесь одной из сложностей был объем сканов – порядка 50Гб, загрузка их выполнялась в вечернее время и на выходных – когда с базой данных почти никто не работал.

Карточка документа, зарегистрированного в ИСОГД

Также сложность представляло то, что мы загружали данные не в «чистую систему» – в ней уже были книги хранения и документы, и нам приходилось встраивать новые данные в имеющие наборы (в том числе по тем же периодам времени), чтобы избежать дублирования информации.

Карточка документов раздела 8 ИСОГД

Конечно такой объем информации невозможно проверить в ручном режиме в короткие сроки. Поэтому были разработаны алгоритмы проверки качества загруженных данных, которые контролировали заполнение полей, наличие связей, непротиворечивость данных – эти проверки помогли нам найти и устранить некоторые неточности, которые были допущены на предыдущих шагах в процессе ручной обработки документов. Также эти проверки позволили сформировать набор отчетов для заказчика, которые показывали как текущий статус работы, так и характеристики  работы, на основе которых принималось решение о качестве выполнения работ при их приемке.

Заключение

Это проект длился сравнительно долго, на него было потрачено много ресурсов и усилий наших специалистов. Оглядываясь назад, даже не верится, что такой объем работ удалось проделать и привести проект к завершению. О многих сложностях, с которыми нам пришлось столкнуться, мы не могли знать в начале работы, мы были вынуждены активно изучать и внедрять новые методологические, организационные и технические подходы к обработке данных ИСОГД. В итоге сейчас в ИСОГД г. Тюмени содержится самый большой объем структурированной информации не только о самих документах, но и об их смысловом содержании, связях с пространственными объектами на территории, что позволяет решать не только задачи ведения ИСОГД «в чистом виде», но и решать многие аналитические задачи и принимать взвешенные управленческие решения, связанные с управлением комплексным развитием территории как на муниципальном, так и на региональном уровнях при ведении ИСОГД Тюменской области.

Комментарии

Аватар пользователя Гость

А с каких пор в Тюмени городе стоит программная оболочка Града?
можно получить ссылки на контракт на 2014 и 2015 годы?

Аватар пользователя Дударев Алексей

В г. Тюмени мы работали с использованием уже существоавшей ИСОГД, разработчик которой осуществлял необходимые для ведения ИСОГД доработки по нашему заказу и ТЗ.
В статье отражены подходы к формированию ИСОГД, применимые для любых ИС.

Отправить комментарий

Содержимое этого поля является приватным и не будет отображаться публично.
АНТИСПАМ
Этот вопрос задается для того, чтобы выяснить, являетесь ли вы человеком или представляете из себя автоматическую спам-рассылку.
X
Вы можете войти с зарегистрированным именем пользователя или вашим e-mail адресом.
Пароль чувствителен к регистру.
Загрузка