Интеграция с внешними ИС. Адресный реестр города Новокузнецка

Аватар пользователя Переверзева Елена
Переверзева Елена

На сегодняшний день в насыщенном информационными технологиями мире все более актуальным становится не просто создание информационной системы, а интеграция уже существующих в единый «живой организм». В большинстве случаев, это действительно необходимо для обычных пользователей, для которых переход на новую систему всегда очень болезнен. Интеграция систем позволяет одной части сотрудников работать так как они привыкли, другой – использовать необходимые им данные в своей работе, не прибегая к дополнительным трудоемким процедурам (поиск и копирование информации из разных источников для сведения в один).

Наиболее распространенной ситуацией является разрозненность данных: ведут их одни люди, а используют в своей работе совершенно другие. Именно с такой проблемой мы столкнулись в г. Новокузнецке. В процессе повседневной работы специалисты Комитета градостроительства и земельных ресурсов сталкивались с проблемой неактуальности данных. Зачастую, данные, используемые в работе, бывают неточны либо имеют ряд ошибок, мешающих работе с ними. Особенно остро эта проблема наблюдалась при работе с адресным реестром объектов капитального строительства. В Новокузнецке ведением адресного реестра, т.е. присвоением названий улицам и номеров домам, занимается муниципальное предприятие города «Центр градостроительства и землеустройства» (согласно постановлению от 25 апреля 2008 г. № 29 «Об утверждении положения о создании автоматизированной информационной системы «Адресный реестр города Новокузнецка» и порядке ведения единого адресного реестра объектов капитального строительства»). Наш заказчик – Комитет градостроительства и земельных ресурсов (далее – Комитет) получал эти данные путем разовой их выгрузки в tab файлы, при этом данные в информационно-аналитической системе управления градостроительным развитием территории – ИАС УГРТ (в которой ведется реестр земельных участков, ИСОГД, проекты документов) не актуализировались, что мешало процессу оказания муниципальных услуг и работе структурных подразделений Комитета в целом.  В связи с этим было принято решение интегрировать систему «Адресный реестр города Новокузнецка» и «ИАС УГРТ г. Новокузнецка» посредством разработки и внедрения модуля импорта объектов адресного реестра.

В процессе реализации механизма получения данных адресного реестра нами был разработан модуль импорта данных напрямую между ORACLE-базами. Для переноса данных использовалась технология DBLINK, работающая внутри специально созданной для этих целей VPN-сети. Предоставление исходных данных осуществляется через View таблицы.

Процесс работы модуля строится следующим образом: сначала производится полный перенос исходной информации на специальную схему на сервере заказчика (с целью минимизации времени доступа по внешнему VPN, рисков перебоя связи и нагрузки на сервер источника), после чего производится анализ полученных данных, приведение их к единому формату и обновление адресного реестра.

Так как чаще всего исходные данные в источнике заполнялись пользователями в полусвободной форме, а исходное программное обеспечение (далее – ПО) не проводило контроля корректности исходных данных в процессе их получения, мы столкнулись с задачей структуризации данных в нашей системе. Для приведения данных к единому формату нами были разработаны фильтры, которые выявляли отклонения от корректного заполнения каждого поля. После анализа результатов работы фильтров нами были определены требования к формату получаемых данных, а также разработаны процедуры приведения этих данных к структуре нашей системы. Выявление некорректно заполненных данных – это процесс, который занял достаточно длительное время и после реализации модуля импорта объектов адресного реестра.

Так же в процессе получения исходной информации из разных источников и при внесении их в базу данных мы столкнулись с проблемой их разнородности. Идентичность объектов, полученных из разных источников, далеко не всегда прослеживалась. Из-за искажений и различия в заполнении данных автоматизированные методы распознавания объектов зачастую воспринимали один объект, полученный из двух или более источников, как различные объекты и наоборот. При отсутствии единого формата для решения проблемы нам пришлось пойти на компромисс, разработав алгоритм, который был наиболее эффективным для процесса распознавания объектов. Данный алгоритм имел некоторую погрешность, влекущую к возникновению некоторого количества ошибок. С этой погрешностью временно пришлось смириться, пока со временем исходные данные полностью не заменят уже существующие и весь набор сформирует базу данных, полученных из Комитета, сведя уровень ошибки на ноль.

Во всех проектах одной из наиболее трудоемких стадий является анализ исходных данных и создание согласованной структуры данных – этот проект не стал исключением. Однако, именно благодаря созданному в рамках проекта модулю интеграции, мы помогли Комитету исключить в работе следующие проблемы:

1. разрозненность данных в существующей БД;

2. приведение данных к единому формату при получении от различных источников и размещении в БД.

Сейчас модуль находится в режиме тестовой эксплуатации, которая позволит выявить «узкие места» разработанных алгоритмов для последующего их улучшения, а также даст возможность пользователям оценить работу модуля и качество получаемых данных.

Авторы статьи: Переверзева Елена, Благодарев Денис

Комментарии

Отправить комментарий

Содержимое этого поля является приватным и не будет отображаться публично.
АНТИСПАМ
Этот вопрос задается для того, чтобы выяснить, являетесь ли вы человеком или представляете из себя автоматическую спам-рассылку.
X
Вы можете войти с зарегистрированным именем пользователя или вашим e-mail адресом.
Пароль чувствителен к регистру.
Загрузка