Проект

Санкт-Петербург повысил скорость поиска по цифровым архивам в десятки раз

Заказчики: Архивный комитет Санкт-Петербурга

Санкт-Петербург; Государственные и социальные структуры

Продукт: Искусственный интеллект (ИИ, Artificial intelligence, AI)

Дата проекта: 2023/03 — 2023/09
Технология: Big Data
подрядчики - 203
проекты - 573
системы - 227
вендоры - 185
Технология: Data Mining
подрядчики - 235
проекты - 795
системы - 276
вендоры - 194
Технология: Data Quality - Качество данных
подрядчики - 182
проекты - 964
системы - 59
вендоры - 40
Технология: Робототехника
подрядчики - 253
проекты - 485
системы - 480
вендоры - 359

2023: Повышение эффективности работы с архивными документами

Решение «Умный архив», разработанное «Санкт-Петербургским информационно-аналитическим центром», повысило эффективность работы с архивными документами. Время поиска информации сократилось в несколько раз благодаря функции автоматического распознавания текста. Нейросетевой инструмент доступен для поиска по более чем 7 млн электронных образов документов из архива города. Об этом Санкт-Петербургский информационно-аналитический центр сообщил 30 октября 2023 года.

В задачи проекта «Умный архив» по внедрению технологии искусственного интеллекта в систему хранения и обработки архивных данных, входит повышение доступности документов государственных архивов. На октябрь 2023 года на интернет-портале «Архивы Санкт-Петербурга» представлено несколько миллионов архивных документов и электронных образов. Разработчики сделали работу с порталом более удобной за счет сокращения времени на поиск нужной информации и расширения поисковых возможностей в целом.

Созданные и обученные нейросети расширили список функций портала. В него добавились возможности оптического распознавания текста, извлечения адресной информации и именованных сущностей, автоматического получение географических координат адресов с привязкой к карте. Кроме того, сервис в скором времени предоставит возможность автоматически формировать справочники, отображать рекомендованные документы и пополнять единый поисковой индекс на основе извлеченной информации.

Благодаря автоматическому распознаванию текста и возможности поиска по содержимому, пользователи могут получить необходимую информацию значительно быстрее. Например, если на просмотр документа постранично может уйти 30 минут, то решение позволяет найти информацию в 60 раз быстрее – примерно за 30 секунд.

В результате обновления платформы вырос общий уровень удовлетворенности горожан работой портала — 92% оценили работу «Архивов Санкт-Петербурга» на «хорошо» и «отлично». Объем оказываемых порталом услуг увеличился — количество пользователей выросло с 1,8 до 2,5 тыс. человек в сутки. При этом нагрузка на сотрудников архива снизилась за счет возможности посетителям самостоятельно искать данные по тексту.

В перспективе «Санкт-Петербургский информационно-аналитический центр» планирует добавить на платформу «Умный архив» возможности распознавания рукописного текста, продолжать работу по повышению качества поисковых механизмов и обучению нейросетей, внедрить рекомендательную систему на основе поведенческой модели пользователей.

«
Технологии искусственного интеллекта помогают оптимизировать работу с документами и открывают серьезные перспективы для архивной службы. Нейросети позволят нам сократить трудозатраты на некоторые виды работ, при этом сделают их быстрее человека. Теперь с помощью платформы пользователи смогут быстро находить нужные документы, используя различные поисковые запросы, — отметил Петр Тищенко, председатель Архивного комитета Санкт-Петербурга.
»