Заказчики: Большой театр Москва; Индустрия развлечений, досуг, спорт Подрядчики: Abbyy Россия, Камис Продукт: ContentReader PDF (ранее ABBYY FineReader PDF)На базе: ABBYY FineReader Engine Дата проекта: 2016/03 — 2020/05
|
Технология: Офисные приложения
|
2020: Оцифровка истории Большого театра
Большой театр и компания ABBYY (при участии КАМИС) завершили масштабный волонтерский проект «Открой историю Большого» (openbolshoi.ru). Искусственный интеллект ABBYY и более 7800 волонтеров помогли оцифровать, извлечь и систематизировать информацию из 48 000 афиш, 120 000 программок и 100 000 фотографий коллекции музея Большого театра. Об этом ABBYY сообщила 10 июня 2020 года. Ценные данные уже загружены в электронную базу музея Большого театра, разработанную компанией КАМИС. Сотрудникам музея предстоит проанализировать весь массив данных и опубликовать на сайте электронного архива театра, чтобы информация стала доступна каждому.
Целью проекта «Открой историю Большого» было оцифровать и упорядочить информацию из коллекции бумажных программок и фотографий для электронной базы данных театра. Сначала все исторические документы были отсканированы и распознаны программой ABBYY FineReader. Затем интеллектуальные технологии ABBYY извлекли из документов данные: названия спектаклей, имена артистов, дирижеров и пр.
Своим успехом проект обязан волонтерам. «Открой историю Большого» объединил неравнодушных людей из более 60 стран мира: США, Австралии, Бразилии, Индии, Китая, многих стран Европы и, конечно, России. Именно они тщательно проверяли и дополняли информацию на каждом этапе проекта, чтобы исключить возможные ошибки и максимально приблизить электронные версии документов к оригиналу. Также волонтерам был полностью отдан третий этап проекта – рубрикация исторических фотографий. Участники внесли в электронную базу рукописные тексты, написанные на оборотах изображений. Благодаря усилиям волонтеров, люди со всего мира смогут увидеть самые яркие моменты выступлений Майи Плисецкой, Галины Улановой, Федора Шаляпина и еще более 5 тыс. артистов театра.
В заключительной части проекта специалисты ABBYY систематизировали данные в соответствии с требованиями сотрудников музея. Они настроили автоматический перевод текстов с дореволюционной орфографией на современный русский язык, заполнили пропущенные поля, исправили опечатки, привели цифры и тексты к единому формату. Вся информация из архивов театра о 54 тысячах спектаклей и 75 тысячах персон была загружена в базу данных, разработанную компанией КАМИС. По мере проверки специалистами музея Большого театра, данные публикуются на специально разработанном поисковом разделе театрального сайта.
Проделана огромная работа, которую едва ли удалось бы осуществить в столь сжатый срок без современных технологических разработок компании ABBYY и без человеческого фактора – без любви к Большому театру тысяч волонтеров из самых разных стран, – отмечает Владимир Урин, генеральный директор Большого театра. – В эти летние дни, когда мир как будто замер, и Большой театр вынуждено не показывает спектакли уже несколько месяцев, мне особенно приятно поблагодарить наших партнёров – компанию ABBYY и наших верных зрителей, потративших три года на то, чтобы осуществить проект по оцифровке архивов Большого театра. Тысячи фотографий, афиш, ежедневных программ наших спектаклей в самое ближайшее время станут доступными не только специалистам, историкам театра, которые приходят работать в музей. |
ABBYY создает технологии искусственного интеллекта, которые помогают превращать разрозненные данные в полезную информацию. Мы особенно ценим проекты, в которых компания не только решает повседневные задачи людей, но и помогает расширять кругозор, сохранять культуру и историю страны, получать вдохновение и идеи для работы и жизни. Проектов, подобных «Открой историю Большого», в мире пока немного. Но я уверен, что с развитием технологий обработки естественного языка мы сможем решать все более сложные и масштабные задачи в разных странах мира, – комментирует Дмитрий Шушкин, генеральный директор ABBYY Россия. |
Команда ABBYY и волонтеров проделала огромную и очень важную работу. Были отсканированы несколько тысяч программ спектаклей Большого театра с 1901 года, а затем обработаны таким образом, что на июнь 2020 года мы можем среди тысяч образов найти нужную программку любого спектакля и концерта, проходящих на нашей сцене, посмотреть, когда и с какими партнерами выступал тот или иной артист, какие дирижеры, режиссеры, художники участвовали в постановке спектаклей. Кроме программок были обработаны и несколько тысяч афиш спектаклей, отсканированных ранее, причем временной промежуток здесь был еще больше: с 1858 года, – говорит Лидия Харина, директор музея Большого театра. – Это огромный и очень интересный архив, который теперь доступен в электронном виде. Им активно пользуются все сотрудники Музея и Большого театра, а также исследователи, приходящие к нам работать. Мы надеемся, что вскоре он будет доступен и широкой аудитории, сотрудники Музея проверяют весь массив внесенной информации, систематизируют его определенным образом, добавляют иллюстративный материал. |
В ходе проекта «Открой историю Большого» волонтеры помогли собрать интересную статистику об истории главного театра страны. Так, в XIX веке на сцене около 450 раз ставили оперу «Жизнь за царя». В ХХ веке почти 60 лет одной из наиболее популярных постановок театра оставалась опера «Евгений Онегин». Неподражаемая Майя Плисецкая исполняла роли Одетты и Одиллии в балете «Лебединое озеро» 175 раз, а знаменитый лирический тенор Леонид Собинов пел арию Ленского не менее 86 раз. Были и другие находки, связанные с жизнью театра и его зрителей. Например, участники обнаружили на страницах программок необычные постановки, такие как опера, написанная императрицей Екатериной II, водевиль, переведенный поэтом Николаем Некрасовым, экспериментальные балеты 30-х годов XX века. В программках публиковали не только информацию об артистах, но и рекламу и даже объявления о забытых вещах. Метавселенная ВДНХ
2016
Задачи: Сделать доступному каждому историческое наследие Большого театра.
Результат: Создание уникального электронного архива с информацией из 48 000 афиш, 120 000 программок и более 100 000 фотографий.
Сроки проекта: Март-Сентябрь 2016