Hieroglyph

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Smart Engines (Смарт Энджинс)
Дата премьеры системы: 2018/03
Дата последнего релиза: 2019/02/27
Технологии: СЭД - Системы потокового распознавания

Hieroglyph — система искусственного интеллекта, предназначенная для распознавания любых используемых в мире удостоверяющих документов.

В основе Hieroglyph лежат собственные научные разработки компании в области зрительного интеллекта. Для решения задач детекции, классификации и распознавания большого количества типов документов в Hieroglyph применяются глубокие целочисленные нейронные сети.

Технология вычислительно эффективной зрительной памяти в Hieroglyph, в свою очередь, основана на построении для изображений компактных описаний, инвариантных к яркостным и пространственным искажениям (включая проективные) в виде векторов многомерного метрического пространства. Это особенно важно для получения высокого качества распознавания при работе с видеопотоком в мобильных приложениях при неизвестном освещении.

Реализованная в Hieroglyph технология синтеза выборок для обучения нейронных сетей позволяет добавлять распознавания новых типов документов, имея всего 2 изображения этого типа документа. Одно — для обучения системы, а второе — для проверки результата.

2019: Распознавание иероглифов Китая, Японии и Кореи

27 февраля 2019 года компания Smart Engines представила технологию распознавания иероглифов. Ее разработка стала возможна благодаря применению глубоких разреженных дискретных нейронных сетей, которые позволяют распознавать свыше 45 000 иероглифов на документах со сложным фоном и при различных условиях освещения. Из них 20 941 китайский, 12 912 японских и 11 172 корейских иероглифов.

Как сообщили в Smart Engines, представленная функциональность интегрирована в систему искусственного интеллекта Hieroglyph, которая на уровне платформы поддерживает распознавание 800+ типов удостоверяющих документов на более чем 40 языках. Это ID-карты, паспорта, водительские права, визы и другие документы более 170 стран мира. Распознавание иероглифической письменности позволило расширить потенциальную пользовательскую аудиторию продуктов Smart Engines более чем на 1,5 млрд человек.

Распознавание иероглифов является сложной научно-технической задачей, в которой разработчики искусственного интеллекта имеют дело с десятками тысяч символов, многие из которых незначительно отличаются друг от друга. В процессе разработки специалисты Smart Engines смогли преодолеть важный технологический барьер и перейти от методов классических OCR, рассчитанных на распознавание символов на белом фоне на качественных сканах, к компьютерному зрению, способному распознавать иероглифы даже в удостоверениях личности в видеопотоке и на фотографиях.

«
«К сложному устройству самих иероглифов в нашем случае добавляются визуальные помехи, вызванные наличием на изображении фона у документа, и искажения, обусловленные разной яркостью освещения и ракурсом съемки. Нам удалось создать специальную архитектуру нейронных сетей, которая обеспечивает быстродействие и качество распознавания иероглифов в документах на уровне символов латинского алфавита и кириллицы».
»

Со слов разработчика, представленная технология предназначена для использования в процессах регистрации, идентификации и верификации пользователей в мобильных приложениях и интернет-сервисах банковского сектора, страхования, финтеха, шеринговой экономики, транспорта, телекома и др. По информации на март 2019 года разработчикам доступны библиотеки распознавания удостоверяющих документов Китая, Гонконга, Японии и Кореи для iOS, Android, Linux, Windows, macOS и Solaris. Протестировать распознавание китайских, японских и корейских иероглифов в видеопотоке и на фотографиях можно установив бесплатное демонстрационное приложение Smart IDReader из Google play или App Store.

2018: Анонс системы Hieroglyph

Компания Smart Engines в марте 2018 года представила систему искусственного интеллекта Hieroglyph, которая позволяет настроить распознавание любых удостоверяющих документов. Разработка технологической платформы Hieroglyph велась в течение 2017 года, и, по состоянию на 14 марта, на ней реализовано распознавание паспортов, ID-карт и водительских удостоверений для более чем 55 стран мира. Непосредственно на уровне платформы уже поддерживаются 38 языков, включая практически все европейские, даже такие визуально сложные, как армянский и грузинский.

По словам генерального директора Smart Engines к.т.н. Владимира Арлазарова, с точки зрения мирового рынка распознавания наибольший интерес по-прежнему представляют страны западной Европы и США. Специалистам компании удалось локализовать продукт для работы с документами на английском, немецком, французском, испанском, португальском языках, что позволило расширить потенциальную географию решения до 1,5 млрд пользователей.

Алгоритмы распознавания в Hieroglyph оптимизированы для архитектур «Эльбрус», SPARC, ARM, x86 и совместимы с операционными системами iOS, Android, Sailfish Mobile OS RUS, Linux (включая Astra Linux и «Атликс»), Windows, macOS и Solaris. Качество распознавания не зависит от программно-аппаратного окружения, а быстродействие определяется доступными вычислительными ресурсами. Могут обрабатываться видео, фотографии, сканы документов и их копии, полученные с помощью телефонов, планшетов, веб-камер и сканеров.

Для решения задач детекции, классификации и распознавания большого количества типов документов в Hieroglyph применяются глубокие целочисленные нейросети. Ученым компании удалось решить известную проблему, связанную с большой вычислительной сложностью стандартных решений в области обучения машин. Для оптимизации быстродействия глубоких нейронных сетей была использована сепарированная архитектура сверточных слоев и 8-битная модель вычислений. Большинство программных функций платформы поддерживают обработку в 8-битной целочисленной арифметике, что позволяет вычислять ответ глубоких нейронных сверточных сетей в восьмибитном тракте.

Первые значимые результаты продаж решений на базе Hieroglyph на международном рынке Smart Engines рассчитывает получить к концу 2019 года.



СМ. ТАКЖЕ (1)


Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2016 год
2017 год
2018 год

Распределение базовых систем по количеству проектов, включая партнерские решения

За всю историю
2016 год
2017 год
2018 год

  DocsVision (СЭД/ECM-система) - 39 (32, 7)
  ТЕЗИС - 17 (17, 0)
  Дело (ЭОС) - 16 (16, 0)
  ЭЛАР ПланСкан - 12 (12, 0)
  ABBYY FlexiCapture - 8 (8, 0)
  Другие 84

  DocsVision (СЭД/ECM-система) - 36 (33, 3)
  ТЕЗИС - 32 (32, 0)
  ЭЛАР ПланСкан - 26 (26, 0)
  Syntellect Tessa - 17 (16, 1)
  Smart IDReader - 16 (16, 0)
  Другие 117

  Syntellect Tessa - 56 (56, 0)
  ТЕЗИС - 54 (54, 0)
  DirectumRX - 36 (36, 0)
  Synerdocs - 28 (28, 0)
  DocsVision (СЭД/ECM-система) - 24 (21, 3)
  Другие 125