Amazon Textract

Продукт
Название базовой системы (платформы): Amazon Web Services (AWS)
Разработчики: Amazon
Дата премьеры системы: май 2019 г
Технологии: SaaS - Программное обеспечение как услуга,  СЭД - Системы потокового распознавания

2019: Анонс

В конце мая 2019 года Amazon запустила облачный сервис для распознавания документов Textract, который способен автоматически извлекать из страниц текст, таблицы и другие данные. Поддерживаются различные форматы, включая JPEG, PNG и PDF.

Textract относится к программам оптического распознавания текста (OCR), как и, например, Abbyy FineReader. В отличие от многих OCR-решений Textract не просто извлекает текст из документов, но и распознаёт их формат и содержание. Например, он различает таблицы и формы в документах, в том числе в чеках, налоговых декларациях и товарных накладных, а также поддерживает графические форматы. После распознавания ПО самостоятельно структурирует данные.

Amazon выпустила конкурента Abbyy FineReader

В Amazon утверждают, что сервис Textract способен определить паспортные данные, даты рождения и адреса, после чего правильно интерпретировать вне зависимости от того, в каком месте страницы они находятся. В случае изменения шаблона система не пропустит неправильный результат.

По словам разработчиков, добиться высокой эффективности распознавания удалось за счёт использования машинного обучения (МО) для обработки миллионов документов. В результате система научилась правильно идентифицировать текст и объекты «практически в любом» типе документов.Дмитрий Бородачев, DатаРу Облако: Наше преимущество — мультивендорная модель предоставления облачных услуг

Разработчикам для подключения Textract к своим приложениям не нужно быть специалистами по машинному обучению, говорит вице-президент отдела Amazon Machine Learning Свами Сивасубраманян (Swami Sivasubramanian). Они могут извлекать текст и данные, используя СУБД и аналитические сервисы Amazon и наладить интеграцию с другими МО-сервисами.

Textract предназначен для автоматического распознавания большого количества документов. Стоимость пользования сервисом начинается с $1,5 за 1000 обработанных страниц.[1]

Примечания



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ВидеоМост (VideoMost) (1767)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (1643)
  TrueConf (Труконф) (1594)
  Террасофт (Terrasoft, ТС-Консалтинг) (1147)
  Directum (Директум) (733)
  Другие (8649)

  Elma (Элма, Интеллект Лаб, Практика БПМ) (244)
  Террасофт (Terrasoft, ТС-Консалтинг) (186)
  ВидеоМост (VideoMost) (181)
  Directum (Директум) (110)
  QuickBPM (83)
  Другие (759)

  Elma (Элма, Интеллект Лаб, Практика БПМ) (230)
  ВидеоМост (VideoMost) (101)
  Directum (Директум) (80)
  1С-Рарус (30)
  Projecto (Проджекто) (26)
  Другие (562)

  Elma (Элма, Интеллект Лаб, Практика БПМ) (179)
  Directum (Директум) (84)
  Первый Бит (23)
  Naumen (Наумен консалтинг) (22)
  Адванта Консалтинг (Advanta) (20)
  Другие (400)

  Directum (Директум) (230)
  Первый Бит (18)
  БизнесАвтоматика НПЦ (12)
  B2B-Center (Центр развития экономики) (12)
  Naumen (Наумен консалтинг) (12)
  Другие (210)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  1С Акционерное общество (35, 2831)
  ВидеоМост (VideoMost) (3, 1818)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (4, 1768)
  TrueConf (Труконф) (3, 1610)
  Creatio (12, 1238)
  Другие (1939, 7474)

  Elma (Элма, Интеллект Лаб, Практика БПМ) (2, 327)
  Directum (Директум) (2, 233)
  Creatio (1, 200)
  ВидеоМост (VideoMost) (2, 183)
  1С Акционерное общество (13, 146)
  Другие (153, 489)

  Directum (Директум) (2, 236)
  Elma (Элма, Интеллект Лаб, Практика БПМ) (2, 233)
  ВидеоМост (VideoMost) (1, 102)
  1С Акционерное общество (9, 99)
  Projecto (Проджекто) (1, 26)
  Другие (94, 330)

  Elma (Элма, Интеллект Лаб, Практика БПМ) (2, 180)
  Directum (Директум) (1, 146)
  1С Акционерное общество (12, 89)
  Naumen (Наумен консалтинг) (5, 22)
  1С-Битрикс (1, 21)
  Другие (81, 265)

  Directum (Директум) (1, 237)
  1С Акционерное общество (8, 60)
  1С-Битрикс (1, 18)
  Naumen (Наумен консалтинг) (3, 16)
  БизнесАвтоматика НПЦ (5, 12)
  Другие (66, 164)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ВидеоМост (VideoMost) ВКС - 1817
  TrueConf Server - 1594
  ELMA BPM Suite - 1431
  Directum RX - 1112
  Creatio (ранее bpm’online) - 944
  Другие 8512

  ELMA BPM Suite - 241
  Directum RX - 233
  Creatio (ранее bpm’online) - 200
  ВидеоМост (VideoMost) ВКС - 182
  1С:ERP Управление предприятием 2 - 114
  Другие 570

  Directum RX - 236
  ELMA BPM Suite - 151
  ВидеоМост (VideoMost) ВКС - 102
  ELMA365 - 83
  1С:ERP Управление предприятием 2 - 68
  Другие 362

  ELMA365 - 161
  Directum RX - 146
  1С:ERP Управление предприятием 2 - 54
  ELMA BPM Suite - 22
  1С-Битрикс24 - 21
  Другие 299

  Directum RX - 237
  1С:ERP Управление предприятием 2 - 41
  1С-Битрикс24 - 18
  B2B-Center: Мои поставщики - 12
  HRlink Система электронного кадрового документооборота - 12
  Другие 173

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (242)
  Directum (Директум) (132)
  Smart Engines (Смарт Энджинс) (123)
  Cognitive Technologies (Когнитивные технологии) (91)
  Синтеллект (Syntellect) (78)
  Другие (747)

  Синтеллект (Syntellect) (52)
  Smart Engines (Смарт Энджинс) (14)
  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Directum (Директум) (5)
  Abbyy Россия (4)
  Другие (32)

  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Beorg (Биорг) (8)
  Smart Engines (Смарт Энджинс) (7)
  NVI Solutions (Норд Вижен Интелледженс Солюшенс) (3)
  Digital Design (Диджитал Дизайн) (2)
  Другие (19)

  Smart Engines (Смарт Энджинс) (21)
  ЭЛАР (Электронный архив, НПО Опыт) (13)
  Синтеллект (Syntellect) (5)
  Beorg (Биорг) (4)
  Digital Design (Диджитал Дизайн) (4)
  Другие (13)

  Smart Engines (Смарт Энджинс) (16)
  ЭЛАР (Электронный архив, НПО Опыт) (9)
  Beorg (Биорг) (2)
  Digital Design (Диджитал Дизайн) (2)
  Content AI (Контент ИИ) (1)
  Другие (7)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (11, 243)
  Directum (Директум) (6, 161)
  Smart Engines (Смарт Энджинс) (17, 131)
  Abbyy Россия (16, 111)
  Cognitive Technologies (Когнитивные технологии) (5, 96)
  Другие (171, 622)

  Синтеллект (Syntellect) (2, 52)
  Smart Engines (Смарт Энджинс) (2, 14)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 8)
  Abbyy Россия (2, 7)
  Directum (Директум) (3, 6)
  Другие (16, 19)

  Smart Engines (Смарт Энджинс) (3, 11)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 10)
  Beorg (Биорг) (1, 8)
  Directum (Директум) (3, 4)
  Digital Design (Диджитал Дизайн) (3, 2)
  Другие (10, 11)

  Smart Engines (Смарт Энджинс) (2, 22)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 13)
  Синтеллект (Syntellect) (2, 5)
  Digital Design (Диджитал Дизайн) (2, 4)
  Beorg (Биорг) (1, 4)
  Другие (8, 10)

  Smart Engines (Смарт Энджинс) (3, 17)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 9)
  Digital Design (Диджитал Дизайн) (2, 2)
  Beorg (Биорг) (1, 2)
  Content AI (Контент ИИ) (1, 2)
  Другие (5, 5)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР ПланСкан - 151
  Synerdocs - 130
  Smart ID Engine (ранее Smart IDReader) - 114
  ABBYY FlexiCapture - 90
  Е1 Евфрат - 87
  Другие 777

  Syntellect Tessa Мобильное согласование - 30
  Syntellect Tessa Графический визуализатор процессов - 28
  Smart ID Engine (ранее Smart IDReader) - 12
  ABBYY FlexiCapture - 6
  ЭЛАР ПланСкан - 6
  Другие 28

  Smart ID Engine (ранее Smart IDReader) - 10
  ЭЛАР ПланСкан - 9
  Beorg Smart Vision - 8
  EasyData: EasySeparate - 2
  ЭЛАР ПауэрСкан - 2
  Другие 16

  Smart ID Engine (ранее Smart IDReader) - 18
  ЭЛАР ПланСкан - 8
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4
  Syntellect Tessa Графический визуализатор процессов - 4
  Beorg Smart Vision - 4
  Другие 19

  Smart ID Engine (ранее Smart IDReader) - 13
  ЭЛАР ПланСкан - 5
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4
  ContentReader Server - 2
  ЭЛАР СканИмидж - 2
  Другие 11