Schema-Guided Dialogue (SGD)
Набор диалогов для обучения голосовых помощников

Продукт
Разработчики: Google
Дата премьеры системы: октябрь 2019 г
Отрасли: Интернет-сервисы
Технологии: Речевые технологии

Содержание

2019: Анонс

В конце октября 2019 года стало известно о том, что Google выпустила в открытый доступ крупнейший в мире набор диалогов для обучения голосовых помощников. Проект американской корпорации получил название Schema-Guided Dialogue (SGD).

«
Современные виртуальные помощники помогают пользователям выполнять широкий спектр задач, включая поиск рейсов, поиск ближайших мероприятий и фильмов, резервирование чего-либо, поиск информации в интернете и др., — говорят инженер-программист Абхинав Растоги (Abhinav Rastogi) и технический руководитель отдела Google Research Пранав Хайтан (Pranav Khaitan). Несмотря на огромный прогресс, проблемы адаптивности часто упускаются из виду в современных моделях. Частично это связано с отсутствием подходящих наборов данных, которые соответствуют масштабу и сложности, с которыми сталкиваются такие виртуальные помощники.
»

Google выпустила в открытый доступ крупнейший в мире набор диалогов для обучения голосовых помощников. Новый проект американской корпорации получил название Schema-Guided Dialogue (SGD)

В базу SGD входит 18 тыс. проблемно-ориентированных размеченных диалогов между людьми и виртуальным ассистентом. Диалоги могут разбиты по 17 различным темам, включая СМИ, банки, мероприятия, календарь, путешествия и погоду. Для большинства тем предусмотрено несколько разных API, многие из которых имеют пересекающиеся функции, но разные интерфейсы, отражающие типичные сценарии реального мира.

По словам создателей SGD, это первый набор данный, охватывающий такое количество областей и имеющий по нескольку API для каждой из них.

Разработчики также заявляют, что унифицированная модель, которая лежит в основе открытой модели Google для отслеживания состояния диалогов, облегчает представление общих знаний между похожими концепциями в разных сервисах. Это позволяет разработчикам обращаться к новым сервисам, которые ранее не обучались на основе данных из SGD.[1]

Смотрите также Голосовые помощники (бормотографы)



Примечания



СМ. ТАКЖЕ (69)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (45)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (29)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (27)
  SteadyControl (18)
  Naumen (Наумен консалтинг) (15)
  Другие (198)

  Группа компаний ЦРТ (Центр речевых технологий) (5)
  SteadyControl (4)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  Voice Systems Robotics (VSR, VS Robotics) (2)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  Другие (17)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Naumen (Наумен консалтинг) (3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Другие (14)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Другие (29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3)
  Другие (33)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (18, 47)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4, 30)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (12, 29)
  SteadyControl (1, 23)
  SteadyControl HoReCa (1, 23)
  Другие (383, 218)

  Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
  SteadyControl HoReCa (1, 4)
  SteadyControl (1, 4)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Другие (9, 13)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl HoReCa (1, 3)
  Voice Systems Robotics (VSR, VS Robotics) (1, 3)
  Naumen (Наумен консалтинг) (1, 3)
  Другие (12, 16)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl HoReCa (1, 7)
  SteadyControl (1, 7)
  Другие (18, 30)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Сбербанк (3, 5)
  SteadyControl (1, 5)
  SteadyControl HoReCa (1, 5)
  Ростелеком (2, 4)
  Другие (25, 40)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  МТТ VoiceBox - 24
  SteadyControl Система контроля и управления персоналом - 23
  BSS Digital2Speech - 21
  Voice2Med Система распознавания речи в медицине - 14
  Naumen Erudite - 13
  Другие 206

  BSS Digital2Speech - 5
  SteadyControl Система контроля и управления персоналом - 4
  Voice2Med Система распознавания речи в медицине - 4
  МТТ VoiceBox - 2
  Neuro.net Голосовой робот - 2
  Другие 11

  МТТ VoiceBox - 11
  BSS Digital2Speech - 6
  SteadyControl Система контроля и управления персоналом - 3
  Naumen Erudite - 3
  VS Robotics: VS Робот-оператор - 3
  Другие 14

  МТТ VoiceBox - 9
  SteadyControl Система контроля и управления персоналом - 7
  EXpress Защищенный корпоративный мессенджер - 6
  BSS Digital2Speech - 6
  SmartLogger II - 4
  Другие 23

  SteadyControl Система контроля и управления персоналом - 5
  BSS Digital2Speech - 4
  EXpress Защищенный корпоративный мессенджер - 4
  YandexGPT (YaLM 2.0) - 3
  Сбер: GigaChat - 3
  Другие 31