Разработчики: | Meta Platforms |
Дата последнего релиза: | январь 2019 г |
Технологии: | Речевые технологии |
2019: Раскрытие исходных кодов
В январе 2019 года Facebook раскрыла исходные коды инструмента LASER (Language-Agnostic Sentence Representations), предназначенного для понимания любой естественной речи. Этим шагом крупнейшая в мире социальная сеть внесла очередной ключевой вклад в то, чтобы ускорить перевод приложений, занимающихся обработкой естественно-языковых текстов и голосовых сообщений, на большее количество языков.
По сообщению издания SiliconANGLE, система LASER, базирующаяся на библиотеке глубокого обучения PyTorch, применяется Facebook для создания некой математической модели, которая может инкапсулировать и понимать все естественные языки, какими бы уникальными они ни были.
Исходники этого инструменты были выложены в открытый доступ спустя месяц после выхода исследования Facebook, в котором специалисты рассказали об обучении единой модели нейронной сети, которая может моделировать структуру из 93 языков в 34 отдельных алфавитах.
В конечном итоге Facebook получила, как сама компания называет это, «единое представление» или математическое преобразование предложений в форме векторов, которая включает в себя структурное сходство всех 93 языков. Как защищать «поумневшие» промышленные сети: «Синоникс» на страже безопасного объединения изолированных сетей
Это единственное представление затем использовалось для обучения алгоритмов по нескольким задачам, предполагавшим сопоставление предложений между парами языков, которые программа никогда раньше не видела. Например, был реализован перевод со шведского языка на суахили и метод, позволяющий изучать языки «с нуля».
Исследователь Facebook Хольгер Швенк (Holger Schwenk) говорит, благодаря LASER языки с «ограниченными ресурсами», как ожидается, можно будет изучать совместно с более популярными языками, чтобы можно было построить модели обработки естественного языка для их понимания.[1]
Примечания
Подрядчики-лидеры по количеству проектов
Группа компаний ЦРТ (Центр речевых технологий) (43)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (27)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (25)
Naumen (Наумен консалтинг) (14)
Voice Systems Robotics (VSR, VS Robotics) (9)
Другие (148)
Группа компаний ЦРТ (Центр речевых технологий) (5)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
Naumen (Наумен консалтинг) (2)
Neuro.net (Нейро) (2)
Voice Systems Robotics (VSR, VS Robotics) (2)
Другие (15)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
Voice Systems Robotics (VSR, VS Robotics) (3)
Naumen (Наумен консалтинг) (3)
Мегапьютер Интелидженс (Megaputer Intelligence) (2)
Другие (11)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Группа компаний ЦРТ (Центр речевых технологий) (16, 46)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 28)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (11, 27)
Яндекс (Yandex) (9, 14)
Avaya (4, 13)
Другие (300, 145)
Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
Neuro.net (Нейро) (1, 2)
Другие (7, 9)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
Naumen (Наумен консалтинг) (1, 3)
Voice Systems Robotics (VSR, VS Robotics) (1, 3)
Voximplant (Фастком) (2, 2)
Другие (9, 11)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 8)
Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
Unlimited Production (Анлимитед Продакшен) (1, 6)
Naumen (Наумен консалтинг) (2, 4)
Другие (12, 13)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 4)
SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
Ростелеком (1, 2)
Naumen (Наумен консалтинг) (1, 1)
Voice Systems Robotics (VSR, VS Robotics) (1, 1)
Другие (6, 6)
Распределение систем по количеству проектов, не включая партнерские решения
МТТ VoiceBox - 24
BSS Digital2Speech - 20
Voice2Med Система распознавания речи в медицине - 14
SmartLogger II - 12
Naumen Erudite - 12
Другие 160
BSS Digital2Speech - 5
Voice2Med Система распознавания речи в медицине - 4
3i TouchPoint Analytics - 2
Naumen Erudite - 2
МТТ VoiceBox - 2
Другие 9
МТТ VoiceBox - 11
BSS Digital2Speech - 6
Naumen Erudite - 3
VS Robotics: VS Робот-оператор - 3
PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2
Другие 12
МТТ VoiceBox - 9
BSS Digital2Speech - 7
EXpress Защищенный корпоративный мессенджер - 6
SmartLogger II - 4
Naumen Erudite - 3
Другие 17