Логотип
Баннер в шапке 1
Баннер в шапке 2
2024/07/04 14:59:42

PROMT: Машинный перевод сегодня есть практически везде. Мы просто об этом уже не задумываемся

Компания PROMT находится сегодня в уникальном положении: у нее практически нет конкурентов в корпоративном сегменте в России. PROMT работает на рынке лингвистического программного обеспечения для машинного (автоматического) перевода уже более тридцати лет, а совсем недавно выпустила на рынок первую и пока единственную российскую многопользовательскую САТ-систему для профессионального перевода PROMT Translation Factory. Об этом, а также о том, что сегодня происходит на российском рынке лингвистических технологий, импортозамещении и как информационная безопасность связана с переводческой отраслью, рассказали TAdviser Юлия Епифанцева, директор по развитию компании PROMT, и Николай Пирогов, директор по продажам компании PROMT.

Юлия
Епифанцева
Если в компании есть отдел перевода, то использование САТ-системы и системы машинного перевода — это уже стандарт, необходимость.

Как выглядит сегодня рынок технологий и услуг для перевода?

Юлия Епифанцева: Мировой рынок лингвистических услуг, а сюда входят все услуги, связанные с естественными языками (изучение и преподавания иностранных языков, перевод, локализация и другие), по разным данным оценивается в 75-80 млрд долларов США. По прогнозам аналитиков к 2030 году объем рынка превысит 100 млрд долларов. Растущее число иммигрантов и иностранных студентов, а также высокий спрос на контент в разных форматах, таких как аудио, видео и письменные материалы на разных языках, стимулируют рынок.

При этом, если мы посмотрим, например, только на рынок машинного перевода (МП), то его объем эксперты оценивают всего в 1 млрд долл. Нам кажется, что рынок МП недооценен, у него по-прежнему огромный потенциал для роста. Во-первых, потому что в последние годы развитие нейронных сетей существенно повысило качество компьютерного перевода, а уровень доверия к нему вырос не только со стороны рядовых пользователей, но и со стороны профессиональных переводчиков. Переводить с нуля всегда дорого и долго, а поскольку скорость является в нынешнем мире одним из главных конкурентных преимуществ, МП используют уже очень многие штатные переводчики коммерческих и государственных компаний. Во-вторых, благодаря МП можно сэкономить не только время, но и бюджет на привлечение внешних подрядчиков-переводчиков: некоторые документы сотрудники могут переводить сами с помощью МП, другие документы — штатные переводчики, которые быстро и качественно редактируют МП.

Николай
Пирогов
Мы знаем примеры использования онлайн-сервисов, которые нанесли репутационный ущерб компаниям и привели к угрозе заведения уголовного дела.

Николай Пирогов: Машинный перевод — это важная, но не единственная технология, связанная с индустрией перевода. Еще одна технология базируется на сравнении документа, который нужно перевести, с данными, хранящимися в предварительно созданной базе переводов. Называется эта технология Translation Memory (память перевода). Это технология лежит в основе программного обеспечения для профессиональных переводчиков. Основной класс таких программ — это CAT-системы (Computer-Assisted Translation). Разница между системами машинного перевода и CAT-системами в том, что первые относятся к сфере искусственного интеллекта (перевод осуществляется с помощью нейронных сетей без участия человека), а CAT-системы непосредственно помогают человеку-переводчику осуществлять перевод и накапливать эти переводы для их повторного использования.

Как изменился российский рынок лингвистического ПО для перевода для корпоративного сегмента за последние несколько лет?

Юлия Епифанцева: Российский рынок лингвистического ПО практически не отличается от мирового. И там, и там в корпоративном сегменте используются решения для МП в тех случаях, когда нужно переводить быстро и без лишних затрат, и CAT-системы для профессионального перевода. Однако, с точки зрения игроков на рынке лингвистического ПО для перевода в России произошли серьезные изменения, но затронули они только сферу профессионального перевода.

Разработкой МП в России занимаются всего два игрока — PROMT и Яндекс. Но Яндекс специализируется на онлайн-переводе, а использование онлайн-сервисов перевода в работе корпоративных переводческих служб, как правило, невозможно из-за потенциальных рисков утечки информации. Как раз PROMT специализируется на МП-решениях, которые устанавливаются в корпоративной сети компании или предприятия и работают офлайн. Это и есть наше основное конкурентное преимущество: при использовании ПО PROMT переводимые данные не передаются онлайн, защищены от утечек и попадания к третьим лицам.

Получается, что на рынке ПО для МП практически ничего не изменилось: российские компании, предприятия и госорганизации всегда имели возможность приобретать решения от российского производителя. Все наши программы включены в государственный реестр Минцифры и соответствуют требованиям по использованию отечественного ПО. Можно сказать, что в этой сфере вопрос импортозамещения вообще не стоял.

Николай Пирогов: На рынке же САТ-систем ситуация оказалась прямо противоположной. До последнего времени в России преимущественно использовали иностранные CAT-системы, такие как британская система Trados и венгерская memoQ. Когда эти решения ушли с российского рынка, пользователи столкнулись с тем, что стало невозможно получить поддержку, обновить лицензии, приобрести эти продукты.

Запрос на российское ПО для профессионального перевода возник резко и сразу. Несколько российских компаний объявили о том, что начали разработку российской CAT-системы, но в 2023 году вывести продукт на рынок смогла только наша компания. Наше решение называется PROMT Translation Factory и объединяет в себе CAT-систему нового поколения и технологии ИИ для автоматического перевода. Наша CAT-система входит в реестр программного обеспечения РФ, что позволяет закупать это решение не только коммерческим, но и государственным компаниям. Благодаря огромному опыту и компетенциям мы смогли разработать первую версию всего за один год, в апреле 2024 года вышла вторая версия. Мы уверены, что наше решение является достойным конкурентом Trados не только в силу ограничений рынка, но и потому, что нашу CAT-систему мы сделали с глубоким пониманием продукта и опираясь на обратную связь от пользователей.

Кроме того, хотелось бы отметить, что я не встречал такого плотного взаимодействия заказчика и разработчика, как при разработке этого продукта. Уникальность в том, что у наших действующих и будущих заказчиков есть возможность участвовать в развитии продукта, влиять на то, чтобы при разработке были учтены все их потребности и запросы.

Юлия Епифанцева: 5 июня на закрытой конференции в Санкт-Петербурге мы представили нашим заказчикам и партнерам не отдельные продукты, а целую экосистему PROMT для автоматизации переводческих процессов. Это логичный шаг, который открывает новую страницу в 30-летней истории компании. К серверу машинного перевода PROMT Neural Translation Server добавлен модуль для тренировки нейронных моделей PROMT Neural Training Addon, а объединяет все продукты в экосистему именно САT-система PROMT Translation Factory. Экосистема обеспечивает полный цикл работы с данными — от генерации до обучения и повторного использования, обеспечивая все переводческие бизнес-процессы на предприятии.

Николай Пирогов: Еще отмечу, что наши решения разработаны как для ОС Windows, так и для ОС Linux. Сегодня это тоже одно из наших конкурентных преимуществ. Запрос на продукты, работающие под Linux, был уже давно, и не только у российских заказчиков. Например, до последнего момента САТ-систем под Linux не было практически ни у кого из игроков мирового рынка. У всех наших продуктов есть сертификаты совместимости с ОС Astra Linux, Ред ОС, Alt Linux и некоторыми другими. У компаний, ориентированных на импортозамещение, есть возможность приобретать российский софт для перевода, а также получать преимущество при участии в госзакупках и освобождение от НДС.

Расскажите о лучших практиках внедрения машинного (автоматического) перевода PROMT в компаниях.

Юлия Епифанцева: Сценариев применения МП в корпоративном секторе очень много. Это и службы поддержки, и e-commerce, и перевод корпоративной документации (аналитика, отчеты, презентации, научная информация) и много другое. Очень жаль, что выгоду использования МП понимают далеко не все компании. Но есть и приятные исключения. Например, МП для перевода русскоязычного контента сайта на другие языки успешно применяет TAdviser. Благодаря внедрению машинного перевода в процесс подготовки английской версии сайта ежемесячно переводится более 100 млн символов, а это 33 000 страниц формата А4. Чтобы такой объем могли перевести люди, понадобилось бы несколько десятков переводчиков, так что выгода налицо. Патентные службы тоже охотно используют машинный перевод в своей деятельности. Патентный эксперт должен произвести проверку полученных патентных заявок по международным базам, это очень сложная, кропотливая и специфическая работа, связанная с изучением информации на разных иностранных языках. В этом случае технологии машинного перевода просто незаменимы. Еще один из показательных кейсов — использование МП для перевода рабочей документации.

Очень часто речь идет о текстах короткого жизненного цикла или больших объемах, поэтому использование труда профессиональных переводчиков нецелесообразно или невозможно. Активно использует машинный перевод PROMT в своей деятельности Центробанк. История нашего сотрудничества с банком началась еще в 2007 году. Напомню, что ни в одном из банков нельзя пользоваться услугами онлайн-перевода, это запрещено правилами безопасности. В Центробанке используется порядка 50 наших лицензий и 5000 учетных записей. Это означает, что 5000 человек могут использовать переводчик PROMT. Доступ к сервису перевода имеют не только сотрудники банка, находящиеся в Москве, но и из других регионов. Основной язык, используемый для перевода, английский. Также доступен перевод с испанского, итальянского, португальского и немецкого. Внедрение продуктов PROMT в Центробанке — прекрасный пример создания качественного корпоративного защищенного сервиса для решения всех задач, связанных с преодолением языкового барьера в банковской структуре.

Николай Пирогов: Добавлю, что необходимость установки системы МП в локальную сеть заказчика может быть продиктована и техническими ограничениями. Например, хорошая стабильная сотовая связь есть не везде, доступ к сервису онлайн-перевода может оказаться закрыт в самый неподходящий момент. Даже в региональных поездах бывают перебои со связью, не говоря уже о поездах дальнего следования. В 2018 году, когда в России проходил Чемпионат мира по футболу, наша компания разработала специальное мобильное приложение-переводчик для проводников поездов дальнего следования РЖД. Приложение работало без интернета на устройствах проверки билетов, с его помощью сотрудники РЖД могли общаться с иностранными гостями на английском, немецком, французском и других европейских языках. Машинного перевода в нашей жизни гораздо больше, чем людям кажется. И это очень сильно упрощает жизнь.

И тут мы переходим к проблемам обеспечения безопасности в решениях переводческого ПО. О чем обязательно стоит помнить, используя онлайн сервисы машинного перевода или облачные CAT-системы?

Николай Пирогов: Сегодня у сотрудника, которому нужно перевести какой-либо документ, есть несколько возможностей. Он может перевести «по старинке», вручную, но это долго. Может отдать в бюро перевода, но это, во-первых, связано с рисками передачи информации третьим лицам, что не всегда возможно, во-вторых, это займет некоторое время, и работу нужно будет оплачивать. Казалось бы, самый быстрый и простой путь — выйти в интернет и использовать онлайн машинный перевод. Это быстро и качественно. Однако сотрудники забывают, а иногда и просто не понимают, что таким образом они отправляют коммерческий документ «в открытый доступ». Даже из фрагментов документа (обычно перевод осуществляется «абзацами») можно получить конфиденциальную информацию. Мы знаем примеры использования онлайн-сервисов, которые нанесли репутационный ущерб компаниям и привели к угрозе заведения уголовного дела. А в нынешних российских реалиях это стало еще более критично.

Кроме того, согласно указу Президента РФ к 2025 году все владельцы критической информационной инфраструктуры (КИИ), к которым относятся госорганы, финансовые, энергетические, медицинские, телекоммуникационные другие компании, должны перейти на российский софт. Наша главная рекомендация компаниям этих сфер деятельности: используйте системы без доступа в интернет. Это касается и решений для машинного перевода, и CAT-систем. Только в этом случае можно избежать каких-либо утечек корпоративной информации. Если компания заботится о конфиденциальности и безопасности при работе с корпоративной информации, то ей необходимо решение, которое работает «в закрытом контуре».

С появлением экосистемы PROMT государственные организации и компании, владеющие критической информационной инфраструктурой (КИИ), получили возможность наладить безопасную работу с корпоративными ресурсами и источниками на иностранных языках во всех своих подразделениях. Например, отдел переводов ООО «КИНЕФ» — крупного нефтеперерабатывающего предприятия на Северо-Западе России — работает с CAT-системой PROMT Translation Factory. Коллеги считают, что в условиях современной геополитики — это работоспособное решение для переводческого отдела предприятия с КИИ, и мы этим гордимся.

Хотелось бы услышать от вас несколько советов заказчикам по наиболее эффективному использованию лингвистического программного обеспечения.

Юлия Епифанцева: Если в компании есть отдел перевода, то использование САТ-системы и системы машинного перевода — это уже стандарт, необходимость. PROMT задает новые стандарты. Раньше сотрудники штатных отделов перевода компаний и мечтать не могли о том, чтобы можно было самостоятельно обучить нейронную модель на своих данных, а теперь эта задача решается парой кликов! Мы уверены, что экосистема PROMT позволяет компаниям и государственным организациям использовать возможности лингвистических технологий максимально эффективно.

Николай Пирогов: Для заказчика важен не только продукт, но и стабильная надежная поддержка этого продукта. Мы работаем на российском рынке более 30 лет, имеем колоссальный опыт внедрения лингвистического ПО, поэтому являемся надежным поставщиком для наших пользователей. Советую следить за новостями рынка лингвистического ПО в России и нашими новостями, в частности. Мы активно развиваемся как компания, а также развиваются наши продукты и сервисы.