2025/02/13 12:55:21

Обучение искусственного интеллекта


Содержание

Основные статьи:

Обучение роботов

Основная статья:Обучение роботов

Машинное обучение

Основная статья: Машинное обучение (Machine Learning)

LLM (Большие языковые модели)

Основная статья: LLM (Большие языковые модели)

Хроника

2025

ИТМО запустил бесплатную библиотеку CoolPrompt для написания правильных запросов для нейросетей

Команда лаборатории компьютерных технологий CT-Lab Университета ИТМО разработала библиотеку CoolPrompt для автоматической оптимизации промптов — инструкций для больших языковых моделей. Она упрощает и ускоряет написание запросов к искусственному интеллекту и даёт возможность специалистам без глубоких технических знаний получать конкретные результаты. Подробнее здесь.

Мэрия Москвы открыла наборы обезличенных данных, которые компании могут использовать для обучения ИИ и создания сервисов для жителей

Департамент информационных технологий Москвы предоставил разработчикам доступ к 25 наборам обезличенных городских данных для обучения алгоритмов искусственного интеллекта и разработки цифровых сервисов для горожан. Инициатива направлена на создание умных решений, которые после экспертной проверки могут быть интегрированы в городскую инфраструктуру. Об этом сообщили в пресс-службе ведомства 9 сентября 2025 года. Подробнее здесь

В России выпущен бесплатный дата-сет для обучения искусственного интеллекта распознаванию эмоций человека

Исследователи Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ) в Санкт-Петербурге разработали и выпустили в открытый доступ мультимодальный эмоциональный датасет для обучения систем искусственного интеллекта анализу человеческих эмоций. Об этом в НИУ ВШЭ сообщили в конце августа 2025 года. Подробнее здесь

Разработка в России технологии, ускоряющей обучение распределённых нейросетевых моделей

Российские специалисты Центра практического искусственного интеллекта Сбербанка и Московского физико-технического института создали инновационный подход к оптимизации распределенного обучения нейросетевых моделей, который позволяет существенно снизить нагрузку на вычислительные ресурсы и ускорить процессы машинного обучения. Об этом стало известно в августе 2025 года. Новая технология фокусируется на использовании однородности локальных выборок данных и сжатии передаваемой информации между устройствами.

Разработка направлена на решение ключевой проблемы современного машинного обучения — неэффективности коммуникаций при распределенном обучении нейросетей. Исследователи отмечают, что модели искусственного интеллекта обрабатывают огромные массивы данных с миллиардами параметров, что требует распределенного обучения на тысячах устройств для ускорения вычислительных процессов.

В России разработали технологию, ускоряющую обучение распределённых нейросетевых моделей

Основная проблема заключается в том, что значительная доля времени при распределенном обучении тратится на обмен информацией между вычислительными машинами. Неэффективная организация коммуникаций может замедлить обучение нейросетей по сравнению с централизованным подходом, что снижает преимущества использования множественных вычислительных ресурсов.Объединяем серверы, системы хранения и сетевые ресурсы в единую систему. Обзор vStack HCP 29.6 т

Предложенный российскими учеными метод основан на комбинации двух ключевых принципов: использовании гомогенности локальных выборок данных и применении техник сжатия передаваемой информации. Такой подход позволяет уменьшить частоту синхронизации между устройствами и существенно сократить объем передаваемых данных без ущерба для качества обучаемой модели.

Директор Центра практического искусственного интеллекта Сбербанка Глеб Гусев подчеркнул, что комбинация гомогенности данных с техниками сжатия позволяет реже обмениваться информацией между сервером и устройствами. По его словам, это не только ускоряет процесс обучения, но и значительно снижает энергозатраты, открывая новые возможности для масштабирования искусственного интеллекта в крупных системах.[1]

В России разработали новый метод для понимания решений, принимаемых искусственным интеллектом

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод под названием SAE Match, который позволяет понять механизмы принятия решений искусственного интеллекта (ИИ) и увидеть причины формирования тех или иных заключений в процессе вычисления. Об этом 10 апреля 2025 года сообщили представители исследовательской группы из Москвы. Подробнее здесь.

Вице-премьер Дмитрий Григоренко: Госданные для обучения ИИ станут доступны бизнесу, госорганам и гражданам

Государственные данные для обучения ИИ станут доступны бизнесу, госорганам и гражданам. Вице-премьер Дмитрий Григоренко в феврале 2025 года заявил, что компании, государственные структуры и физические лица смогут использовать размеченные наборы госданных для тестирования и разработки алгоритмов искусственного интеллекта. Первые безвозмездные контракты на предоставление таких данных начнут заключаться в феврале 2025 года.

Как пишут «Ведомости», размеченные наборы подготовлены на основе исходных баз, не содержащих персональных данных граждан, служебной и иной охраняемой законом тайны, а также информации ограниченного доступа. Разметка представляет собой присвоение специальных меток и категорий данным для их распознавания алгоритмами машинного обучения.

Вице-премьер Дмитрий Григоренко

Формирование наборов данных для искусственного интеллекта осуществляется в рамках Единой информационной платформы Национальной системы управления данными. В 2023 году были сформированы первые 10 наборов с размеченными данными, а в ноябре 2024 года добавлены еще 40 наборов в рамках федерального проекта «Искусственный интеллект».

По информации издания, министерство цифрового развития России выступает оператором передачи данных и разработало два типа соглашений — для государственных органов и для физических и юридических лиц. В документах определены задачи информационного обмена, сроки передачи данных, период использования информации, а также гарантии целевого использования наборов данных.

Соглашения будут заключаться с региональными ведомствами и подведомственными организациями, занимающимися внедрением искусственного интеллекта в своих субъектах. Правительства Тюменской и Липецкой областей уже направили запросы на предоставление наборов данных.[2]

Российские ученые обучили нейросеть обучили исправлять ошибки квантовых компьютеров

Исследователи Университета МИСИС создали систему на основе нейросетей, которая учится находить и исправлять погрешности в квантовых вычислениях. Разработка сочетает плюсы интеллектуальных и классических алгоритмов, поэтому эффективнее распознаёт ошибки, возникающие при увеличении количества кубитов — «строительных блоков» квантовых процессоров. Об этом университет сообщил 14 февраля 2025 года. Подробнее здесь.

2024

Российские ученые создали нейросети для обнаружения сгенерированных ИИ вставок в научных текстах

Команда исследователей с участием Александра Ширнина из НИУ ВШЭ создала две модели для обнаружения в научных текстах частей, сгенерированных искусственным интеллектом. В системе AIpom соединены два типа моделей — декодер и энкодер, что позволяет ей эффективнее находить сгенерированные вставки. Система Papilusion подходит для распознания исправлений с помощью синонимов и кратких пересказов, сгенерированных нейросетью, в работе она использует модели одного типа — энкодеры. В перспективе подобные модели помогут в проверке оригинальности и достоверности научных публикаций. Об этом НИУ ВШЭ сообщила 6 декабря 2024 года. Подробнее здесь.

SteadyControl запатентовал метод непрерывного дообучения нейросетей для бизнеса

«Евразийская патентная организация» подтвердила исключительное право SteadyControl на метод непрерывного дообучения нейросетей для бизнеса. Решение подразумевает непрерывное дообучение нейросетей: эксперты повышают точность ИИ для качественного анализа бизнес-процессов. Патент действует на территории России и 7 государств ближнего зарубежья. Об этом компания сообщила 4 декабря 2024 года. Подробнее здесь.

В России создали первую в мире открытую ИИ-среду для быстрого контекстного обучения с подкреплением

29 ноября 2024 года стало известно о том, что российские ученые из лаборатории T-Bank AI Research и Института AIRI в сотрудничестве со студентами МФТИ, «Сколтеха» и Иннополиса разработали XLand-MiniGrid — первую открытую виртуальную среду для исследований в области контекстного обучения с подкреплением искусственного интеллекта. Подробнее здесь.

Минпромторг РФ закупает ИИ-серверы на 665 млн рублей для обучения нейросетей

11 ноября 2024 года ФГАУ «Федеральный центр прикладного развития искусственного интеллекта» (ФЦПР ИИ), обеспечивающий поддержку цифровой трансформации Минпромторга России, объявил конкурс по закупке серверного и телекоммуникационного оборудования для обучения нейросетей. Начальная стоимость контракта составляет около 665 млн рублей. Подробнее здесь.

Представлена нейросеть Pixtral Large c поисковиком, которая мощнее GPT-4

В середине ноября 2024 года французский стартап Mistral представил нейросеть Pixtral Large, способную конкурировать с GPT-4. Нейросеть на основе бесплатного чат-бота Le Chat способна генерировать изображения, проводить веб-поиск и служить интерактивным «холстом». Подробнее здесь.

В России создана технология, которая позволяет сократить время обучения нейросетей в 15-20 раз

9 сентября 2024 года компания Cognitive Pilot сообщила о разработке технологии, позволяющей автоматически исправлять ошибки нейронных сетей и оптимизировать эффективность обучения до 40%. Разработанную технологию в компании в шутку назвали Cognitive Neural Network Hospital, за ее способность «вылечивать больные места» нейронной сети. Например, при добавлении в обучающую выборку новых данных по дорожным светофорам, благодаря Cognitive Neural Network Hospital точность распознавания удалось оптимизировать сразу с 99,3% до 99,99%. Технология также позволяет сократить время обучения (с учетом отбора данных) в 15 – 20 раз. Подробнее здесь.

В России выпустили технологию ReBased для работы с длинным текстом. Она поможет быстрее запускать коммерческие нейросети

Российские ученые из лаборатории T-Bank AI Research разработали новую технологию ReBased для ускоренной обработки длинных текстов искусственным интеллектом. Эта инновация позволит значительно сократить расходы на использование ИИ в обработке текстов практически без потерь в качестве, сообщили в августе 2024 года в пресс-службе Т-Банка. Подробнее здесь.

Обучение с подкреплением позволило лучше работать генеративным потоковым нейросетям

Ученые Центра ИИ и Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ применили классические алгоритмы обучения с подкреплением для настройки генеративных потоковых сетей (GFlowNets). Это позволило улучшить работу GFlowNets, которые применяются уже три года для решения сложнейших научных задач на этапах моделирования, генерации гипотез и экспериментального проектирования. Об этом НИУ ВШЭ сообщила 13 июня 2024 года.

«
Устройство GFlowNets можно описать на примере конструктора лего: по недостроенному объекту и набору доступных деталей модель будет пытаться предсказать, в какое место и с какой вероятностью нужно добавить деталь, чтобы по итогу мы могли с большой вероятностью собрать хороший макет машины или корабля, - сказал Никита Морозов, Стажер-исследователь Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ.
»

Обучение с подкреплением (Reinforcement Learning, RL) — одна из парадигм машинного обучения, в которой агент обучается взаимодействовать со средой с целью максимизации функции награды. Классическая модель, построенная на основе обучения с подкреплением, AlphaGo, — программа, победившая в настольную игру го профессионального игрока.

Генеративные потоковые сети и обучение с подкреплением схожи тем, что в качестве обучающего сигнала получают функцию награды. Однако GFlowNets пытается не максимизировать награду, а обучиться генерировать объекты с вероятностями, пропорциональными награде.

Ученые Центра ИИ и Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ показали, что задача обучения генеративных потоковых сетей максимально схожа с общей задачей обучения с подкреплением, а также применили специализированные методы обучения с подкреплением для генерации дискретных объектов, например молекулярных графов.

«
Мы показали, что классические алгоритмы обучения с подкреплением применительно к GFlowNets работают сравнимо и даже эффективнее известных современных подходов, разработанных специально для обучения этих моделей. Так, в рамках задачи моделирования молекул лекарств с заданными свойствами за время обучения нашего метода было сгенерировано на 30% больше высококачественных молекул, чем у существующих методов, - отметил Алексей Наумов, научный руководитель Центра ИИ, директор по фундаментальным исследованиям Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ.
»

Исследователи подчеркивают, что использование существующих методов обучения с подкреплением для обучения GFlowNet напрямую, без дополнительной адаптации этих методов, позволит ускорить прогресс развития новых методов в медицинской химии, материаловедении, энергетике, биотехнологиях и во многих других областях, где GFlowNet нашли применение за три года существования.

Исследование поддержано грантом для исследовательских центров в области искусственного интеллекта, предоставленным Аналитическим центром при Правительстве РФ.

Ученые научили искусственный интеллект обрабатывать последовательности длиной в два миллиона токенов

Группа российских ученых из Московского физико-технического института, Института искусственного интеллекта AIRI и Лондонского института математических наук предложила метод для обработки больших данных. Он позволяет искусственному интеллекту генерировать ответы на вопросы объемом до 2 миллионов токенов. Об этом МФТИ сообщил 31 мая 2024 года.

Предложенный метод основан на особом механизме использования языковых моделей (алгоритмов для предсказания слова, знака или фразы на основе контекста). Такие модели лежат в основе современных диалоговых систем, поисковых сервисов и голосовых помощников.

При этом их программную часть составляют трансформеры — универсальные архитектуры, которые помогают выстроить правильный порядок действий при обработке запроса и генерации ответа. В частности, трансформеры позволяют нейросетям выполнять множество задач одновременно, что ускоряет их работу.

«
Однако модели, которые используют стандартные трансформеры, не могут обрабатывать длинные тексты. Их скорость быстро падает, когда размер текста увеличивается. В результате нейросети приходят к пределам возможностей, выдают «галлюцинации» или ошибочные ответы, — объяснил проблему один из авторов научной работы, программист-разработчик лаборатории нейронных систем и глубокого обучения МФТИ Айдар Булатов.
»

По его словам, чтобы обойти преграду, команда исследователей предложила добавить трансформерам «механизм памяти». Суть идеи в том, чтобы разделить длинные входные последовательности на сегменты и снабдить их дополнительными алгоритмами для резервирования информации. Эти элементы служат как бы «мостиками», по которым важные данные переносятся с предыдущего сегмента на следующий. Это позволяет языковой модели держать в «памяти» весь длинный текст на всем его протяжении. На следующем этапе программа уже может выполнять с «усвоенным» текстом различные операции, обрабатывая информацию в соответствии с запросами пользователей.

«
Сначала мы проводили эксперименты на небольших последовательностях — от 7 до 15 сегментов, в каждом из которых по 500 токенов (базовых единиц информации в языковых моделях), но заметили, что качество обработки данных при увеличении длины не падает. Тогда мы продолжили тестирование модели и дошли до миллиона, а затем — и до двух миллионов токенов. Для сравнения это объем всех книг о Гарри Поттере, — объяснил со своей стороны соавтор работы, научный сотрудник AIRI Юрий Куратов.
»

В ходе работы ученые также исследовали «интеллектуальные» способности модели, задавая ей задачи на обнаружение в длинных текстах нужных данных, на их запоминание и на «рассуждения» на основе усвоенного. При этом программа продемонстрировала не только способности удерживать в «памяти» массивы информации, но и навыки «критического мышления» и «писательского мастерства».

В дальнейшем, по мнению авторов работы, предложенный метод будет востребован для разработки быстрых нейросетевых алгоритмов для обработки больших баз данных. Например, для быстрого перевода книг, чтения программного кода, изучения геномных последовательностей или предсказания новых материалов.

Российские ученые нашли способ ускорить обучение нейросетей ориентироваться в пространстве

Исследователи из НИУ ВШЭ, НИТУ МИСИС и AIRI нашли способ эффективнее проводить обучение с подкреплением для нейросетей, заточенных на ориентацию в пространстве. С помощью механизма внимания эффективность работы графовой нейросети увеличилась на 15%. Результаты исследования опубликованы в журнале IEEE Access. Об этом 23 января 2024 года сообщили представители НИУ ВШЭ. Подробнее здесь.

2023

Российские ученые создали алгоритм, который обучает ИИ в 4 раза быстрее мировых аналогов

Ученые лаборатории исследований искусственного интеллекта (ИИ) Tinkoff Research создали алгоритм для обучения и адаптации искусственного интеллекта. По утверждению ученых, метод под названием ReBRAC (Revisited Behavior Regularized Actor Critic — пересмотренный актор-критик с контролируемым поведением) обучает ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов в области обучения с подкреплением (Reinforcement Learning, RL), адаптируя его к новым условиям на ходу. Такие результаты были получены в рамках тестирования алгоритма на робототехнических симуляторах, сообщили TAdviser 21 декабря 2023 года представители Тинькофф Банка. Подробнее здесь.

Оказалось, что нейросети не способны учиться подобно человеческому мозгу из-за отсутствия сна

В конце ноября 2023 года американские специалисты из Массачусетского технологического института (MIT) обнародовали результаты исследования, в ходе которого изучались возможности глубоких нейронных сетей в плане имитации человеческого мозга. Ученые пришли к выводу, что нейросети не способны обучаться подобно людям из-за отсутствия сна.

Основная задача глубоких нейронных сетей заключается в имитации когнитивных способностей человека. Однако из-за беспрецедентной сложности человеческого мозга возникают многочисленные трудности. В частности, искусственный интеллект использует заранее определенные параметры, из-за чего наблюдаются ограничения при обработке незнакомых или неблагоприятных сценариев.

Нейросети не способны обучаться подобно людям из-за отсутствия сна

Исследования показывают, что, хотя глубокие нейронные сети достигли значительного прогресса, им не удается в полной мере имитировать человеческий мозг. Кроме того, такие системы имеют тенденцию перезаписывать существующие данные — явление, известное как катастрофическое забывание. Этот эффект оказывает негативное влияние на скорость обучения ИИ. С другой стороны, человеческий мозг, получив новую информацию, включает ее в уже существующие знания. Мозг развивает рациональную память во время отдыха: сон позволяет формировать ассоциации между объектами и информацией, которые на первый взгляд выглядят несвязанными друг с другом.

Американские исследователи предлагают включить искусственные циклы сна в глубокие нейронные сети. Предполагается, что такой подход поможет смягчить влияние катастрофического забывания и повысит эффективность обучения ИИ-моделей. Вместе с тем, признают ученые, несмотря на прогресс, для достижения паритета с человеческими когнитивными способностями нейросетям предстоит пройти долгий путь.[3]

2020: Российские учёные научили искусственный интеллект «видеть» квантовые преимущества

Российские ученые из МФТИ, ФТИАН и ИТМО создали нейросеть, которая научилась предсказывать поведение квантовой системы, «взглянув» на схему этой системы. Об этом 16 января 2020 года МФТИ сообщил TAdviser.

Такая нейросеть самостоятельно находит те решения, которые хорошо подходят для демонстрации квантовых преимуществ. Это поможет исследователям разрабатывать эффективные квантовые компьютеры.

Большой круг задач современной науки решается на основе квантово-механических расчетов. Например, химические и биологические: исследования химических реакций или поиск устойчивых молекулярных структур для промышленности, медицины, фармацевтики и других областей.

Для точного решения такого рода «квантовых» задач хорошо подходят квантовые вычисления, в отличие от классических, на основе которых квантовые задачи решаются в большинстве случаев лишь громоздко и приближенно.

Процесс создания квантовых вычислительных схем — трудоемкое и дорогостоящее занятие. Не всегда получившиеся устройства показывают «квантовое превосходство» — демонстрируют скорость обработки информации быстрее обычного классического компьютера. Поэтому ученым хотелось бы иметь инструмент для прогнозирования того, будет ли какая-то схема обладать квантовым преимуществом или нет.

Одной из реализаций квантовых вычислений являются квантовые блуждания. Упрощенно можно представить этот метод как перемещение частицы по определенной сети, составленной из точек-узлов и соединений между этими узлами. Такие сети и образуют схему квантовой системы.

Если квантовое перемещение частицы — блуждание — из одного узла сети в другой оказывается быстрее классического, то можно говорить, что устройство на основе такой схемы показывает квантовое преимущество. Поиск сетей, обладающих квантовым преимуществом, является важной задачей, над которой работают эксперты в области квантовых блужданий.

Идеей Алексея Мельникова, Леонида Федичкина и Александра Алоджанца было заменить эксперта машинным интеллектом: научить компьютер различать сети и давать ответ на вопрос, в каких сетях квантовые блуждания будут давать преимущество. То есть обнаружить сети на основе которых имеет смысл строить квантовый компьютер.

Исследователи взяли нейросеть, которая «специализировалась» на распознавании изображений. На вход программе подавалась матрица смежности сети и номер входного и выходного узла. На выходе нейросеть давала ответ, будет ли квантовое блуждание между этими узлами быстрее классического.

«
Было неочевидно, что этот подход сработает, Но он работает, и мы очень успешно научили компьютер самостоятельно предсказывать квантовое преимущество в сетях сложной структуры,
говорит Леонид Федичкин, доцент кафедры теоретической физики МФТИ
»

«
Грань между квантовым и классическим поведением систем зачастую размыта. Изюминкой нашей работы стало создание особого компьютерного зрения, с помощью которого удалось увидеть эту грань в пространстве сетей,
поясняет Алексей Мельников, научный сотрудник ИТМО
»

Исследователи создали инструмент, позволяющий упростить разработку вычислительных схем на основе квантовых алгоритмов, основными приложениями которых должны стать биофотоника и материаловедение.

Например, с помощью квантовых блужданий легко описывается возбуждение фоточувствительных белков, таких как родопсин или хлорофилл. Белок — это в каком-то смысле сложная молекула, похожая на сеть. Задача понять, что произойдет с электроном, попавшим в какую-то точку в молекуле, как он будет двигаться и какое возбуждение вызывает, в переводе на формальный язык и есть поиск времени блуждания из одного узла сети в другой.

Ожидается, что расчет естественных природных процессов на квантовых блужданиях реализовать проще, чем на архитектуре из кубитов и гейтов, так как сами блуждания — это естественный физический процесс.

Примечания