Baum AI

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Baum Inform (Баум-Информ)
Технологии: Big Data,  Data Mining

Основные статьи:

Как работают российские AI-решения для разных отраслей. Обзор комплекса BAUM AI

Любой информационный след, который оставляет оборудование, человек или система, можно фиксировать и сохранять. Эта информация представляет ценность, т.к. чаще всего искусственный интеллект обучается на исторических данных. Чем длиннее «хвост» данных, тем больше точность ИИ при решении задач. Компания «Баум-Информ» разработала программно-технический комплекс BAUM AI, который может стать основой для быстрых вычислений и инструментом для решения сложных задач заказчика.

Комплекс BAUM AI может стать основой для быстрых вычислений и инструментом для решения сложных задач заказчика

Что собой представляет BAUM AI

Это симбиоз систем хранения данных, вычислительных процессоров Nvidia (в планах — совместимость с процессорами «Модуль» и IVA) и софта собственной разработки. Комплекс позволяет создавать, обучать или использовать предобученные модели искусственного интеллекта без необходимости прямого кодирования по принципу drag n drop. BAUM AI оснащен интуитивно-понятным графическим интерфейсов (GUI).Догнать и перегнать: Российские ВКС прирастают новыми функциями 8.9 т

Наталия Софронова, руководитель направления импортозамещения оборудования ИТ-компании Крок:

«
Особенность решения в том, что его аппаратная часть может размещаться на ИТ-оборудовании российского производства. А это значит, что программно-аппаратный комплекс будет полностью удовлетворять требованиям регуляторов в области импортозамещения электроники, и его можно использовать в ходе модернизации инфраструктуры как отечественный продукт. По кодам классификации решение полностью закрывает потребности как в аппаратной части из реестра Минпромторга, так и в программном обеспечении из реестра Минцифры.
»

Какие задачи решает BAUM AI

Многие крупные корпоративные заказчики работают с двумя источниками данных — открытыми и закрытыми. К первым относится информация из интернета, полученная с помощью краулинга и парсинга. Например, научные публикации, патентная система, корпоративные сайты компаний и т.д. Закрытые данные находятся внутри доверенного периметра (корпоративная переписка, архивные чертежи, технологические карты и т.д.).

Благодаря BAUM AI заказчик может в пару кликов обратиться к данным и собрать свою модель искусственного интеллекта, провести ее обучение, верификацию и тестирование. Контроль версионности MLops поможет в навигации по моделям или в их доработке. Сбор блок-схем моделей и процессов происходит в нотации BPMN 2.0.

Андрей Гантимуров, CTO (Chief technology officer) «Баум-Информ»:

«
Должен констатировать, что технологии искусственного интеллекта уже стали обыденностью. Они позволяют анализировать любые типы данных, помогая принимать решения даже в ситуации неопределенности. Их применяют в бизнес-процессах любой сложности и любого уровня: от проектирования и производства до логистики и продвижения. Запросы на решения различных задач поступают от моторостроителей и металлургов до патентоведов и архивистов.
»

Как BAUM AI помогает промышленным предприятиям

На предприятиях теплосетей, чтобы исключить внеплановую остановку в случае подозрения на неисправность оборудования (турбин, компрессоров, генераторов, котлов и др), нужна система мониторинга. Она предоставляет предиктивную аналитику для точной оценки фактического и прогнозируемого состояния оборудования. Это необходимо, чтобы минимизировать издержки и возможные риски. Ведь, согласно исследованиям, час простоя в промышленном производстве может стоить предприятию в среднем $100 тысяч.

Система предиктивной аналитики на базе комплекса BAUM AI позволяет выполнять интеллектуальный мониторинг, сравнивать фактические показатели оборудования с математической цифровой или эталонной моделью, находить аномалии и определять вероятность выхода из строя.

Разработка системы включает в себя общение со специалистами, создание многомерной модели базы данных (логи оборудования, информация о плановых и внеплановых работах, выходе из строя и т.д.), формирование математических и цифровых эталонных моделей работы оборудования. Затем идет разработка модуля интеллектуальной обработки данных и моделей предиктивной аналитики, настройка протоколов обмена данными между всеми единицами системы.

Все модели упаковываются в блок-схемы BPMN 2.0, для пользователей настраиваются динамические Dashboard (рабочие пространства). Профильные инженеры получают доступ к логам оборудования, они могут использовать готовые модели машинного обучения и прогнозировать внештатные ситуации, принимать взвешенные решения при внеплановых остановках.

Помощь научно-производственным компаниям

Крупные научно-производственные предприятия должны быть в курсе последних трендов, знать новые перспективные материалы. Также необходимо хранить архивные документы, чертежи, технологические карты, корпоративную переписку. В этом случае компаниям требуется база знаний, которая включает в себя структурированные и неструктурированные данные из открытых и закрытых источников.

All-in-one решение BAUM AI помогает обрабатывать большие данные. Комплекс устанавливается на территории заказчика. Решение интегрируется с корпоративной поисковой системой elasticsearch, чтобы после запроса к базе знаний пользователь сразу получал доступ к продвинутой аналитике.

Как реализуется проект: готовятся модели машинного обучения и обучаются нейронные сети для определения устойчивых научных кластеров, трендов, лидеров исследований, вероятностей получения патентов, окупаемости изобретения, анализа источников информации и авторов, сравнения текущих технологических процессов и вновь создаваемых и т.д.

Как итог: пользователи BAUM AI могут работать в трех плоскостях — интеллектуальная научная «разведка», продвинутая аналитика данных, решение узкоспециализированных задач, связанных с подбором и анализом материалов и их актуальности.

Помощь телекому

Производители систем хранения данных часто сталкиваются с поломкой дисков. Нужно решение, которое на ранней стадии спрогнозирует выход из строя или критическое состояние элементов системы.

BAUM AI способна определять сценарии, которые предшествуют выходу из строя, а также прогнозировать ключевые параметры. При этом могут быть сформированы рекомендации по профилактическим работам.

Для начала специалисты «Баум-Информ» вместе с инженерами формируют перечень анализируемых данных. Затем организуют дополнительный учет планового и внепланового обслуживания с созданием временных меток для каждого события.

Учет всех показателей системы хранения у заказчика ведется в PostgreSQL. «Баум-Информ» разрабатывает и настраивает буферную зону, получающую основной пакет анализируемых показателей.

Логика работы системы предиктивной аналитики выглядит следующим образом:

  • Данные из Zabbix (public.history_log) отправляются в модуль подкачки данных. В последнем хранится необходимое количество данных для работоспособности моделей ИИ. Данные разделяются на кластеры (Hardware, Configuration, Capacity, Performance).
  • Информация отправляется в модуль обработки входных данных. Она проходит нормализацию и стандартизацию (при необходимости).
  • Модуль содержит сохраненные натренированные модели. Все они были созданы с использованием блок-схем BPMN 2.0, по принципу drag n drop. В предиктиве участвуют обученные авторегрессионные модели, рекуррентные и свёрточные нейронные сети.
  • Нормализованные данные проходят через натренированные модели (в соответствии с кластерами).
  • В случае срабатывания какого-либо сценария создается подпись, отправляется в статистику, и запускается сценарий (замена диска, рекомендация обновления и т.д).

При работе с GUI пользователь видит основную информацию о работе предиктивной системы:

  • Статистика отображает количество отработанных часов, сработавших сценариев, новых подписей и т.д. (можно подобрать наиболее важные параметры).
  • Текущее состояние дублирует основные показатели с Zabbix в части анализируемых атрибутов.
  • Прогноз отражает необходимость замены оборудования, риск выхода из строя элементов, рекомендации по установке обновления

В результате система функционирует в штатном режиме, как отдельно приложение к общей системе мониторинга СХД. Благодаря искусственному интеллекту, инженеры могут на ранней стадии приступить к минимизации рисков ущерба или выхода из строя оборудования, а также своевременно выполнить работы, связанные с безопасностью системы в целом.

Помощь финтеху

Крупные платежные системы сталкиваются с трудностями в определении мошеннических операций в транзакциях. Решение — применение модели машинного обучения, позволяющей с высокой точностью находить мошеннические транзакции.

«Баум-Информ» использует подход, связанный с созданием новых синтетических агрегированных признаков. Они позволяют увидеть мошеннические операции в гипертрофированном виде.

Специалисты компании находят главные признаки, которые характеризуют мошеннические операции, и подбирают алгоритмы машинного обучения. При разработке учитывается как обучение с учителем, когда алгоритму показывают, какие операции являются мошенническими, так и обучение без учителя, когда алгоритм обучается, не зная, как выглядят мошеннические транзакции.

В BAUM AI размещается датасет, разворачивается кластер, настраиваются spark-сессии, позволяющие выполнять распределенные вычисления. Данные проходят нормализацию, выполняется интеллектуальное заполнение пропущенных значений в транзакциях.

Для создания моделей разрабатываются блок-схемы BPMN 2.0. Далее они drag n drop методом помещаются в конструктор ИИ, обучаются, потом снимаются метрики. Совместно с представителями заказчика проводится валидация и A/B тестирование обученных моделей.

В итоге модель обеспечивает точность до 98% при определении мошеннических операций.

Андрей Гантимуров, CTO (Chief technology officer) «Баум-Информ»:

«
Мы очень прагматично смотрим на применение искусственного интеллекта в любой области. Прежде чем приступить к реализации проекта, нужно обсудить все детали, включая ожидания заказчика, чтобы понять, действительно ли для решения бизнес-задач нужен искусственный интеллект. Далее следует выдвинуть гипотезу и договориться о том, как ее проверять, и уже потом проектировать решение. И еще важно подчеркнуть: я бы не рекомендовал планировать применение конкретных концепций на перспективу более одного-двух лет. Технологии развиваются очень быстро, и быть всегда в тренде позволяет только agile-подход.
»


Наталия Софронова, руководитель направления импортозамещения оборудования ИТ-компании КРОК:

«
На внедрение полноценного решения потребуется от полугода до года, в ряде случаев чуть больше. Все, безусловно, зависит от задач, которые сильно сказываются на объемах работы. Если говорить поэтапно, то на проверку гипотезы, как правило требуется от пары недель до месяца, на разработку пилота и запуск минимально жизнеспособного продукта (MVP) - от трех месяцев до полугода.
»



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
  БизнесАвтоматика НПЦ (118)
  Инфосистемы Джет (13)
  Marketing Logic (Маркетинг Лоджик) (9)
  Сбербанк (8)
  Другие (573)

  Ростелеком (3)
  БизнесАвтоматика НПЦ (3)
  Сапиенс солюшнс (Sapiens solutions) (2)
  Сбербанк (2)
  IPavlov (Айпавлов) (2)
  Другие (48)

  БизнесАвтоматика НПЦ (13)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  Московский центр инновационных технологий в здравоохранении (2)
  Платформа больших данных (Platforma) (2)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2)
  Другие (58)

  БизнесАвтоматика НПЦ (7)
  Департамент информационных технологий Москвы (ДИТ) (3)
  Группа компаний ЦРТ (Центр речевых технологий) (2)
  Axenix (ранее Аксенчер Россия) Аксеникс (2)
  CM.Expert (АвтоЭксперт) (2)
  Другие (58)

  БизнесАвтоматика НПЦ (3)
  Университет Иннополис (2)
  Мобильные ТелеСистемы (МТС) (2)
  Ростелеком (1)
  Синара-Транспортные Машины (СТМ) (1)
  Другие (16)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (2, 236)
  БизнесАвтоматика НПЦ (2, 117)
  Oracle (12, 14)
  IBM (10, 14)
  Полиматика (Polymatica) (3, 10)
  Другие (282, 143)

  БизнесАвтоматика НПЦ (1, 3)
  Полиматика (Polymatica) (1, 2)
  Dell EMC (1, 2)
  Informatica (1, 1)
  Minit (1, 1)
  Другие (5, 5)

  БизнесАвтоматика НПЦ (1, 13)
  Сбербанк (2, 2)
  Платформа больших данных (Platforma) (1, 2)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (1, 2)
  К-Скай (K-SkAI) (1, 2)
  Другие (14, 16)

  БизнесАвтоматика НПЦ (1, 7)
  Сбербанк (2, 2)
  Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 2)
  CM.Expert (АвтоЭксперт) (1, 2)
  Другие (12, 12)

  БизнесАвтоматика НПЦ (1, 2)
  Т1 (1, 1)
  Exodrive (Экзодрайв) (1, 1)
  T1 Digital (Т1 Диджитал) (1, 1)
  Мобильные ТелеСистемы (МТС) (1, 1)
  Другие (2, 2)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Deductor - 226
  Visary BI Платформа бизнес-аналитики - 117
  Loginom Аналитическая платформа - 10
  IBM SPSS Decision Management - 10
  Polymatica Analytics Аналитическая платформа - 10
  Другие 150

  Visary BI Платформа бизнес-аналитики - 3
  EMC Greenplum Data Computing Appliance - 2
  Polymatica Analytics Аналитическая платформа - 2
  Loginom Аналитическая платформа - 1
  IBM SPSS Decision Management - 1
  Другие 5

  Visary BI Платформа бизнес-аналитики - 13
  Platforma и HFLabs: Технология безопасного метчинга данных - 2
  Webiomed - Платформа предиктивной аналитики и управления рисками в здравоохранении на основе машинного обучения - 2
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2
  Loginom Аналитическая платформа - 2
  Другие 11

  Visary BI Платформа бизнес-аналитики - 7
  CM.Expert Data Mining платформа - 2
  ЦРТ: Speech Analytics Lab - 2
  Sber Process Mining - 1
  Sitronics KT: Судовой обстановочный комплекс (СОК) - 1
  Другие 13

  Visary BI Платформа бизнес-аналитики - 2
  Napoleon IT PowerPrice - 1
  МТС DataOps Platform - 1
  Exodrive Платформа для оценки качества вождения - 1
  Сфера. Интеллектуальный анализ процессов - 1
  Другие 0

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (118)
  Большая Тройка (46)
  Умная Логистика (14)
  Доверенная среда (13)
  Инфосистемы Джет (11)
  Другие (416)

  Доверенная среда (5)
  Большая Тройка (4)
  Цифра (4)
  Ростелеком (3)
  БизнесАвтоматика НПЦ (3)
  Другие (54)

  БизнесАвтоматика НПЦ (13)
  РИР (Росатом Инфраструктурные решения) (3)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  Сбербанк (2)
  Яндекс (Yandex) (2)
  Другие (45)

  БизнесАвтоматика НПЦ (7)
  РИР (Росатом Инфраструктурные решения) (3)
  Департамент информационных технологий Москвы (ДИТ) (3)
  Яндекс.Облако (Yandex.Cloud) (2)
  Axenix (ранее Аксенчер Россия) Аксеникс (2)
  Другие (61)

  БизнесАвтоматика НПЦ (3)
  Университет Иннополис (2)
  Мобильные ТелеСистемы (МТС) (1)
  Моделирование и цифровые двойники (МЦД) (ранее CADFEM CIS, КАДФЕМ Си-Ай-Эс) (1)
  Наносемантика (Nanosemantics Lab) (1)
  Другие (19)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (2, 117)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Доверенная среда (1, 13)
  РИР (Росатом Инфраструктурные решения) (3, 8)
  Другие (246, 109)

  Доверенная среда (1, 5)
  Большая Тройка (2, 4)
  Цифра (1, 4)
  БизнесАвтоматика НПЦ (1, 3)
  Умная Логистика (2, 2)
  Другие (6, 8)

  БизнесАвтоматика НПЦ (1, 13)
  РИР (Росатом Инфраструктурные решения) (2, 3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  МегаФон (2, 1)
  Нетрика Медицина (1, 1)
  Другие (6, 6)

  БизнесАвтоматика НПЦ (1, 7)
  РИР (Росатом Инфраструктурные решения) (3, 4)
  CM.Expert (АвтоЭксперт) (1, 2)
  Датакаталог (1, 2)
  Цифра (1, 2)
  Другие (12, 12)

  БизнесАвтоматика НПЦ (1, 2)
  Rocket Group (Рокет Групп) (1, 1)
  Наносемантика (Nanosemantics Lab) (1, 1)
  Российская ассоциация экспертов рынка ритейла (1, 1)
  СПбГУ ИТМО (Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики) (1, 1)
  Другие (6, 6)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Visary BI Платформа бизнес-аналитики - 117
  Большая Тройка: АИС Редактор территориальных схем - 39
  Доверенная среда: Триафлай BI-платформа - 13
  ZIIoT Платформа для работы с промышленными данными - 8
  Oracle Big Data Appliance - 7
  Другие 116

  Доверенная среда: Триафлай BI-платформа - 5
  ZIIoT Платформа для работы с промышленными данными - 4
  Visary BI Платформа бизнес-аналитики - 3
  EMC Greenplum Data Computing Appliance - 2
  Большая Тройка: АСУ Управление отходами - 2
  Другие 10

  Visary BI Платформа бизнес-аналитики - 13
  Росатом Цифровое теплоснабжение - 2
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2
  N3.Аналитика - 1
  МегаФон: Аналитика городской среды - 1
  Другие 6

  Visary BI Платформа бизнес-аналитики - 7
  Arenadata Catalog - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  Росатом Цифровое теплоснабжение - 2
  CM.Expert Data Mining платформа - 2
  Другие 14

  Visary BI Платформа бизнес-аналитики - 2
  Rocket Group: rTIM Платформа генеративного дизайна территорий - 1
  Arenadata Catalog - 1
  Наносемантика NLab Marker - 1
  Softline Digital: RozniTech Платформа для сетевого ритейла (ранее Retailix.Ai) - 1
  Другие 3