KazLLM (большая языковая модель)

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: КаР-Тел (Beeline Казахстан), ISSAI (Институт умных систем и искусственного интеллекта)
Отрасли: Информационные технологии
Технологии: Речевые технологии

Содержание

2026: Выпуск языковой модели

В Казахстане разработана большая языковая модель KazLLM, которая доступна широкому кругу пользователей, включая научное сообщество, стартапы и крупные корпорации. С характеристиками решения TAdviser ознакомился в середине февраля 2026 года.

KazLLM разработана специалистами Института умных систем и искусственного интеллекта (ISSAI) в составе Nazarbayev University (Назарбаев Университет) при поддержке и координации Министерства цифрового развития, инноваций и аэрокосмической промышленности и Министерства науки и высшего образования Республики Казахстан.

Казахстан выпустил национальную большую языковую модель KazLLM

Созданы две версии KazLLM — с 8 млрд (8B) и 70 млрд (70B) параметров: обе основаны на архитектуре Llama. Окончательный набор данных для обучения содержал более 150 млрд токенов на казахском, русском, английском и турецком языках. Информация собрана из общедоступных источников, включая казахские веб-сайты, новостные статьи и онлайн-библиотеки. Кроме того, высококачественный контент на английском языке был переведен на казахский язык. Использованы также данные, предоставленные различными организациями. Ключевыми партнерами в создании национальной языковой модели стали Beeline Казахстан и его ИТ-компания QazCode.

Обучение выполнялось на серверах, построенных на платформе NVIDIA DGX H100. Команда ISSAI создала 4-битные квантизированные версии моделей, которые менее требовательны к объему памяти и вычислительным ресурсам. Такие варианты KazLLM подходят для развертывания в средах с ограниченной мощностью — например, могут применяться на ноутбуках и рабочих станциях.Российский рынок BPM-систем: оценки, лидеры, тренды и перспективы. Обзор TAdviser 22.4 т

Модель KazLLM предназначена для обработки, анализа и генерации текстов на казахском языке. Она способна выполнять широкий спектр задач: от перевода и обработки документов до автоматизации общения. KazLLM может стать основой чат-ботов, систем поддержки клиентов, платформ анализа данных и пр.[1]

2024: Работа по созданию ИИ-модели

В Казахстане началась работа над созданием национальной модели искусственного интеллекта под названием KAZ-LLM. Об этом стало известно в августе 2024 года. Этот проект реализуется научной рабочей группой под руководством Института умных систем и искусственного интеллекта (ISSAI) при Назарбаев Университете, с целью преодоления языкового разрыва в сфере ИИ и создания технологий, адаптированных к нуждам казахстанцев.

Как пишет Profit.kz, большинство современных ИИ-моделей разработаны для языков с высоким уровнем ресурсов, таких как английский, испанский или русский, что ставит страны с малоресурсными языками в невыгодное положение. KAZ-LLM станет первой крупной языковой моделью в Казахстане, охватывающей казахский, русский и английский языки. Это позволит жителям Казахстана использовать передовые цифровые технологии на своем родном языке, а также обеспечит доступ к национальным и культурным особенностям, заложенным в основу модели.

В Казахстане создается национальная ИИ-модель KAZ-LLM

Важным партнером в этом проекте выступает компания Beeline Казахстан и её дочерняя ИТ-компания QazCode. В 2023 году Beeline уже запустила и опубликовала в открытом доступе модель Kaz-RoBERTA-conversational, которая используется для обслуживания клиентов на цифровых платформах. Теперь Beeline и QazCode обеспечивают проект KAZ-LLM необходимой инфраструктурой, включая облачные вычислительные мощности объемом 8 DGX H100, что позволило значительно увеличить объем тренировочных данных и возможности обучения модели.

KAZ-LLM будет играть ключевую роль в сохранении национального культурного наследия, охватывая исторический контекст, специализированные области и разговорные данные, характерные для Казахстана. Проект также направлен на развитие передовых специалистов в области генеративного ИИ, что способствует укреплению научного потенциала страны.[2]

Примечания



СМ. ТАКЖЕ (3)


Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (48)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (40)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (29)
  SteadyControl (19)
  Naumen (Наумен консалтинг) (16)
  Другие (258)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Другие (28)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Авантелеком (3)
  Другие (39)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (8)
  Сбербанк (6)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  ОБИТ (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Другие (30)

  Группа компаний ЦРТ (Центр речевых технологий) (1)
  Сбер Бизнес Софт (1)
  Сбербанк (1)
  ТелеМедХаб (1)
  Другие (0)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (18, 50)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (6, 41)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (13, 32)
  Сбербанк (24, 24)
  SteadyControl HoReCa (1, 24)
  Другие (499, 298)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  SteadyControl HoReCa (1, 7)
  SteadyControl (1, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 6)
  Другие (18, 29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Сбербанк (3, 5)
  SteadyControl HoReCa (1, 5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  SteadyControl (1, 5)
  Другие (29, 47)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 8)
  Сбербанк (2, 8)
  СалютДевайсы (ранее SberDevices) (2, 8)
  Яндекс (Yandex) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4, 4)
  Другие (25, 31)

  СалютДевайсы (ранее SberDevices) (2, 2)
  Сбербанк (2, 2)
  ТелеМедХаб (1, 1)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  МТТ VoiceBox - 24
  SteadyControl Система контроля и управления персоналом - 24
  BSS Digital2Speech - 21
  Сбер: GigaChat (ГигаЧат) - 17
  EXpress Защищенный корпоративный мессенджер - 16
  Другие 275

  МТТ VoiceBox - 9
  SteadyControl Система контроля и управления персоналом - 7
  EXpress Защищенный корпоративный мессенджер - 6
  BSS Digital2Speech - 5
  SmartLogger II - 4
  Другие 22

  SteadyControl Система контроля и управления персоналом - 5
  EXpress Защищенный корпоративный мессенджер - 5
  BSS Digital2Speech - 4
  Napoleon IT отзывы - 3
  Сбер: GigaChat (ГигаЧат) - 3
  Другие 38

  Сбер: GigaChat (ГигаЧат) - 7
  МТС Exolve Виртуальная АТС - 6
  YandexGPT - 4
  VS Robotics: VS Робот-оператор - 3
  EXpress Защищенный корпоративный мессенджер - 3
  Другие 28

  LazyDoc Программный комплекс для заполнения и анализа медицинской документации - 1
  ЦРТ: SpeechXplore ИИ-решение для исследования и развития коммуникаций с клиентами - 1
  Сбер: GigaChat (ГигаЧат) - 1
  Другие 0