Логотип
2025/04/11 10:41:51

HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS)

.

Хроника

2025: В России совершен прорыв в оптимизации больших языковых моделей — теперь им не нужны мощные серверы

Лаборатория исследований искусственного интеллекта Yandex Research совместно с НИУ ВШЭ, Массачусетским технологическим институтом (MIT), Австрийским институтом науки и технологий (ISTA) и Научно-технологическим университетом имени короля Абдаллы (KAUST) разработала революционный метод быстрого сжатия больших языковых моделей (LLM) без потери качества. Благодаря новой технологии для работы с нейросетями больше не требуются дорогостоящие серверы и мощные GPU — достаточно обычного смартфона или ноутбука. Об этом стало известно 11 апреля 2025 года.

Новый метод квантизации получил название HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS). Технология позволяет сжимать нейросети без использования дополнительных данных и без вычислительно сложной оптимизации параметров, что особенно ценно при недостатке подходящих данных для дообучения модели.

Российские исследователи представили прорывную технологию для ускорения работы нейросетей-гигантов

Ранее для запуска языковой модели на смартфоне или ноутбуке требовалось провести её квантизацию на дорогостоящем сервере, что занимало от нескольких часов до нескольких недель. Новый метод позволяет выполнить этот процесс прямо на телефоне или ноутбуке за считанные минуты.Российский рынок гражданских БПЛА: ключевые тренды 8.9 т

Технология HIGGS делает большие языковые модели доступнее не только для крупных компаний, но и для небольших организаций, некоммерческих лабораторий, индивидуальных разработчиков и исследователей. Это открывает новые возможности для использования LLM в различных областях, особенно там, где ресурсы ограничены — например, в образовании или социальной сфере.

Одним из ключевых преимуществ разработки является возможность сжимать даже такие гигантские модели, как DeepSeek-R1 на 671 млрд параметров и Llama 4 Maverick на 400 млрд параметров. До появления HIGGS эти модели удавалось квантовать только примитивными методами, что приводило к значительной потере качества.