Российские ученые AIRI создали открытую систему для быстрой разработки ИИ

kirilljsx

Российские ученые из Института искусственного интеллекта AIRI выпустили открытую систему KernelEvo. Она автоматически генерирует и оптимизирует GPU-ядра для нейронных сетей. Это удешевляет и ускоряет разработку ИИ, особенно когда мощное оборудование в дефиците.

Система решает проблему высоких затрат на вычисления. Разработчики тратят меньше времени на ручную оптимизацию кода. Теперь любой может скачать инструмент и интегрировать его в свои проекты бесплатно.

Что такое KernelEvo и зачем она нужна

KernelEvo - это фреймворк от AIRI, который использует ИИ для создания оптимизированного кода GPU-ядер. GPU-ядра - это специализированные блоки кода, выполняемые на графических процессорах для ускорения вычислений в нейросетях. Обычно их пишут вручную эксперты, что занимает недели и требует глубоких знаний.

Система работает на основе эволюционных алгоритмов: генерирует тысячи вариантов кода, тестирует их и выбирает лучшие. Это автоматизирует процесс, снижая зависимость от редких специалистов. В результате код ускоряется в 1.5-2 раза, что напрямую уменьшает стоимость обучения моделей. Гендиректор AIRI Иван Оселедец отметил, что такой подход позволяет конкурировать эффективностью, а не только мощностью железа.

Команды часто начинают проекты с нуля, создавая свои библиотеки, потому что универсальные - вроде CUDA или cuDNN - не всегда оптимальны под задачу. KernelEvo упрощает это: берет базовый код и улучшает его автоматически. Пример: для матричного умножения система нашла вариант, работающий быстрее стандартных библиотек на 30-50%.

Автоматическая генерация: ИИ создает варианты ядер из простого описания задачи.
Оптимизация под hardware: Учитывает специфику конкретного GPU, включая ограничения российских серверов.
Повторное использование: Готовые ядра можно применять в разных проектах, экономя время.
Масштабируемость: Работает с кластерами, где эффект от ускорения умножается на тысячи задач.

Подход	Время на оптимизацию	Стоимость	Экспертиза
Ручная разработка	2-4 недели	Высокая	Высокая
Универсальные библиотеки	1-2 дня	Средняя	Средняя
KernelEvo	Часы	Низкая	Низкая

Как работает генерация GPU-ядер

Процесс начинается с описания операции - например, свертка в CNN или attention в трансформере. Система эволюционирует код: мутирует инструкции, меняет порядок операций, добавляет параллелизм. Каждый вариант компилируется и тестируется на реальном GPU.

За часы она проходит миллионы итераций, отбирая топ по скорости и потреблению памяти. Это особенно полезно в России, где доступ к топовым GPU вроде H100 ограничен. Оптимизированный код позволяет запускать большие модели на старом железе - A100 или даже V100. Пример из AIRI: ускорение ключевой операции в 1.8 раза сократило время обучения модели на 40%.

Важный нюанс: система не заменяет библиотеки вроде PyTorch, а дополняет их - генерирует кастомные ядра для bottleneck-операций. Разработчики интегрируют их через простые API. Тестирование показало стабильность: ядра работают на NVIDIA и AMD GPU без доработок.

Опишите задачу в конфиге (матричное умножение, размер тензоров).
Запустите эволюцию - укажите бюджет времени или итераций.
Получите оптимизированный PTX-код или бинарник.
Интегрируйте в модель и протестируйте.

Преимущество: В кластерах из 100 GPU эффект - миллионы сэкономленных часов вычислений ежегодно.

Преимущества для разработчиков ИИ

Открытый доступ делает KernelEvo доступной для всех - от стартапов до корпораций. Лицензия позволяет модифицировать и коммерциализировать. В условиях дефицита GPU это спасение: модели квантуются, дистиллируются, а теперь еще и код оптимизируется автоматически.

Реальные кейсы: в промышленных проектах сократили размер модели в 20 раз с сохранением точности, но KernelEvo добавит скорость поверх этого. Команды масштабируют без найма дорогих low-level инженеров. Для фронтенда и бэкенда ИИ - инференс ускоряется, снижая latency в сервисах.

Сравним с альтернативами:

Инструмент	Автоматизация	Скорость генерации	Open-source
KernelEvo (AIRI)	Полная	Часы	Да
TVM	Частичная	Дни	Да
Manual tuning	Нет	Недели	-

Экономия бюджета: Меньше затрат на облако или hardware.
Быстрее релизы: Эксперименты в разы короче.
Гибкость: Подстраивается под любые тензоры и операции.

Перспективы оптимизации в ИИ

KernelEvo - шаг к интеллектуальной автоматизации всего стека ИИ. Дальше AIRI планирует расширить на CPU и TPU, добавить поддержку квантовых вычислений. Останется подумать, как интегрировать с новыми моделями вроде Mixture-of-Experts.

Это открывает двери для hybrid-систем: обучение в облаке, инференс локально. В 2026 году, с ростом регуляций, такие инструменты помогут соблюдать ГОСТ и ФЗ-152 без потери производительности. Стоит поэкспериментировать - код уже на GitHub.