Украина создает национальную языковую модель на базе открытого фреймворка Google Gemma
Украина разрабатывает большую языковую модель (LLM) с использованием открытого фреймворка Google Gemma, что позволит оптимизировать обработку украиноязычных текстов и усилить технологическую независимость страны.
В рамках проекта собраны данные из более чем 90 государственных учреждений, включая судебные реестры, образовательные издательства и региональные архивы. Обучение модели начнется на вычислительной инфраструктуре Google, после чего она будет перенесена на украинские серверы. Команда украинских разработчиков планирует усовершенствовать токенайзер для улучшения обработки украинских текстов, провести обучение на специально собранных материалах и создать тесты для настройки модели под специфические сценарии использования.
В частности, языковая модель имеет важное военное значение: искусственный интеллект интегрируют в системы управления на поле боя и мониторинга противника. При этом китайские модели, такие как DeepSeek и Qwen, были отклонены по соображениям безопасности. Эксперты отмечают, что текущие AI-системы недостаточно хорошо обрабатывают местные диалекты, что является дополнительной причиной для создания национальной модели. Для контроля качества создано четыре совещательных комитета, которые отвечают за технические, юридические, культурные и языковые аспекты.
Этот проект является частью более широкой стратегии Украины по повышению технологической независимости и безопасности данных страны. В ноябре 2025 года была запущена ещё одна инициатива совместно с NVIDIA для развития государственной AI-инфраструктуры. Продолжением стала платформа AI Factory, основанная на решениях NVIDIA.
| Партнер проекта | |
| Количество госучреждений-источников | 90+ |
| Фаза запуска | Инфраструктура Google |
| Сферы применения | Военное управление, мониторинг |




