Україна створює національну мовну модель на базі відкритого фреймворку Google Gemma
Україна розробляє велику мовну модель (LLM) з використанням відкритого фреймворку Google Gemma, що дозволить оптимізувати обробку україномовних текстів та посилити технологічну незалежність країни.
В межах проекту зібрано дані з понад 90 державних установ, включаючи судові реєстри, освітні видавництва та регіональні архіви. Навчання моделі розпочнеться на обчислювальній інфраструктурі Google, після чого вона буде переведена на українські сервери. Команда українських розробників планує удосконалити токенайзер для покращення обробки українських текстів, провести навчання на спеціально зібраних матеріалах та створити тести для налаштування моделі під специфічні сценарії використання.
Зокрема, мовна модель має важливе військове значення: штучний інтелект інтегрують у системи управління на полі бою та моніторингу противника. При цьому китайські моделі, такі як DeepSeek та Qwen, були відкинуті з міркувань безпеки. Експерти відзначають, що поточні AI-системи недостатньо добре обробляють місцеві діалекти, що є додатковою причиною для створення національної моделі. Для контролю якості створено чотири дорадчі комітети, які відповідають за технічні, юридичні, культурні та мовні аспекти.
Цей проект є частиною ширшої стратегії України щодо підвищення технологічної незалежності та безпеки даних країни. У листопаді 2025 року було запущено ще одну ініціативу спільно з NVIDIA для розвитку державної ШІ-інфраструктури. Продовженням стала платформа AI Factory, яка базується на рішеннях NVIDIA.
| Партнер проекту | |
| Кількість держустанов-джерел | 90+ |
| Фаза запуску | Інфраструктура Google |
| Сфери застосування | Військове управління, моніторинг |




