Украинская архивная служба предоставила 10 терабайтов данных для языковой модели "Сяйво"
Государственная архивная служба Украины передала 10 терабайтов данных для развития национальной языковой модели "Сяйво". Это первый подобный случай, знаменующий начало новой эры в развитии украинских цифровых сервисов.
Передача включает исторические источники, рукописи, государственные документы, законы, судебные решения, медиаматериалы и словари, объем которых эквивалентен 70 тысячам книг.
Инициатива ставит целью устранить проблемы, связанные с переводом ответов на английский, которые предоставляют глобальные ИИ-помощники. Для создания языковой модели привлечено более 50 партнеров, среди которых медиа, университеты и библиотеки. Их полный список планируется обнародовать после запуска модели.
Основой для обучения LLM стала модель Gemma 3 от Google, адаптированная под украинский язык и национальный контекст. Валерия Коваль, заместитель министра цифровой трансформации, подчеркивает, что "Сяйво" будет способствовать автоматизации государственных услуг, улучшению их качества и принятию оборонных решений. Открытое бета-тестирование запланировано на конец весны, с начальным доступом для государственных институций и ученых.
| Объем данных | 10 терабайтов |
| Эквивалент в книгах | 70 тысяч |
| Партнеры | Более 50 |
| Основа LLM | Gemma 3 от Google |
| Дата бета-тестирования | Конец весны |




