Українська архівна служба надала 10 терабайтів даних для мовної моделі "Сяйво"
Державна архівна служба України передала 10 терабайтів даних для розвитку національної мовної моделі "Сяйво". Це перший подібний випадок, що знаменує початок нової ери у розвитку українських цифрових сервісів.
Передача включає історичні джерела, рукописи, державні документи, закони, судові рішення, медіаматеріали та словники, обсяг яких еквівалентний 70 тисячам книжок.
Ініціатива ставить за мету усунути проблеми, пов’язані з перекладом відповідей англійською, які надають глобальні ШІ-помічники. Для створення мовної моделі залучено понад 50 партнерів, серед яких медіа, університети та бібліотеки. Їхній повний перелік планується оприлюднити після запуску моделі.
Основою для навчання LLM стала модель Gemma 3 від Google, адаптована під українську мову та національний контекст. Валерія Коваль, заступниця міністра цифрової трансформації, наголошує на тому, що "Сяйво" сприятиме автоматизації державних послуг, покращенню їх якості та прийняттю оборонних рішень. Відкрите бета-тестування заплановано на кінець весни, з початковим доступом для державних інституцій та науковців.
| Обсяг даних | 10 терабайтів |
| Еквівалент у книжках | 70 тисяч |
| Партнери | Більше 50 |
| Основа LLM | Gemma 3 від Google |
| Дата бета-тестування | Кінець весни |




