
Баскский язык (эускера) оказался на грани исчезновения в цифровом пространстве. Власти Испании и Страны Басков решили объединить усилия, чтобы не дать ему исчезнуть из мира технологий. В ближайшие три года на развитие эускеры в сфере искусственного интеллекта будет направлено 10,5 миллионов евро. Эта инициатива призвана не только сохранить язык, но и сделать его востребованным в современных цифровых сервисах.
В рамках соглашения, подписанного представителями двух правительств, будет создан масштабный языковой корпус. Его задача — обеспечить разработчиков и компании необходимыми данными для внедрения эускеры в голосовые помощники, переводчики и другие интеллектуальные системы. Такой шаг должен стать примером для поддержки других малых языков, которые также рискуют исчезнуть из цифрового мира.
Корпус эускеры: как создают цифровую базу языка
Проект предусматривает сбор и обработку огромного массива аудиозаписей и текстов на баскском языке. Эти данные будут тщательно размечены и использованы для обучения алгоритмов машинного обучения. В результате появятся новые системы распознавания речи, автоматического перевода и виртуальные ассистенты, способные понимать и говорить на эускере.
Работа над созданием корпуса будет вестись поэтапно. В проекте участвуют не только государственные структуры, но и частные компании, а также академические организации, включая языковую академию Euskaltzaindia. В дальнейшем все наработки станут доступны для бизнеса, общества и европейских платформ с открытым исходным кодом.
Финансирование и критика: кто и как поддерживает проект
Страна Басков выделит на реализацию инициативы пять миллионов евро в течение двух лет, а также дополнительные средства из других ведомств. Испанское правительство обеспечит оставшуюся часть финансирования. Однако не обошлось без критики: некоторые эксперты считают, что в проекте недостаточно учтено мнение ведущих центров по языковым технологиям, таких как исследовательский центр Hitz и кластер Langune.
Несмотря на это, цель остается прежней — создать устойчивую цифровую инфраструктуру для эускеры и других малых языков. Особое внимание уделяется разработке языковых моделей, которые смогут конкурировать с англоязычными аналогами и обеспечат полноценное присутствие баскского языка в цифровой среде.
ALIA и новые горизонты для языков Испании
В рамках национальной стратегии искусственного интеллекта развивается проект ALIA — масштабная языковая модель, охватывающая не только испанский, но и каталонский, галисийский, валенсийский и баскский языки. На развитие ALIA выделено 10 миллионов евро, а объем языкового корпуса планируется увеличить до четырех триллионов слов. В качестве источников используются официальные документы и научные публикации.
Министерство цифровой трансформации уделяет особое внимание защите авторских прав при использовании текстов для обучения моделей. При этом часть материалов была получена без выплаты роялти, что допускается действующим законодательством, если права не были специально оговорены их владельцами.
Будущее малых языков в цифровую эпоху
Пока не ясно, будут ли аналогичные соглашения заключены для других языков Испании, таких как галисийский или каталонский. Однако опыт с эускерой может стать отправной точкой для масштабных программ по сохранению языкового разнообразия в цифровой среде. Власти подчеркивают, что открытость и доступность новых языковых моделей станут ключом к их успешному внедрению в повседневную жизнь.
В ближайшие годы баскский язык получит шанс не только выжить, но и занять достойное место среди языков, активно используемых в современных технологиях. Это важный шаг для сохранения культурного наследия и развития цифрового общества в Испании.












