
El euskera, la lengua vasca, está al borde de la desaparición en el ámbito digital. Las autoridades de España y el País Vasco han decidido unir fuerzas para evitar que se pierda en el mundo tecnológico. En los próximos tres años, se destinarán 10,5 millones de euros al desarrollo del euskera en el campo de la inteligencia artificial. Esta iniciativa busca no solo preservar el idioma, sino también hacerlo relevante en los servicios digitales modernos.
Como parte del acuerdo firmado por representantes de ambos gobiernos, se creará un gran corpus lingüístico. Su objetivo es proporcionar a desarrolladores y empresas los datos necesarios para incorporar el euskera en asistentes de voz, traductores y otros sistemas inteligentes. Esta medida pretende servir de ejemplo para apoyar a otras lenguas minoritarias que también corren el riesgo de desaparecer del mundo digital.
Corpus del euskera: cómo se crea la base digital de la lengua
El proyecto contempla la recopilación y procesamiento de un enorme volumen de grabaciones de audio y textos en euskera. Esta información será cuidadosamente etiquetada y utilizada para entrenar algoritmos de aprendizaje automático. Como resultado, surgirán nuevos sistemas de reconocimiento de voz, traducción automática y asistentes virtuales capaces de comprender y comunicarse en euskera.
El trabajo para crear el corpus se realizará por etapas. En el proyecto participan no solo organismos públicos, sino también empresas privadas y organizaciones académicas, incluida la academia lingüística Euskaltzaindia. Más adelante, todos los avances estarán disponibles para empresas, la sociedad y plataformas europeas de código abierto.
Financiación y críticas: quién y cómo apoya el proyecto
El País Vasco destinará cinco millones de euros a la puesta en marcha de la iniciativa en dos años, además de fondos adicionales de otros departamentos. El gobierno español aportará el resto de la financiación. Sin embargo, no han faltado las críticas: algunos expertos consideran que el proyecto no ha tenido suficiente en cuenta la opinión de los principales centros de tecnologías lingüísticas, como el centro de investigación Hitz y el clúster Langune.
A pesar de ello, el objetivo sigue siendo el mismo: crear una infraestructura digital sostenible para el euskera y otras lenguas minoritarias. Se presta especial atención al desarrollo de modelos lingüísticos capaces de competir con los equivalentes en inglés y garantizar una sólida presencia del vasco en el entorno digital.
ALIA y nuevos horizontes para las lenguas de España
En el marco de la estrategia nacional de inteligencia artificial, avanza el proyecto ALIA, un modelo lingüístico de gran escala que abarca no solo el español, sino también el catalán, gallego, valenciano y euskera. Se han destinado 10 millones de euros para el desarrollo de ALIA, y se prevé ampliar el corpus lingüístico hasta cuatro billones de palabras. Como fuentes se emplean documentos oficiales y publicaciones científicas.
El Ministerio de Transformación Digital presta especial atención a la protección de los derechos de autor en el uso de textos para entrenar modelos. Sin embargo, parte del material se obtuvo sin el pago de regalías, lo que permite la legislación vigente siempre y cuando los derechos no hayan sido especificados por sus titulares.
El futuro de las lenguas minoritarias en la era digital
Aún no está claro si se firmarán acuerdos similares para otras lenguas de España, como el gallego o el catalán. Sin embargo, la experiencia con el euskera puede ser un punto de partida para programas a gran escala destinados a preservar la diversidad lingüística en el entorno digital. Las autoridades subrayan que la apertura y accesibilidad de los nuevos modelos lingüísticos serán clave para su integración exitosa en la vida cotidiana.
En los próximos años, el euskera tendrá la oportunidad no solo de sobrevivir, sino también de ocupar un lugar relevante entre las lenguas activamente utilizadas en las tecnologías modernas. Este es un paso importante para preservar el patrimonio cultural y desarrollar una sociedad digital en España.












