Un estudio advierte que el gallego es la lengua cooficial con el menor desarrollo de tecnología lingüística

Vigo TecnolóxicoActualidadUn estudio advierte que el gallego es la lengua cooficial con el menor desarrollo de tecnología lingüística

European Language Equality, un proyecto para lograr plena igualdad lingüística digital en 2030

Un equipo del Centro de Investigación en Tecnologías de Telecomunicación, atlanTTic, participará en el proyecto European Language Equality, que analiza la disponibilidad de recursos y herramientas en el campo e la tecnología lingüística de más de 70 lenguas de Europa. El estudio servirá como hoja de ruta para cambiar esta situación y alcanzar el pleno equilibrio de todas las lenguas en 2030 preparando una agenda estratégica de investigación, innovación y transferencia.

El proyecto European Language Equality (ELE), que mide y analiza el empleo de las tecnologías lingüísticas de los idiomas europeos, acaba de concluir que el gallego está a la cola en cuanto a recursos y aplicaciones se refiere respecto al resto de lenguas oficiales del estado. El proyecto está financiado por la Unión Europea y la Universidade de Vigo forma parte del consorcio al que están adheridos un total de 52 universidades, consorcios y empresas de Europa. De hecho, el Grupo de Tecnologías Multimedia (GTM), perteneciente a atlanTTic, fue el encargado de analizar la situación en cuanto a recursos, servicios y comunidades gallegohablantes. “El objetivo de ELE es analizar la adaptación tecnológica de los idiomas de Europa con en fin de que exista plena igualdad lingüística digital en 2030. Ahora, hay que hacer una hoja de ruta para cambiar esta situación. Hay mucho margen en el que trabajar, resalta Carmen García Mateo, coordinadora del grupo de investigación de atlanTTic. Como conclusión general, según el informe presentado por el centro de investigación de la UVigo, “hay pocas aplicaciones de síntesis de voz, reconocimiento de voz, corrección ortográfica y gramatical y traucción automática; por lo tanto, un vacío importante en cuanto a recursos multimedia adecuados para desarrollar aplicaciones tan importantes en el mundo actal como los agentes conversacionales por voz de última generación”. Sin embargo, el gallego, según el informe, “sí tiene buena presencia en bases de datos de texto de gran dimensión y las tecnologías y servicios basados en texto están en una fase más madura”.

Un estudio que resalta la gran brecha existente entre el gallego y el resto de lenguas en cuanto a tecnologías digitales

En el conjunto del Estado, los datos recopilados muestran una brecha considerable en comparación con otras lenguas con mayor número de hablantes, pero también con las otras lenguas cooficiales del estado español (catalán y euskera). “Esta diferencia es crítica en cuanto a recursos y servicios relacionados con datos de tipo multimedia o del ámbito de la salud, pues los existentes son pobres en diversidad y pequeños en tamaño”, señala el estudio. El mayor peligro a corto plazo es que, de no revertirse esta situación, el gallego se quede fuera de la revolución que el Big Data y la inteligencia artificial están provocando en muchos sectores estratégicos por la falta de recursos para aplicar estas tecnologías.

Como ejemplo positivo, el informe apunta al sitio web de la Radio Televisión de Galicia por la producción de contenidos multimedia. También hay un número creciente de diarios locales digitales escritos en gallego. Aunque algunas plataformas como Facebook o YouTube, o grandes empresas de software como Microsoft y Apple ofrecen una versión con soporte para el gallego en sus interfaces, muchas otras como TikTok, Twitch o Adobe, lo utilizan en beta o con menor apoyo como en el caso de Twitter. También se produce una brecha extrema de apoyo al gallego en los asistentes virtuales como Alexa, Siri, Google Assistant o Cortana. En los últimos años, continúa el informe, se desarrollaron una serie de productos y servicios destinados a la incorporación del gallego en las TIC. Ejemplos interesantes son el portal de la Real Academia Galega, el tradutor Gaio o el sitio web del Goberno galego.

Según la docente de la Escuela de Ingeniería de Telecomunicación, Carmen García Mateo, “en ese margen para cambiar esta situación en términos objetivos, nos favorece la existencia de una experimentada comunidad investigadora en Galicia en áreas como el reconocimiento automático del habla, la síntesis de voz o el procesado de lenguaje natural y, por supuesto, en áreas humanísticas como la filología o la lingüística”. La actual colaboración interdisciplinar de los investigadores de atlanTTic junto con los docentes de la Facultad de Filología y Traducción de la Universidade de Vigo ayudará a revertir esta situación. “Estamos desarrollando ya herramientas y recursos lingüísticos. Esta alianza es, en gran medida, la responsable en los últimos cuatro años de un aumento considerable de la producción de recursos y servicios de calidad para la lengua gallega”. Los investigadores también destacan en el informe la propia estrategia puesta en marcha por la Xunta de Galicia.

“Por otra parte, observamos una tendencia en las grandes empresas del sector en reducir sus esfuerzos en desarrollar tecnologías específicas para lenguas minoritarias como el gallego”. También advierten de la falta de interés por las lenguas cooficiales en general en algunas estrategias nacionales relacionadas con las tecnologías del habla como en la Estrategia de Procesamiento del Lenguaje Natural 2020 o la Estrategia Nacional de Inteligencia Artificial 2020.

“Apoyo a la producción científica y la transferencia tecnológica basada en tecnologías del habla y el lenguaje” entre las soluciones propuestas

Como propuestas de mejora, los investigadores e investigadoras de atlanTTic recomiendan, en primer lugar, “la creación de una oficina pública que custodie de manera centralizada y estandarizada todos los recursos desenvueltos para la lengua gallega ya que, en la actualidad, se encuentran diseminados en páginas web o en servidores internos de los desarrolladores haciendo complejo encontrarlos”. En segundo lugar, afirman que “es necesario investir en la creación de bases de datos de recursos lingüísticos de calidad y gran tamaño con contenido multimedia, ya sean grabaciones de audio o vídeo, que cubran las distintas variantes y estilos de la lengua hablada en el territorio gallego”. Y, en tercer lugar, “apoyar la producción científica y la transferencia tecnológica basada en tecnologías del habla y el lenguaje para que el gallego gane presencia en soluciones comerciales y sea considerado como un nicho de mercado de interés”. En cuanto a las comunidades de hablantes, “creemos indispensable que consuman y produzcan contenidos en gallego, pero también que exijan soporte para el gallego en aquellos servicios y productos que consumen regularmente (plataformas de contenido, medios digitales, aplicaciones móviles o de escritorio, sistemas operativos, etc.)” concluyen los investigadores e investigadoras de atlanTTic.

 

Fuente: atlanTTic