¿Qué es el proyecto LEIA y qué significa la firma de su convenio?

  • TECNOLOGÍAS

LEIA logo

El proyecto LEIA (Lengua Española e Inteligencia Artificial), fue suscrito este abril por la Secretaría de Estado mediante un acuerdo con la RAE que garantiza el desarrollo de recursos técnicos y documentales para mejorar el uso del español en la Inteligencia Artificial. Microsoft, Twitter o Google son algunas de las compañías que incluirán esta propuesta en sus futuros algoritmos. Para Santiago Muñoz Machado, presidente de la Academia, el acuerdo es fundamental "para que las máquinas no nos impongan su jerga". La vicepresidenta primera, Nadia Calviño, defiende la necesidad de "tener una orientación estratégica ante un proyecto de digitalización que afecta a nuestras vidas desde todos los puntos de vista: social, empresarial, política o personal”.

Hace tres años, el Gobierno central presentó LEIA, el proyecto Lengua Española e Inteligencia Artificial que tiene como fin principal cuidar el uso de un correcto español en los medios tecnológicos y así evitar que se pierda la unidad que permite que más de 585 millones de personas puedan comunicarse en nuestro idioma sin dificultades. En ese tiempo, este PERTE (Proyectos estratégicos para la recuperación y transformación económica) tan particular ha encontrado no pocos retos hasta su acuerdo final, suscrito el pasado 7 de abril por la RAE y la Secretaría de Estado.
 
Un proyecto que nació, según el director de la RAE, Santiago Muñoz Machado, "de la preocupación que nos provocó el crecimiento del número de máquinas que hablaban dependiendo del criterio de su fabricante y la cultura de su empresa”. "Hasta ahora, nos ha bastado con un diccionario, una ortografía y una gramática, pero las máquinas no nos entienden, así que tuvimos que plantearnos hacer algo para evitar lo que hemos evitado durante 300 años: que cada cual hable español como le parezca", aseguró en el acto de la firma.
 
La vicepresidenta primera del Gobierno y ministra de Economía, Nadia Calviño, también estuvo allí, y refrendó la audacia de LEIA, "un proyecto visionario que viene a cuestionar la utilización del español dentro de una Inteligencia Artificial". "Sabíamos que era fundamental tener una orientación estratégica ante un proyecto de digitalización que afecta a nuestras vidas desde todos los puntos de vista: social, empresarial, político o personal", aclaró.
 

Para la ministra, LEIA entra de lleno en la propuesta de una "digitalización humanista que defiende el Gobierno". Una transformación "que pone a la persona en el centro y garantiza la protección de nuestros derechos y nuestros valores". "Queremos que la IA nos entienda y que no aumente los sesgos que ya hay en sociedad. Una Inteligencia Artificial que piense, en definitiva, como lo hacen los ciudadanos: en español y las lenguas cooficiales".
 
Unas lenguas cooficiales tan importantes en este proyecto como los acentos y las particularidades del español de América, como recordó Machado, para quien "la máquina ha de hablar buen castellano de Castilla y buen castellano de Méjico, pues si un rasgo caracteriza a nuestra lengua es su pluralidad". 
 
No parece casual, entonces, que la presentación en sociedad de LEIA, hace tres años, tuviera lugar en el XVI Congreso de la ASALE, la Asociación de Academias de la Lengua Española. Por si hubiera dudas, el presidente de la RAE las despejó: "No podemos perder los acentos ni los sonidos del español. Las máquinas los deben respetar. Deben respetar las particularidades léxicas de cada lugar en el que se habla castellano".
 
La RAE, pues, como la canalizadora de la naturaleza plural de la lengua castellana y, por tanto, la fuente de alimento de las inteligencias artificiales que usen oficialmente el idioma. Un propósito que "requería a la fuerza hablar con los fabricantes tecnológicos para pedirles que se atuvieran a las reglas de la Academia". "El convenio firmado en abril con la Secretaría del Estado ayudará mucho en este sentido", aseveró Machado. 
 
 
El director de la Academia aseguró que "la negociación no ha sido fácil", pero que empresas tan importantes como Microsoft ya han incluido la propuesta como una de sus herramientas. "También Bing, y se está estudiando en Google y Android, con lo que podemos confiar en acabar con unos sesgos provocados por algoritmos y correctores automáticos que, en ocasiones, han hecho descender el uso de palabras en español hasta un 80%", recordó.
 
"No pueden ser las máquinas las que decidan cómo se debe hablar nuestro idioma. Por eso vamos a anunciar pronto un acuerdo con Twitter, y también estamos trabajando con META. Es muy importante que, cuando el metaverso sea una realidad, nosotros ya estemos allí. De hecho, creo que ése es el final de este proyecto. Un final aún muy lejano", confesó.
 
Machado definió toda esta operación como "los albores de la destrucción de Babel", pues "dentro de poco no será muy importante aprender una lengua: bastará con hablarle a la máquina". "Precisamente por eso es tan importante que éstas hablen nuestra lengua como nosotros decimos que se debe hablar. Lo contrario es dejar a las máquinas gestionar por sí mismas el idioma, lo que nos acabaría por obligar a adaptarnos a su jerga. No podemos permitir que nos expulsen las máquinas", sentenció.
 
Para lograr esta supremacía de lo humano sobre lo artificial, LEIA se erige sobre cinco ejes:
 
1. Desarrollo de un gran corpus lingüístico.
2. IA en español que impulse la i+d.
3. Ciencia en castellano.
4. Aprendizaje del español y en español.
5. Industrias culturales. 
 
"Cinco pilares que sólo pueden ser realidad con la colaboración público-privada", como recordó Nadia Calviño. No en vano, se prevé una inversión de 1.100 millones de euros. "Juntos conseguiremos impulsar esta oportunidad única, llena de retos, sí, pero también una ocasión para el surgimiento de nuevos modos de vida que, en nuestra opinión, deben redundar en una España más justa y mejor".
 
Los desarrolladores encargados de la construcción de esa España más digna serán los encargados de generar recursos lingüísticos, herramientas y modelos para ponerlos a disposición de centros de investigación, compañías y usuarios de manera abierta, accesible y en formatos adecuados para su uso y reutilización, lo que generará una importante transferencia de conocimiento a la economía. 
 
 
Esas empresas tienen múltiples actividades previstas, como la creación de un sello digital de la RAE que certifique que las herramientas tecnológicas y la IA usan el español de una manera apropiada. Para ello, se proporcionarán documentales para mejorar el uso del idioma en la Inteligencia Artificial, al mismo tiempo que se usará esta tecnología para perfeccionar el empleo del castellano y su procesamiento automático. 
 
La RAE también tiene prevista la creación de un observatorio de neologismos y tecnicismos donde, por medio de IA, se recopilen automáticamente este tipo de palabras en tiempo real. Y es que, la lengua es cada vez más importante en herramientas como chatbots, asistentes virtuales, traducción simultánea o comprensión lectora. 
 
Con los desarrollos y resultados que se obtengan gracias a la ejecución de este convenio, se beneficiará a toda la comunidad hispanohablante, constituida por 591 millones de personas (el 7,5% de la población mundial), que hacen del castellano el tercer idioma más empleado en Internet, después del inglés y del chino.