Por qué la Inteligencia Artificial ‘piensa’ en inglés y qué consecuencias puede tener para la diversidad

Abr 2, 2024

En un mundo donde la inteligencia artificial (IA) está cada vez más presente en nuestras vidas diarias, surge una cuestión intrigante y preocupante: ¿por qué los modelos de lenguaje de gran tamaño (LLM), que constituyen el núcleo de los chatbots, tienden a pensar en inglés incluso cuando interactúan en otros idiomas? Aunque el término «pensar» es una analogía, nos lleva a reflexionar sobre una peculiaridad técnica con implicaciones profundas en la comunicación global y la diversidad cultural.

Recientemente, investigadores del Instituto Federal Suizo de Tecnología de Lausana, liderados por Chris Wendler y Veniamin Veselovsky, llevaron a cabo un estudio revelador sobre cómo procesan las consultas los modelos Llama 2 de Meta. Este estudio ofrece una visión fascinante de cómo funcionan estos sistemas y los posibles sesgos que pueden manifestar.

¿Cómo Procesan los Modelos en Inglés?

Los científicos alimentaron a los modelos Llama 2 con instrucciones en chino, francés, alemán y ruso, y observaron que la mayoría de las veces, el procesamiento de las consultas pasaba por lo que denominaron el «subespacio inglés». Esto sugiere que el inglés se utiliza como un puente para comprender conceptos: los LLM traducen los conceptos a inglés para procesar la información y luego vuelven a traducir las respuestas al idioma original.

Implicaciones del Anglocentrismo

El dominio del inglés en los modelos de IA plantea preguntas sobre la diversidad y la equidad. Carissa Véliz, de la Universidad de Oxford, y Aliya Bhatia, del Centro para la Democracia & Tecnología en Washington DC, señalaron cómo esto podría reducir la diversidad cultural y superponer una visión limitada del mundo sobre regiones lingüísticas distintas.

Desafíos y Reflexiones

Si bien los modelos como Llama 2 pueden desempeñarse bien en múltiples idiomas, el riesgo de sesgo es significativo. Veselovsky destacó que la abundancia de datos de alta calidad en inglés para entrenar estos modelos puede favorecer inadvertidamente los valores culturales anglocéntricos.

¿Un Futuro Equitativo?

La implementación de un modelo LLM verdaderamente multilingüe presenta desafíos técnicos, éticos y económicos. Requiere la recopilación de datos diversificados y representativos en múltiples idiomas, así como la lucha contra los patrones de poder y privilegio.

La detección del sesgo anglocéntrico en los LLM marca un punto de inflexión en la investigación de la IA. Es fundamental que los avances tecnológicos futuros reflejen la diversidad lingüística y cultural de manera equitativa y respetuosa.


Te puede interesar


Suscríbete a nuestro boletín

Lo más leído