17 de enero de 2025

IA. Meta desarrolla traductor simultáneo con 101 idiomas y mayor precisión que los sistemas actuales

 La inteligencia artificial imita la voz de los interlocutores, filtra más del 40% de los ruidos y, en contra de la estrategia en redes de Zuckerberg, mitiga la “toxicidad” al moderar los mensajes violentos, de lo cual adjunto el siguiente  resumen.

Meta, la multinacional de Facebook, Instagram y WhatsApp, ha desarrollado un modelo de inteligencia artificial (IA) llamado SEAMLESSM4T, con el objetivo de mantener el liderazgo en comunicaciones personales mediante la traducción instantánea de voz a voz y texto a voz en hasta 101 idiomas.


Capacidades del Modelo SEAMLESSM4T

  • Idiomas.- Reconoce 101 idiomas; traduce a 36 en formato de voz y a 96 en texto.
  • Precisión.- Mejora la precisión de traducción entre un 8% y un 23% en comparación con sistemas existentes.
  • Filtrado de Ruido.- Capaz de filtrar ruidos de fondo entre un 42% y 66%.
  • Expresividad.- Tiene en cuenta matices en entonación y expresividad.

Mitigación de Toxicidad

  • Enfoque.- A diferencia de las redes sociales de Meta, que han eliminado la moderación de contenido, SEAMLESSM4T se centra en mitigar la toxicidad en traducciones.
  • Etox.- Herramienta desarrollada para identificar y reducir elementos tóxicos en el habla.
  • Desafío de Idiomas.- Aunque más de la mitad de la población habla unos pocos idiomas, SEAMLESSM4T intenta incorporar 101 lenguas.

Críticas y Limitaciones

  • Acceso y Reproducibilidad.- Críticas sobre la falta de acceso para investigadores independientes para reproducir o mejorar el modelo.
  • Errores de Traducción.- A pesar de su avance, el sistema todavía presenta errores y no ofrece corrección en tiempo real.
  • Dependencia de Internet.- Solo puede utilizarse a través de la API de Meta.

Opiniones de los Expertos

  • Víctor Etxebarria.- Critica la falta de cumplimiento con los principios de ciencia abierta.
  • Maite Martín.- Valora la inclusión de idiomas minoritarios y la mitigación de sesgos, aunque menciona que aún hay trabajo por hacer.
  • Andreas Kaltenbrunner.- Señala la contradicción de Meta al promover la moderación en traducción pero no en sus plataformas sociales.

CONCLUSIÓN

SEAMLESSM4T representa un avance significativo en tecnología de traducción, pero enfrenta desafíos en términos de accesibilidad, precisión y limitaciones de uso. A pesar de sus virtudes, se requiere una mayor atención a la transparencia y la inclusión en el desarrollo de tecnologías de IA.

Fuente: El Pais.com

ANEXO 1

Meta presenta una IA que nos acerca al 'traductor universal'

La tecnología de inteligencia artificial (IA) sigue avanzando a pasos agigantados, y Meta, la empresa matriz de Facebook, ha dado un paso importante hacia la creación de un dispositivo de traducción universal que hace poco tiempo habríamos calificado de 'ciencia ficción'.

Un artículo reciente publicado en Nature por su equipo FAIR (Foundational AI Research) aborda este problema al presentar un modelo de traducción automática que combina modalidades de texto y habla 101 idiomas. Para algunos, este avance (bautizado como SEAMLESSM4T, un sucesor del NLLB-200) abre la puerta a un futuro donde las barreras lingüísticas sean cosa del pasado.

Según los investigadores, la herramienta es un 23% más precisa que otros modelos de última generación en tareas de habla a habla

Un salto más allá de los sistemas convencionales

Hasta ahora, los sistemas de traducción de habla a habla (S2ST, por sus siglas en inglés) habían funcionado a través de un enfoque en cascada: primero, reconocimiento automático del habla (ASR); luego, traducción de texto a texto (T2TT); y, finalmente, conversión de texto a habla (TTS). Aunque efectivos, estos sistemas tienen limitaciones:

  • Enfoque en idiomas de altos recursos.- Los modelos tienden a ser precisos solo en idiomas con abundantes datos disponibles, dejando atrás a muchas lenguas menos comunes.
  • Limitación direccional.- Frecuentemente, se especializan en traducir al inglés... pero no desde inglés hacia otros idiomas.
  • Complejidad del sistema.- La naturaleza modular de los sistemas en cascada incrementa las posibilidades de errores acumulativos.

SEAMLESSM4T aborda estas limitaciones con un enfoque unificado, que permite la traducción directa de habla a habla (S2ST), de habla a texto (S2TT), de texto a texto (T2TT) y de texto a habla (T2ST) en 96 de los idiomas compatibles con el modelo, lo que lo convierte en uno de los sistemas más versátiles hasta la fecha.

El éxito de SeamlessM4T radica en su entrenamiento. Meta utilizó 4 millones de horas de audio multilingüe y decenas de miles de millones de frases obtenidas de repositorios públicos online. Asimismo, hizo uso de 443.000 horas de audio con textos coincidentes, como subtítulos de vídeos en internet, para mejorar aún más su capacidad de traducción.

Fuente: Genbeta.com