La inteligencia artificial imita la voz de los interlocutores, filtra más del 40% de los ruidos y, en contra de la estrategia en redes de Zuckerberg, mitiga la “toxicidad” al moderar los mensajes violentos, de lo cual adjunto el siguiente resumen.
Capacidades
del Modelo SEAMLESSM4T
- Idiomas.- Reconoce 101
idiomas; traduce a 36 en formato de voz y a 96 en texto.
- Precisión.- Mejora la
precisión de traducción entre un 8% y un 23% en comparación con sistemas
existentes.
- Filtrado de
Ruido.-
Capaz de filtrar ruidos de fondo entre un 42% y 66%.
- Expresividad.- Tiene en cuenta
matices en entonación y expresividad.
Mitigación
de Toxicidad
- Enfoque.- A diferencia de
las redes sociales de Meta, que han eliminado la moderación de contenido,
SEAMLESSM4T se centra en mitigar la toxicidad en traducciones.
- Etox.- Herramienta
desarrollada para identificar y reducir elementos tóxicos en el habla.
- Desafío de
Idiomas.-
Aunque más de la mitad de la población habla unos pocos idiomas,
SEAMLESSM4T intenta incorporar 101 lenguas.
Críticas
y Limitaciones
- Acceso y
Reproducibilidad.- Críticas sobre la falta de acceso para
investigadores independientes para reproducir o mejorar el modelo.
- Errores de
Traducción.-
A pesar de su avance, el sistema todavía presenta errores y no ofrece
corrección en tiempo real.
- Dependencia de
Internet.-
Solo puede utilizarse a través de la API de Meta.
Opiniones
de los Expertos
- Víctor
Etxebarria.-
Critica la falta de cumplimiento con los principios de ciencia abierta.
- Maite Martín.- Valora la
inclusión de idiomas minoritarios y la mitigación de sesgos, aunque
menciona que aún hay trabajo por hacer.
- Andreas
Kaltenbrunner.-
Señala la contradicción de Meta al promover la moderación en traducción
pero no en sus plataformas sociales.
CONCLUSIÓN
SEAMLESSM4T
representa un avance significativo en tecnología de traducción, pero enfrenta
desafíos en términos de accesibilidad, precisión y limitaciones de uso. A pesar
de sus virtudes, se requiere una mayor atención a la transparencia y la
inclusión en el desarrollo de tecnologías de IA.
Fuente:
El
Pais.com
ANEXO
1
Meta presenta una IA que
nos acerca al 'traductor universal'
La
tecnología de inteligencia artificial (IA) sigue avanzando a pasos agigantados,
y Meta, la empresa matriz de Facebook, ha dado un paso importante hacia la
creación de un dispositivo de traducción universal que hace poco tiempo
habríamos calificado de 'ciencia ficción'.
Un
artículo reciente publicado en Nature por su equipo FAIR (Foundational AI
Research) aborda este problema al presentar un modelo de traducción automática
que combina modalidades de texto y habla 101 idiomas. Para algunos, este avance
(bautizado como SEAMLESSM4T, un sucesor del NLLB-200) abre la puerta a un
futuro donde las barreras lingüísticas sean cosa del pasado.
Según
los investigadores, la herramienta es un 23% más precisa que otros modelos de
última generación en tareas de habla a habla
Un
salto más allá de los sistemas convencionales
Hasta
ahora, los sistemas de traducción de habla a habla (S2ST, por sus siglas en
inglés) habían funcionado a través de un enfoque en cascada: primero,
reconocimiento automático del habla (ASR); luego, traducción de texto a texto
(T2TT); y, finalmente, conversión de texto a habla (TTS). Aunque efectivos,
estos sistemas tienen limitaciones:
- Enfoque en idiomas de altos recursos.- Los modelos tienden a ser precisos solo en idiomas con abundantes datos disponibles, dejando atrás a muchas lenguas menos comunes.
- Limitación direccional.- Frecuentemente, se especializan en traducir al inglés... pero no desde inglés hacia otros idiomas.
- Complejidad del sistema.- La naturaleza modular de los sistemas en cascada incrementa las posibilidades de errores acumulativos.
SEAMLESSM4T
aborda estas limitaciones con un enfoque unificado, que permite la traducción
directa de habla a habla (S2ST), de habla a texto (S2TT), de texto a texto
(T2TT) y de texto a habla (T2ST) en 96 de los idiomas compatibles con el
modelo, lo que lo convierte en uno de los sistemas más versátiles hasta la
fecha.
El éxito de SeamlessM4T radica en su entrenamiento. Meta utilizó 4 millones de horas de
audio multilingüe y decenas de miles de millones de frases obtenidas de
repositorios públicos online. Asimismo, hizo uso de 443.000 horas de audio con
textos coincidentes, como subtítulos de vídeos en internet, para mejorar aún
más su capacidad de traducción.
Fuente:
Genbeta.com