Inteligencia artificial de Facebook traduce entre 100 idiomas distintos

0
11

Con los últimos avances, la traducción entre los distintos idiomas es más acertada por parte de los ordenadores, con opciones como Google Translate o DeepL, que tienen en cuenta no solo el significado literal de una palabra, sino también el contexto en el que están las oraciones y fragmetnos de texto. Facebook, para colaborar en este ámbito, ha desarrollado una inteligencia artificial que comprende 100 idiomas distintos. A cambio de Google Translate, no necesita llevar a cabo pasos intermedios como el de traducir al inglés.

La inteligencia artificial llamada M2M-100 de Facebook puede traducir entre cualquier par de los 100 idiomas con los que ha sido entrenada. Por ahora su uso va a estar limitado a la investigación y el modelo de hecho pasa a ser de código abierto. En un futuro, si sigue mejorando, buscarán implementarlo en productos de Facebook.

Facebook en su desarrollo ha tomado un camino algo diferente al tradicional. Traduce de manera directa de un idioma a otro aunque ninguno de los dos sea el inglés, que era el paso intermedio que siempre se cogía. Así se puede perder menos significado en el proceso de traducción, al ser más directo.

Google Translate u otros traductores normalmente primero traducen un texto al inglés si es algo más complejo. Por ejemplo si queremos traducir este artículo del español al vietnamita lo más probable es que el traductor primero lo traduzca al inglés y el resultado lo traduzca al vietnamita, enseñándole al usuario directamente el resultado final. ¿Por qué? Porque puede hacer asociaciones entre el inglés y el español y el inglés y el vietnamita más fácil que entre el español y el vietnamita.

Los investigadores de Facebook entrenaron a M2M-100 con un total de 7.500 millones de pares de oraciones extraídas a lo largo y ancho de Internet. Una herramienta externa identificó el idioma de cada oración y posteriormente las clasificó. A partir de ahí una herramienta de Facebook se puso a emparejar oraciones para hacer coincidirlas por su significado.

Para el emparejamiento el programa agrupaba idiomas que tenían más posibilidades de requerir una traducción entre ellos. Factores como la región geográfica, las similitudes lingüísticas o el valor histórico fueron decisivos. Por ejemplo tenía más sentido emparejar y buscar similitudes entre español y catalán que español y maorí, porque es mucho más probable que los usuarios quieran traducir entre catalán y español que entre español y maorí.

En principio este nuevo traductor de Facebook debería devolver resultados más rápidos y sobre todo más precisos en la traducción. Lo sabremos con el tiempo, si finalmente llega a productos finales para el consumidor.

Fuente: Xataka