Pubblicato il 23/05/2023
Meta ha sviluppato una serie di modelli di intelligenza artificiale per preservare le lingue in via di estinzione, che sono già in grado di coprire 4.000 lingue parlate in tutto il mondo.
I modelli vocali multilingue di massa hanno ampliato le tecnologie text-to-speech e speech-to-text da cento lingue a più di 1.100, un salto che si replica anche nell'identificazione delle lingue parlate, che raggiunge già quota 4.000, "40 volte di più di prima".
Lo afferma Meta, che lunedì ha condiviso notizie sui modelli di intelligenza artificiale in cui lavora per preservare le lingue che rischiano di scomparire. Lo scopo è che gli utenti possano accedere alle informazioni e utilizzare il proprio dispositivo nella lingua di loro preferenza.
Con questo obiettivo, ha annunciato l'apertura dei suoi modelli e codici in modo che la comunità di ricerca possa collaborare con questo compito, come affermato in una dichiarazione condivisa sul suo blog ufficiale.
Ha anche spiegato l'approccio che hanno applicato per lavorare con modelli di lingua multilingue di massa, che ha permesso il salto nel numero di lingue che supporta. Per fare questo, si sono rivolti alla Bibbia, poiché è stata tradotta in molte lingue.
Le traduzioni della Bibbia sono state utilizzate nella ricerca sulla traduzione linguistica basata su testi e sono accompagnate da letture registrate che sono disponibili pubblicamente. Da questi audio, Meta ha creato "un set di dati di letture del Nuovo Testamento in più di 1.100 lingue, che ha fornito una media di 32 ore di dati per lingua".
Per raggiungere la cifra di 4.000 lingue, hanno anche considerato "registrazioni non etichettate di altre letture religiose cristiane". Nonostante siano contenuti religiosi, l'azienda assicura che i modelli non presentino un pregiudizio per produrre un linguaggio più religioso.
L'azienda spera in futuro di espandere il numero di lingue che i modelli di lingua multilingue possono supportare e incorporare dialetti.
COMMENTI
Nessun commento dei clienti per il momento.