De vertaalsector is een van de eerste gebieden waar de revolutie van kunstmatige intelligentietechnologie wordt toegepast. Grote techbedrijven zoals Google hebben al online tekstvertaaldiensten ontwikkeld, maar nu is het tijd voor automatische spraakvertalingen. Meta, het moederbedrijf van Facebook, Instagram, Threads en WhatsApp, heeft een AI-model ontwikkeld dat spraak direct van de ene taal naar de andere kan vertalen.
Tot nu toe waren de meeste machine learning-vertaalsystemen tekstgeoriënteerd of omvatten ze meerdere stappen zoals spraakherkenning, tekst-naar-tekstvertaling en tekst-naar-spraakconversie. Echter, de taaldekking van bestaande spraak-naar-spraak-modellen bleef achter bij die van tekst-naar-tekst-modellen.
Om deze beperkingen aan te pakken, heeft het nieuwe model, genaamd SEAMLESSM4T, directe vertalingen voor maximaal 101 talen uitgevoerd. Dit model opent de deur naar snelle vertalingen en kan spraak-naar-spraakvertalingen uitvoeren voor 101 talen en vertalen naar 36 talen, spraak-naar-tekstvertaling voor 101 talen naar 96 talen, tekst-naar-spraakvertaling voor 96 talen naar 36 talen, tekst-naar-tekstvertaling voor 96 talen en automatische spraakherkenning voor 96 talen. Volgens het onderzoeksteam vertaalt SEAMLESSM4T voor spraak-naar-spraakvertaling met tot 23% meer nauwkeurigheid dan bestaande systemen.
Tanel Alume, universitair hoofddocent aan de Technische Universiteit van Tallinn in Estland, benadrukt dat de grootste verdienste van dit model is dat alle gegevens en code om de technologie uit te voeren en te optimaliseren openbaar beschikbaar zijn. Hij erkent echter dat er nog steeds obstakels zijn, zoals de beperkte vertaling van talen of moeilijkheden bij het vertalen van gesprekken op rumoerige plaatsen of tussen mensen met sterke accenten, wat menselijke vertalers beter kunnen.
Alison Keneke, assistent-professor bij de afdeling Computerwetenschappen aan de Cornell University in de VS, is onder de indruk van de inspanningen van de onderzoekers om giftige, schadelijke of aanstootgevende taal die vertalingen kunnen introduceren te kwantificeren en eventuele gendervooroordelen die het model kan voortbrengen bij vertalingen te onderzoeken. Hij benadrukt dat hoewel spraaktechnologieën efficiënter en kosteneffectiever kunnen zijn bij het transcriberen en vertalen dan mensen, het van cruciaal belang is om te begrijpen op welke manieren deze technologieën tekortschieten en mogelijk bevooroordeeld zijn.
Het onderzoeksteam achter SEAMLESSM4T heeft dus een belangrijke stap gezet in de ontwikkeling van spraakvertalingstechnologie. Het model biedt een brede dekking van talen en een aanzienlijke verbetering van de nauwkeurigheid ten opzichte van bestaande systemen. Dit opent nieuwe mogelijkheden voor snelle en efficiënte communicatie over taalgrenzen heen.