Meta har opdateret SeamlessM4T AI-oversætteren og gjort den mere smidig og udtryksfuld.
Meta
Meta har afsløret den anden version af sit SeamlessM4T multimodale neurale netværk til taleoversættelse. Opdateringen gør tolkningen mere spontan og følelsesladet.
Her er, hvad vi ved
Den første nye funktion, SeamlessExpressive, bringer intonationerne fra den originale lyd ind i oversættelsen: volumen, tonehøjde, tempo, pauser osv. Det giver samtalen en mere naturlig fornemmelse.
Den anden funktion, SeamlessStreaming, starter oversættelsen, mens personen stadig taler. Det reducerer forsinkelsen til to sekunder og betyder, at man ikke behøver at vente på, at samtalepartneren afslutter sætningen.
Ifølge Meta analyserer algoritmen den del af sætningen, der allerede er blevet sagt, og beslutter, om der er nok kontekst til at starte oversættelsen.
Virksomheden har endnu ikke givet en præcis tidslinje for, hvornår de nye funktioner vil blive tilgængelige for et bredere publikum.
Gå dybere:
Kilde: Meta: Meta