OpenAI annoncerer ny teknologi til kloning af stemme fra 15 sekunders lyd

Af : Nastya Bobkova | 30.03.2024, 03:47

OpenAI har introduceret et nyt innovativt værktøj kaldet Voice Engine, som kan klone enhver persons stemme ud fra en lydprøve på 15 sekunder.

Her er, hvad vi ved

Voice Engine analyserer et kort lydsignal og skaber naturligt klingende tale med "følelsesmæssige og realistiske stemmer". Denne innovative teknologi, som er baseret på OpenAI's eksisterende talesyntese-API, kan være nyttig til en række formål: lydbøger, sprogoversættelse og hjælp til mennesker med taleforstyrrelser.

OpenAI anerkender de alvorlige risici ved at bruge denne teknologi, herunder muligheden for, at den misbruges af skruppelløse personer. Derfor arbejder virksomheden aktivt på at sikre privatlivets fred og sikkerhed og er ved at implementere en række foranstaltninger, såsom vandmærkning og proaktiv overvågning af systembrug.

Ifølge meddelelsen er Voice Engine stadig på preview-stadiet, men virksomheden har allerede gennemført vellykkede pilotprogrammer, der demonstrerer potentialet i Voice Engine. Previewet blev udført på Brown University, hvor funktionen blev brugt til at hjælpe patienter med talevanskeligheder.

Ifølge OpenAI vil deres Voice Engine blive implementeret, mens de indsamler feedback fra partnere og overholder en politik, der forbyder brugen af klonede stemmer uden den enkeltes samtykke. Derudover planlægger de at oprette en "liste over forbudte stemmer" for at undgå misbrug.

Hvor meget koster det?

De anslåede omkostninger ved at bruge Voice Engine er ca. 15 dollars pr. million tegn, hvilket svarer til ca. 162.500 ord.

Kilde: Engadget