OpenAI har afsløret et værktøj til stemmekloning

Af : Bohdan Kaminskyi | 01.04.2024, 16:31

Mariia Shalabaieva/Unsplash

OpenAI har afsløret Voice Engine, et stemmekloningsværktøj, der i det væsentlige kan duplikere en persons tale baseret på en 15 sekunders lydprøve.

Her er, hvad vi ved

Voice Engine er baseret på en eksisterende tekst-til-tale-API og har været under udvikling siden 2022. OpenAI bruger allerede en version af dette toolkit til at arbejde med forudindstillede stemmer.

Teknologien kan finde anvendelse inden for områder som højtlæsning, oversættelse af sprog og hjælp til mennesker med talevanskeligheder. Som et eksempel beskrev OpenAI et pilotprojekt på Brown University, hvor man skabte en klon af en stemmemaskine til en patient med en taleforstyrrelse baseret på tidligere optaget lyd.

På trods af de potentielle fordele er der bekymring for, om teknologien kan misbruges til at skabe falsk lydindhold. OpenAI er derfor endnu ikke klar til en fuld offentlig udgivelse af Voice Engine og fokuserer på at løse problemerne med privatlivets fred og sikkerhed.

Virksomheden siger, at den indarbejder feedback fra partnere på tværs af forskellige brancher, herunder regering, medier og civilsamfund, for at sikre en sikker lancering af produktet. Alle deltagere i prætesten skal overholde en brugspolitik, der forbyder at udgive sig for at være en anden person uden samtykke.

OpenAI implementerer også sikkerhedsforanstaltninger som vandmærkning for at spore lydens oprindelse, proaktiv overvågning af systembrug og oprettelse af en "liste over forbudte stemmer" for at forhindre kloning af kendte personligheder.

Pris og hvornår vi kan forvente det

Præcise officielle udgivelsesdatoer og endelige priser er endnu ikke blevet annonceret. Ifølge TechCrunch kan Voice Engine komme til at koste 15 dollars pr. million tegn, hvilket gør den til en mere budgetvenlig løsning sammenlignet med konkurrenterne. En "HD"-version med en højere pris er også nævnt.

Kilde: Engadget