OpenAI har tilføjet talegenkendelse, billedgenkendelse og tekststemme til ChatGPT

Af : Bohdan Kaminskyi | 25.09.2023, 17:29

OpenAI

OpenAI har annonceret en større opdatering af chatbotten ChatGPT, som søger gennem billeder, talegenkendelse og tekstdubbing.

Her er, hvad vi ved

Talegenkendelse giver dig mulighed for at stille et spørgsmål til en chatbot ved hjælp af din stemme. Til dette formål bruger ChatGPT Whisper, en open source-model, som OpenAI har udviklet.

Tekst-til-tale-konverteringen er den nye models ansvar, og virksomheden siger, at den kan generere en "menneskelignende stemme" ud fra blot et par sekunders taleprøver. Der er i øjeblikket fem stemmevarianter at vælge imellem.

Billedsøgning giver dig mulighed for at tage et billede af en genstand af interesse og sende det til ChatGPT. Chatbotten vil forsøge at forstå anmodningen og svare i overensstemmelse hermed.

Du kan også bruge et tegneværktøj i appen til at pege på en bestemt del af et billede.

OpenAI anerkender de potentielle risici ved de nye funktioner. Virksomheden tillader ikke, at ChatGPT behandler folks fotos eller besvarer spørgsmål om dem.

De nye funktioner vil være tilgængelige for ChatGPT Plus Enterprise-abonnenter inden for to uger. Senere vil virksomheden åbne op for adgang til dem for alle, der ønsker at bruge dem.

Kilde: OpenAI: OpenAI