Ny AI-agent fra OpenAI vil kunne booke billetter, bestille mad og udføre andre opgaver på hjemmesider i stedet for brugerne

Af : Nastya Bobkova | 24.01.2025, 06:43
OpenAI præsenterer en AI-agent, der udfører handlinger på hjemmesider for dig OpenAI lancerer en AI-agent, der gør alt for brugerne på hjemmesider: klikker, indtaster tekst og endda søger efter de nødvendige oplysninger.. Nyhedskilde: OpenAI

OpenAI præsenterede en ny AI-agent Operator, som kan udføre opgaver på internettet for brugerne.

Her er, hvad vi ved

Agenten bruger sin egen browser til at surfe på nettet, klikke på knapper, indtaste tekst og scrolle gennem indhold. På den måde kan den udføre opgaver på internettet som en person, der klikker på knapper, scroller gennem sider og indtaster tekst på hjemmesider. I første omgang vil det nye produkt kun være tilgængeligt for ChatGPT Pro-abonnenter i USA.

Operatøren kører på en særlig model, der kombinerer funktionerne i GPT-4o med dybdegående træning. Det gør det muligt ikke kun at "se" sider gennem skærmbilleder, men også at interagere med grænseflader, som vi er vant til at gøre med mus og tastatur.

Det mest interessante er, at agenten ikke kun udfører opgaver, men også kan korrigere sig selv. Hvis noget går galt, giver den dig kontrol over processen. Den vil også bede om tilladelse, hvis webstedet kræver følsomme oplysninger (f.eks. adgangskoder), eller bede om dit samtykke, før den sender en e-mail.

OpenAI har indgået samarbejde med populære virksomheder som Uber, DoorDash, Instacart og andre for at sikre, at agenten udfører opgaver i den virkelige verden og samtidig overholder sikkerhedsmæssige og etiske standarder. Det er dog ikke alt, der fungerer perfekt - komplekse grænseflader som f.eks. at lave et diasshow er stadig svært for den.

I den nærmeste fremtid vil Operator være tilgængelig for brugere af Plus-, Team- og Enterprise-abonnementer, og OpenAI planlægger at integrere denne teknologi direkte i ChatGPT.

Kilde: OpenAI OpenAI