DeepMind har afsløret en AI-agent, der er i stand til at udføre opgaver i ukendte 3D-spil

Af : Bohdan Kaminskyi | 14.03.2024, 17:01

Google DeepMind

Google DeepMind har demonstreret en ny kunstig intelligens-agent kaldet SIMA (Scalable Instructable Multiworld Agent), der kan forstå og udføre opgaver i 3D-spil baseret på instruktioner i naturligt sprog.

Her er, hvad vi ved

DeepMinds nye udvikling er den første, der viser AI'ens evne til at følge kommandoer i en bred vifte af spilverdener og miljøer, den ikke tidligere har mødt. Ni kommercielle spil blev brugt til at træne SIMA, herunder No Man's Sky, Teardown, Valheim og Goat Simulator 3.

Forskerne registrerede spillernes tastatur- og musehandlinger for at træne SIMA i at opfatte instruktioner i naturligt sprog og styre spilfiguren derefter. Agenten kan udføre opgaver af varierende kompleksitet, fra navigation til interaktion med objekter og brugergrænsefladen.

SIMA's AI-model træningsproces

I tests demonstrerede SIMA sin evne til effektivt at generalisere sin erfaring i nogle spil til andre ukendte miljøer. Dens præstation i ukendte spil var næsten den samme som en agent, der var trænet specifikt i disse spil.

SIMA's AI-model testresultater

Sproglige instruktioner fra brugeren er dog nødvendige for, at SIMA kan præstere optimalt. Uden dem opførte agenten sig usammenhængende og kaotisk.

DeepMind ser et stort potentiale i at skabe universelle sprogdrevne AI-agenter baseret på SIMA. I fremtiden forventer virksomheden at udvikle systemer, der sikkert kan udføre en bred vifte af opgaver baseret på menneskelige instruktioner i virtuelle og virkelige miljøer.

Kilde: Engadget: Engadget