"Paradigmeskift" inden for robotteknologi: Alter3-robot kombineret med GPT-4: Nu kan den tage selfies og spille på en imaginær guitar og programmeres med stemmen i stedet for komplekse kommandoer.
Et hold forskere fra University of Tokyo var i stand til at opbygge et link mellem den store sprogmodel GPT-4 og Alter3-robotten, så de kunne udføre mere menneskelignende bevægelser og programmere robotten i naturligt sprog og opgive de traditionelle hardwareafhængige kontrolsystemer. Projektforfatterne kalder dette fremskridt for et "paradigmeskift" inden for robotteknologi.
Alter3 er den seneste version af den humanoide robot, som første gang blev taget i brug i 2016. Den er i stand til at udføre komplekse bevægelser med overkroppen, herunder detaljerede ansigtsudtryk, og har 43 akser, der efterligner bevægelserne i det menneskelige muskuloskeletale system. Den hviler på en base, men kan ikke gå (selvom den kan simulere at gå). Ved hjælp af GPT-4 lærte forskerne robotten at udføre forskellige simulationer, såsom at tage en selfie, kaste en bold, spise popcorn og spille på en imaginær guitar. Tidligere krævede disse aktiviteter, at der blev kodet specifikke instruktioner for hver handling, men med GPT-4 kan robotter lære almindelige taleinstruktioner.
Forskerne siger, at "direkte kontrol nu er mulig ved at overføre de sproglige udtryk for menneskelige handlinger til robotkroppen gennem softwarekode. Det giver større muligheder for menneske-robot-samarbejde. Med dette gennembrud inden for robotteknologi kan vi forvente mere intelligente, adaptive og personlige robotenheder. Alter3-robotten har et indbygget kamera, der gør det muligt for den at "se" mennesker og forbedre sin adfærd ved at observere deres reaktioner.
Ved at bruge sprogmodeller i robotforskningen forenkler forskerne i høj grad processen med at koordinere de mange led i en robot ved at give verbale instruktioner, beskrive bevægelsesmuligheder og få fat i den softwarekode, der starter robottens motor. Det eliminerer den kedelige opgave med at programmere hver enkelt bevægelse for 43 akser og giver forskerne mulighed for at omkonfigurere og forfine robottens bevægelser hurtigere, mere smidigt og mere præcist over tid.
Forskerne har også tilføjet lidt humor til Alter3's aktiviteter. I et scenarie demonstrerer robotten, at den spiser en pose popcorn, men så viser det sig, at popcornene tilhører en person, der sidder ved siden af den. Robottens ansigtsudtryk og håndbevægelser udtrykker overraskelse og skam.
Kilde: techxplore.com