ByteDance lancerer OmniHuman-1 AI-videogenerator, der skaber ultrarealistiske videoer fra ethvert foto

Det kinesiske firma ByteDance, der er moderselskab for TikTok, har annonceret en ny ramme for kunstig intelligens kaldet OmniHuman-1. Dette værktøj kan konvertere et enkelt billede og en lydoptagelse til en realistisk video med præcise ansigts- og kropsbevægelser.
Her er, hvad vi ved
OmniHuman-1 bruger data-mixing-teknologi, som gør det muligt at skabe mere realistiske videoer sammenlignet med andre modeller. ByteDance-forskere sagde, at udviklingen af OmniHuman-1 involverede træning på 19.000 timers optagelser, hvilket forbedrede kvaliteten af de genererede videoer betydeligt.
Værktøjet understøtter billeder i alle størrelsesforhold, hvad enten det er portrætter eller billeder i fuld længde. OmniHuman-1 kan generere realistiske håndbevægelser, ansigtsudtryk og kropsbevægelser, hvilket gør det ideelt til generering af virtual reality-billeder, undervisningsvideoer og andre formål. Et eksempel på en sådan generering med et foto af Albert Einstein kan ses nedenfor.
OmniHuman-1 er stadig i forskningsfasen, men dens potentiale vækker allerede stor interesse. Når det bliver tilgængeligt for offentligheden, vil det konkurrere med andre værktøjer som Sora og Veo fra henholdsvis OpenAI og Google.
Kilde: omnihuman