Google opdaterer sine Veo- og Imagen AI-modeller for mere præcist indhold

Af : Vlad Cherevko | Opdateret 16.12.2024, 22:10

Imagen 3 i aktion: revolutionerende billedbehandlingsteknologi

Eksempler på billeder skabt af den nye Imagen 3-model. Nyhedskilde: Google

Google har annonceret en ny version af sin generative AI-model til video, Veo 2, som ifølge virksomheden nu bedre forstår den virkelige verdens fysik og menneskelige bevægelser.

Her er, hvad vi ved

Veo 2 giver brugerne mulighed for at henvise til specifikke filmgenrer, filmiske effekter og linser, når de skaber videoer. Modellen reducerer også artefakter som f.eks. ekstra fingre og forbedrer billedkvaliteten. Nedenfor ses en video, der udelukkende er skabt med Veo 2.

Google har også forbedret sin tekst-til-billede-model, Imagen 3, som nu genererer lysere og bedre sammensatte billeder og følger stikord mere præcist.

Et billede genereret af Imagen 3-modellen. Illustration: Google

Google har også tilføjet et nyt værktøj kaldet Whisk, som kombinerer funktionerne i Imagen 3 og den visuelle forståelsesmodel Gemini for at skabe unikke billeder ved at kombinere flere ideer eller objekter i en enkelt illustration.

Modellerne inkluderer et usynligt SynthID-vandmærke for at reducere sandsynligheden for misinformation. Veo 2 vil gradvist blive tilgængelig for Google Labs-brugere i USA og er nu begrænset til testere, som kan lave videoer på op til otte sekunder i 720p. Forbedringer til Imagen 3 er allerede tilgængelige for Google Labs-brugere i mere end 100 lande gennem ImageFX.

Kilde: Google: Google

Kunstig intelligens