NVIDIA har skabt en "schweizerkniv til lyd": en ny AI-model kan skabe og redigere enhver lyd baseret på tekstlige stikord

Af : Vlad Cherevko | 26.11.2024, 11:41

Nvidia har annonceret Fugatto, en innovativ lydgenerator med kunstig intelligens, der kan skabe og redigere musik, tale og lyde baseret på tekstuelle stikord.

Her er, hvad vi ved

Fugatto eller Foundational Generative Audio Transformer Opus AI-modellen, der beskrives som en "schweizerkniv til lyd", er i stand til at skabe lyd og ændre eksisterende musik-, stemme- og lydfiler baseret på tekstkommandoer. Fugatto er blevet udviklet af et internationalt team af forskere, som har forbedret dets evner til at arbejde med flere sprog og accenter.

Værktøjet kan ændre stemme ved at tilføje accenter eller ændre tone, redigere musik ved at isolere vokal, tilføje instrumenter eller udskifte melodier. Nvidia hævder, at Fugatto er trænet på millioner af lydeksempler og kan udføre en lang række opgaver uden behov for yderligere data.

Virksomheden specificerer dog ikke, hvornår eller om værktøjet vil være tilgængeligt for offentligheden. Fugatto skiller sig ud fra andre AI-værktøjer som Stability AI og OpenAI på grund af sin evne til at skabe helt nye lyde.

Kilde: NVIDIA: NVIDIA