DeepSeek lancerer en forbedret version af V3 AI tre måneder efter den første udgivelse

Kinesiske DeepSeek har udgivet en opdateret version af sin store sproglige kunstige intelligens, DeepSeek-V3-0324, blot tre måneder efter lanceringen af den første V3-version i december 2024.
Her er, hvad vi ved
Den nye model har forbedret ydeevne og kapacitet, herunder oprettelse af æstetisk tiltalende websider og rapporter af høj kvalitet på kinesisk.
DeepSeek-V3-0324 har tiltrukket sig opmærksomhed for sine reducerede hardwarekrav til træning, hurtigere træningstid og lavere API-omkostninger med høj ydeevne sammenlignet med konkurrenter som OpenAI's GPT.

DeepSeeks ydeevne. Illustration: DeepSeek
Den opdaterede model involverer ikke tænkning, hvilket gør det muligt for den at give svar hurtigt uden at dvæle ved komplekse opgaver, i modsætning til DeepSeek R1-modellen. Den nye version har en parameterstørrelse på 685 milliarder, hvilket gør den til en af de største offentligt tilgængelige sprogmodeller.
DeepSeek-V3-0324 scorede fra 5,3 % til 19,8 % højere i AI-tests sammenlignet med den tidligere version. Med hensyn til ydeevne er den tæt på ledere som GPT-4.5 og Claude Sonnet 3.7.
Derudover har den opdaterede version vist forbedringer i oprettelsen af websider samt i søgning, skrivning og oversættelse af tekster på kinesisk.
For at teste den fulde version af modellen skal brugerne have mindst 700 GB ledig diskplads og flere Nvidia A100/H100 GPU'er. Der findes dog også forenklede versioner af modellen, som kan køre på en enkelt GPU, f.eks. en Nvidia 3090.
Kilde: DeepSeek