Google frigiver opdateret eksperimentel version af Gemini 2.0 Flash Thinking til testning

I december annoncerede Google Gemini 2.0 Flash Thinking-modellen som den første til logisk ræsonnement, og nu er den opdaterede eksperimentelle version tilgængelig til test.
Her er, hvad vi ved
Denne model er baseret på Flash 2.0, som blev introduceret tidligere samme måned, og giver dig mulighed for at "vise dit ræsonnement tydeligt" (som i AI Studio). Det forbedrer ydeevnen, når man løser mere komplekse problemer. Den supplerer andre modeller som gemini-2.0-flash-exp og gemini-exp-1206.
Vi har også aktiveret kodeudførelse som et værktøj, så modellen kan beslutte at skrive og udføre kode under sit svar. Du kan aktivere det i sidepanelet i AI Studio!
- Jack Rae (@jack_w_rae) 21. januar 2025
Her er et sjovt eksempel, hvor modellen udregner løsningen med en formel, men skriver noget pythonkode for at nå frem til ... pic.twitter.com/j8wNp8Yn27
De vigtigste funktioner i Gemini 2.0 Flash Thinking Experimental (januar 2025)
- Kontekstuelt vindue på 1 million tokens (ud af 32k): Dette er praktisk for dem, der ønsker at "tilslutte en kodebase eller anmode om et sæt artikler med mere komplekse ræsonnementer".
- Støtte til udførelse af kode på stedet: for bedre udnyttelse af værktøjet.
- Højere output-token-generering.
- Lavere frekvens af modelafvigelser ("reduceret sandsynlighed for uoverensstemmelse mellem udtalelse og svar").
- Sammenlignet med Exp 1219 viser den nye version "bedre resultater i matematik, naturvidenskab og multimodale tests", herunder 73,3 % i AIME2024-testen (matematik) og 74,2 % i GPQA Diamond-testen (naturvidenskab).
Næste version af vores tænkemodelserie + kodeeksekvering + 1M token-kontekst! Fremskridtene med at skalere tænkning er utrolige og vil fortsætte med at iterere - tilgængelig på Google AI Studio! Der kommer mere https://t.co/OFacvvK8d9
- Sundar Pichai (@sundarpichai) 21. januar 2025
DeepMinds CEO Demis Hasabis bemærkede, at dette "repræsenterer meget hurtige fremskridt siden vores første udgivelse i december". Det blev bemærket, at de har udviklet sådanne planlægningssystemer i over et årti, startende med programmer som AlphaGo, og er glade for at se en kraftfuld kombination af disse ideer med de mest kraftfulde grundlæggende modeller.
Gemini 2.0 Flash Thinking Experimental er tilgængelig til gratis test i Google AI Studio og via API'en. Sundar Pichai bemærkede, at fremskridtene inden for skalering af ræsonnementer er imponerende og vil fortsætte, og lovede flere nyheder i fremtiden.
Kilde: 9to5Google