Elon Musks nye version af Grok AI forbedrer kodning og matematiske evner

Af : Bohdan Kaminskyi | 02.04.2024, 09:31

xAI

Elon Musk-ejede xAI har frigivet en opdateret version af sin store sprogmodel Grok-1.5 til tidlige testere. Ifølge virksomheden viser den nye version forbedrede ræsonnementer og færdigheder samt evnen til at håndtere længere kontekster.

Hvad der er kendt

Ifølge xAI overgår Grok-1.5 konkurrerende modeller som OpenAI's GPT-4, Google's Gemini Pro 1.5 og Anthropic's Claude 3 Opus i en række benchmarks relateret til matematiske opgaver og kodning.

Især Grok-1.5's resultater i MATH, GSM8K (matematik) og HumanEval (kodning) benchmarks er forbedret betydeligt sammenlignet med den tidligere version og overgik konkurrenterne, med undtagelse af Claude 3 Opus i HumanEval-testen.

Sammenligning af Grok-1.5 med andre sprogmodeller i populære benchmarks

Derudover kan den nye version af Grok behandle kontekster, der er op til 128.000 tokens lange, hvilket er 16 gange mere end den tidligere version. Det gør det muligt for modellen at kombinere information fra større kilder for at få en bedre forståelse af situationen.

På trods af de påståede fremskridt inden for matematik og kodning gav xAI ingen detaljer om Groks forbedringer på andre områder, hvor den måske stadig halter bagefter konkurrenterne.

I øjeblikket er Grok kun tilgængelig for premium-brugere af X-platformen (tidligere Twitter), der ejes af Elon Musk. Det forventes dog, at chatbotten vil blive gjort tilgængelig for almindelige X-brugere i den nærmeste fremtid.

Udgivelsen af den opdaterede version af Grok kommer midt i forventningen om den næste store opdatering af ChatGPT fra OpenAI, som lover at tilbyde mere menneskelignende interaktioner med kunstig intelligens.

Kilde: Engadget