Anthropics Claude 3 AI-model slog GPT-4 på Chatbot Arena-ranglisten

Af : Bohdan Kaminskyi | 29.03.2024, 20:26

Billede genereret ved hjælp af Microsoft Designer og DALL-E 2

Anthropics store sprogmodel Claude 3 Opus har for første gang overgået OpenAI's GPT-4 på Chatbot Arena, en populær crowdsourced rangliste, der bruges af forskere til at evaluere AI-sprogmodellers evner.

Her er, hvad vi ved

Den uafhængige forsker Simon Willison bemærkede, at det er første gang, at de bedste tilgængelige modeller, såsom Opus for kompleksitet og Haiku for effektivitet, er fra en anden leverandør end OpenAI.

Anthropics Claude 3 AI-model slog GPT-4 på Chatbot Arena-ranglisten-2

Chatbot Arenas rangliste over chatbots

Chatbot Arena administreres af Large Model Systems Organisation (LMSYS ORG) og er baseret på subjektive evalueringer fra brugere, der sammenligner output fra forskellige sprogmodeller. Denne tilgang hjælper med at overvinde vanskelighederne ved objektivt at evaluere AI-chatbots' ydeevne.

Claude 3's succes viser den voksende konkurrence inden for AI-sprogmodeller. Nogle brugere har allerede erstattet ChatGPT med Claude 3 i deres arbejdsgange, hvilket kan påvirke OpenAI's markedsandel.

OpenAI forventes dog at udgive en større ny model, efterfølgeren til GPT-4 Turbo, i løbet af i år, muligvis til sommer. Det vil sandsynligvis føre til yderligere ændringer i Chatbot Arena-ranglisten i de kommende måneder og år.

Forskere understreger vigtigheden af mangfoldighed blandt de førende leverandører på området, da det hjælper AI-sprogmodelteknologier med at udvikle sig og forbedre deres ydeevne.

Kilde: Ars Technica: Ars Technica

Kunstig intelligens