OpenAI annoncerer nye o3 og o3-mini ræsonneringsmodeller, der kan tænke på menneskeligt niveau

Af : Vlad Cherevko | 20.12.2024, 21:49

OpenAI's CEO Sam Altman annoncerede nye o3- og o3-mini-modeller for kunstig intelligens på den sidste dag af 12 Days of OpenAI-eventet, som bygger på de tidligere o1-modeller. Disse modeller bruger en "privat tankekæde"-metode, der gør det muligt for dem at planlægge deres svar på forhånd, hvilket kaldes simuleret ræsonnement (SR).

Her er, hvad vi ved

o3-modellen opnåede rekordresultater i ARC-AGI-benchmarket og scorede 75,7 % under lave beregningsressourcer og 87,5 % under høje beregningsressourcer, hvilket er sammenligneligt med menneskelig præstation. o3 scorede også 96,7 % i American Invitational Maths 2024 og 87,7 % i GPQA Diamond-testen, som omfatter spørgsmål på bachelorniveau inden for biologi, fysik og kemi. I EpochAI's Frontier Math-benchmark løste o3 25,2 procent af problemerne, mens ingen anden model kom over 2 procent.

o3-mini-modellen har en adaptiv tænketidsfunktion, der tilbyder lave, mellemstore og høje behandlingshastigheder. OpenAI hævder, at højere beregningsindstillinger giver bedre resultater. Disse modeller vil kunne testes af sikkerhedsforskere. o3-mini er planlagt til at blive lanceret i slutningen af januar, og o3 vil blive lanceret kort tid efter.

Kilde: OpenAI: OpenAI