Det to mand store team hos Hugging Face udvikler ChatGPT-lignende AI-modeller

Af : Bohdan Kaminskyi | 09.11.2023, 21:24

Hugging Face

Startupvirksomheden Hugging Face har dannet et H4-team med to udviklere, der skal bygge chatbots baseret på open source AI-modeller.

Her er, hvad vi ved

Ifølge ingeniør Lewis Tunstall begyndte de efter udgivelsen af ChatGPT at eksperimentere med at bruge open source-biblioteker og modeller til at replikere en sådan funktionalitet. Hovedfokus for H4 er at træne modeller til at interagere med mennesker.

Teamet har allerede præsenteret flere raffinerede sprogmodeller, herunder Zephyr-7B-α og Falcon-40B. En klynge på over 1000 Nvidia A100-grafikkort bruges til at træne dem.

H4 undersøger også teknikker til modeljustering og bygger værktøjer til at teste dem.

H4 holder sig bevidst lille for at være fleksibel og tilpasse sig det hurtigt skiftende AI-landskab. Det gør de ved at samarbejde med andre Hugging Face-forskningsgrupper.

Teamet sigter mod at styrke open source AI-fællesskabet ved at frigive kode og data til at træne chatmodeller. Kommercialisering af deres arbejde er ikke et mål for H4, bemærker udviklerne.

Kilde: TechCrunch