Meta og Microsoft frigiver Llama 2, en AI-sprogmodel til kommerciel brug
Meta og Microsoft er gået sammen om at introducere Llama 2, en ny generation af storskala sprogmodel designet til både kommercielle og forskningsmæssige formål.
Hvad vi ved
Llama 2 distribueres gratis. Ifølge Meta er modellen blevet trænet med 40 % flere data end Llama 1. Den kontekstuelle længde er blevet fordoblet.
Udgivelsen inkluderer modelvægte og kildekode, og antallet af parametre varierer fra 7 milliarder til 70 milliarder. Meta sagde, at Llama 2 overgår andre open source-sprogmodeller på mange eksterne målinger, herunder ræsonnement, kodning, færdigheder og videnstest.
Under udviklingen af Llama 2 blev der lagt mere vægt på ansvarlighed. Udviklerne har gentestet modellerne og skabt en gennemsigtighedsordning, der beskriver mulige problemer.
Derudover inkluderer de en guide til ansvarlig brug samt en politik for acceptabel brug for at forhindre misbrug såsom kriminel aktivitet, vildledende repræsentationer og spam.
Microsoft stiller modellen til rådighed via Azure AI-kataloget til brug i cloud-baserede værktøjer som f.eks. indholdsfiltrering. Værktøjet kan også køre direkte på Windows-pc'er og vil være tilgængeligt via eksterne udbydere som Amazon Web Services og Hugging Face.
Den første version af modellen var open source, men var udelukkende beregnet til akademikere og forskere. Llama 2 giver virksomheder mulighed for at tilpasse teknologien til deres egne formål, f.eks. til at skabe chatbots eller billedgeneratorer. Det giver virksomheder mulighed for at drage fordel af modellen, og tredjepartsudviklere kan teste den for bias, unøjagtighed og andre fejl.