Google I/O 2024: Gemini-æraen inden for søgning - AI vil skabe tegninger, videoer og musik og advare om telefonsvindlere
Af : Viktor Tsyrfa | 15.05.2024, 10:21
På den aktuelle Google I/O-konference viste søgegiganten, at den ikke har tænkt sig at opgive sit lederskab inden for introduktionen af kunstig intelligens. AI vil blive tættere integreret i Google Fotos, Google Camera, Gmail, søgning og andre apps, og Gemini vil blive den primære personlige assistent, som man kan kommunikere med via tekst, stemme og kamera.
Google I/O 2024: højdepunkter
- Gemini bliver nu den førende assistent i Android. Intet nyt om Google-assistentens skæbne, men vi kender alle Googles vaner.
- Billedgenerering - ifølge den detaljerede beskrivelse vil Gemini skabe billeder af selv ikke-eksisterende objekter. Du kan også lave smukke billedtekster.
- Videogenerering efter beskrivelse. Videoen kan forlænges til den ønskede varighed. Et meget lovende værktøj for bloggere til at få gratis tematiske videoindsatser.
- Music AI Sandbox - et værktøj til at generere en musikeksempel ud fra en tekstbeskrivelse eller til at behandle input-lydsporet.
- Google Foto vil nu analysere den fulde kontekst for fotos. Det bliver ikke kun muligt at søge på billeder ud fra beskrivelsen af, hvad der er taget på dem, men også at foretage tematiske valg, f.eks. fremskridt fra træning i løbet af året osv.
- API Gemini 1.5 Pro er en sprogmodel, der vil give 1 million tokens til at behandle forespørgsler, huske samtalehistorik og tage højde for den største kontekst blandt konkurrenterne. Antallet af tilgængelige tokens vil blive fordoblet i løbet af sommeren. Gemini 1.5 Flash - Hurtig AI-API til resultater i næsten realtid.
- AI til læring vil systematisere og forklare læringsmateriale, herunder hverdagseksempler.
- Circle to search - den chip, der blev annonceret i Galaxy S24 Ultra, og som derefter fandt vej til Google Pixel, vil snart være at finde på alle Android-smartphones. Som en påmindelse er det nok at sætte en cirkel om et objekt på skærmen, for at Google kan afgøre, hvad der præcist er afbildet der, og starte en søgning efter det objekt.
- Dybdegående kontekstanalyse. Hvis du f.eks. beder Gemini om at arrangere en rejse, vil den ikke kun købe en billet, men også foreslå et sted at overnatte og tjekke vejrudsigten. Eller når du bestiller sko, vil den være i stand til at justere din størrelse ud fra din Gmail-korrespondance.
- Gemini kan ikke kun spørges via tekst eller stemme, men også via kamera. I demonstrationsvideoen forklarede Gemini, hvad objektet i billedet gjorde, analyserede softwarekode undervejs og forklarede, hvad den gjorde, løste gåder og huskede, hvor det objekt, der blev set i billedet før, var.
- Gemini-æraen for søgning. Ikke alene vil søgninger straks producere AI-genererede uddrag og svar, søgninger vil nu være i stand til at lave planer og opgaver. Du vil kunne indtaste komplekse forespørgsler, og så vil Gemini planlægge en rute, tjekke et etablissements rating eller oprette en menu for ugen, hvis det er nødvendigt, og straks lave en liste over indkøb og steder, hvor de skal foretages.
- Gmail vil nu give en oversigt over e-mails, og det vil være muligt at kombinere flere e-mails og lave en oversigt over e-mails sammen. AI vil også kunne svare alle afsendere af disse e-mails, tilføje opgaver til din kalender eller endda oprette en Google Sheets-tabel med alle de lignende tilbud, der er kommet med posten.
- Til teamwork vil Gemini analysere alle dine arbejdschats, søge og analysere oplysninger i dem og svare de rigtige kolleger, selv hvis du ikke ved, i hvilken chat den rigtige diskussion finder sted.
- Gemini kan få tilsendt en PDF-fil på op til 1500 sider til analyse og bede om en kort oversættelse. Eller en video på op til 1 time, og Gemini vil analysere alle fragmenterne og om nødvendigt vise præcis det segment, som brugeren har brug for.
- Gemini kan spørges, hvorfor en bestemt mekanisme ikke virker, f.eks. en DJ-pult eller et kamera, og AI'en giver et svar på, hvordan den kan repareres. For at gøre dette genkender AI'en mekanismen i rammen, dens model, den handling, brugeren forsøger at udføre, bruger disse data til at foretage en søgning, analyserer den og udtrækker præcis de nødvendige oplysninger.
- AI for programmører genererer kode i henhold til beskrivelsen af opgaven, opretter en database med fotos af objekter og søger efter fejl.
- Beskyttelse mod falske opkald. AI analyserer dine samtaler i realtid, og hvis samtalepartneren opfører sig mistænkeligt, f.eks. beder om dine bankoplysninger, vil den udsende et lydsignal og en advarsel om mulig svindel.
- Den kunstige intelligens vil understøtte 35 sprog og vil have det største kontekstuelle vindue af alle konkurrenter.
I år reagerede Sundar Pichai på humoren omkring sidste års Google I/O-præsentation og kom straks med den statistik, at akronymet "AI" blev sagt 120 gange i løbet af den næsten to timer lange præsentation. Og så en gang til.
Kilde: Google I/O