„Gemini 3“ pasižymi patobulintu samprotavimu, multimodalumu ir 1 milijono žetonų kontekstiniu langu.

  • Prieinama „Gemini“ programėlėje ir kūrėjams; dirbtinio intelekto paieškos režimas paleidžiamas JAV.
  • Jis puikiai atlieka tokius testus kaip „LMArena“, „GPQA Diamond“, „ARC-AGI-2“ ir „SWE-bench Verified“.
  • „Google“ pristato „Antigravity“ platformą agentams, galintiems planuoti ir vykdyti sudėtingas užduotis.

„Gemini 3“ vaizdas iš „Google“

"Google" pateikė Dvyniai 3Jos naujos kartos dirbtinio intelekto modelis sukurtas apjungiant pažangų samprotavimą, konteksto supratimą ir multimodalines galimybes. Bendrovė jį pozicionuoja kaip iki šiol pajėgiausią savo sistemą, skirtą interpretuoti niuansus ir spręsti sudėtingas užduotis su mažiau pasikartojimų.

Pradinio diegimo metu „Gemini“ programėlė ir kūrėjo įrankiai jau integruoja šią versiją, o Dirbtinio intelekto režimas paieškoje Pirmiausia ji bus paleista Jungtinėse Valstijose. Ispanijoje ir likusioje Europos dalyje „Google“ teikia pirmenybę prieigai per programėlę, API ir debesijos paslaugas, taip pat kalbų sąrašo išplėtimui, įtraukiant katalonų, baskų ir galisų kalbas.

Ką atneša Dvyniai 3 ir kodėl tai svarbu?

„Gemini 3“ vienoje sistemoje sujungia ankstesnių kartų sukauptą patirtį ir šuolį į priekį. samprotavimas ir konteksto supratimasBendrovė teigia, kad modelis „fiksuoja subtilius užuominas“ kūrybinėse idėjose ir suskaido sudėtingas problemas į sluoksnius, pateikdamas tikslesnius atsakymus ir rečiau reikėdamas perfrazuoti užklausą.

Toks metodas leidžia gauti glaustesnius atsakymus, kuriuose pirmenybė teikiama Naudinga informacija, palyginti su klišėmisTai elgesys, kurį „Google“ testavo, siekdama sumažinti meilikavimą ir pagerinti faktinį tikslumą. Be to, modelio multimodalinis pobūdis leidžia dirbti su tekstu, vaizdais, garsu ir vaizdo įrašais toje pačioje sąveikoje.

Nepriklausomų ir lyginamųjų testų rezultatai

Remiantis „Google“ paskelbtais rodikliais ir viešais reitingais, Gemini 3 Pro Jis pirmauja LMArena egzamine su 1.501 ELO tašku, pranokdamas savo pirmtaką. Akademiniame vertinime „Humanity's Last Exam“ egzamine jis pasiekia 37,5 % balų be įrankių, o GPQA Diamond – 91,9 %; matematikoje „MathArena Apex“ egzamine jis surinko 23,4 % balų.

Sustiprintas samprotavimo būdas Gilus mąstymas Šie rezultatai dar labiau išauga – „Humanity's Last Exam“ egzamine surinko 41,0 %, o „GPQA Diamond“ – 93,8 %. ARC-AGI-2, vykdant kodą, užfiksuoja 45,1 %, o tai rodo abstraktaus mąstymo ir vaizdinio suvokimo pažangą.

Multimodalumas ir didžiulis konteksto langas „Gemini 3“

Vienas iš didžiausių pakeitimų yra kontekstinis langas 1 milijonas žetonųTai palengvina didelių kodų saugyklų, straipsnių ar ilgų vaizdo įrašų analizę. Pavyzdžiui, modelis gali išversti ir suvienodinti ranka rašytus receptus, kad būtų sukurta šeimos kulinarijos knyga, arba sudėtingas medžiagas paversti vizualizacijomis ir interaktyviomis kortelėmis.

Multimodalinis skaitymas atsispindi tokiuose testuose kaip MMMU-Pro (81 %) ir „Video-MMMU“ (87,6 %), ir „SimpleQA Verified“ (72,1 %), kur daugiausia dėmesio skiriama didesniam faktiniam tikslumui. Dirbtinio intelekto režimu, integruotu į paiešką, „Google“ moko interaktyvių elementų, tokių kaip valdikliai ir simuliacijos, akimirksniu paaiškinti sąvokas.

Programavimas ir agentai: antigravitacijos varomoji jėga

Vystymo užduotyse pirmauja Dvyniai 3 „WebDev Arena“ su 1.487 ELOJis pasiekia 54,2 % „Terminal-Bench 2.0“ teste ir 76,2 % „SWE-bench Verified“ teste, o tai reiškia didesnę kompetenciją generuojant kodą, naudojant įrankius ir valdant terminalo aplinką.

Svarbiausia nauja pastatų agentų funkcija yra „Google“ antigravitacijaŠi platforma suteikia agentams prieigą prie redaktoriaus, terminalo ir naršyklės. Naudodama tai, sistema gali planuoti ir vykdyti išsamius programinės įrangos darbo eigą, tikrindama savo kodą ir palikdama galutinę peržiūrą bei auditą kūrėjui.

Saugumas, išorinis testavimas ir atsakingas diegimas

„Google“ teigia, kad tai jos Saugiausias modelis iki šiolJis yra atsparesnis pataikavimui ir greitam įsikišimui bei netinkamam naudojimui (pvz., kibernetinėms atakoms). Šis vertinimas yra jos pasienio saugumo sistemos dalis ir jį peržiūrėjo išorės ekspertai, įskaitant Jungtinės Karalystės AISI ir tokios įmonės kaip „Apollo“, „Vaultis“ ir „Dreadnode“.

Režimas Gilus mąstymas Prieš pasiekiant „Google AI Ultra“ prenumeratorius, sistema yra papildomai patikrinama dėl savo planavimo galimybių ir įrankių naudojimo apimties. Bendrovė pabrėžia laipsnišką ir apgalvotą diegimą visuose produktuose ir regionuose.

Dvyniai 3 prieinamumas

El „Gemini 3 Pro“ apžvalga Jis pasiekiamas „Gemini“ programėlėje ir per kūrėjo API per „AI Studio“ ir „Vertex AI“. Sąsajoje pridėta 30 naujų kalbų, įskaitant Katalonų, baskų ir galisų kalbomis, o tai palengvina jo pritaikymą vietos kontekste.

El Dirbtinio intelekto režimas paieškoje Jis prasideda Jungtinėse Valstijose ir palaipsniui plėsis; tuo tarpu įmonės ir techninės komandos gali integruoti „Gemini 3“ į savo darbo eigą su „Vertex AI“ ir „Gemini Enterprise“, be naujosios komandų eilutės sąsajos ir „Antigravity“ platformos agentams.

Naudojimo atvejai: nuo geresnio mokymosi iki užduočių automatizavimo

Be pokalbių, modelis gali transformuoti sudėtingą turinį į interaktyvios patirties su grafikais, skaičiuotuvais ar modeliavimais. Tai naudinga studijuojant technines sąvokas, analizuojant sporto rungtynes ​​ir siūlant treniruočių planus arba analizuojant dokumentus ir kuriant lengvai naršomus vadovus.

Kasdieniniame darbe agentai gali klasifikuoti „Gmail“ el. laiškus, planuoti keliones arba vykdyti daugiapakopes užduotis derindami samprotavimus, įrankių iškvietimus ir naršyklės valdymą, visada prižiūrint žmogui, kad būtų išlaikyta kontrolė.

„Google“ teigia, kad „Gemini“ įtaka auga: atvyksta „DI valdomas vaizdas“ 2.000 milijonų vartotojų per mėnesį„Gemini“ programėlės atsisiuntimų skaičius viršija 650 milijonų per mėnesį, 70 % debesijos klientų naudojasi jos dirbtinio intelekto galimybėmis, o 13 milijonų kūrėjų sukūrė sprendimus, naudodami jos modelius. Šie skaičiai yra „Gemini 3“ diegimo produktų ekosistemoje pagrindas.

Dėmesys samprotavimui, multimodalumui ir agentams, Dvyniai 3 Tai tampa bendru „Google“ dirbtinio intelekto strategijos pagrindu: tiesioginė, mažiau lanksti platforma su daugiau konteksto, kurią Ispanijoje galite pradėti naudoti iš „Gemini“ programėlės, o jei ją sukursite, iš „AI Studio“ ir „Vertex AI“; dirbtinio intelekto režimo paieška bus aktyvuojama atsižvelgiant į rinką.

„Google“ dirbtinio intelekto režimas
Susijęs straipsnis:
„Google“ dirbtinio intelekto režimas atvyksta į Ispaniją: išsamus vadovas, kaip jį suprasti ir išnaudoti visas jo galimybes