„Google“ naujinimai „Gemini-exp-1121“: AI tobulinimas kodavimo, matematikos ir vizualinio supratimo srityse

Dirbtinio intelekto (DI) sritis ir toliau vystosi, o konkurencija tarp didelių kalbų modelių (LLM) išlieka intensyvi. Nepaisant pastarojo meto pažangos, stumiančios ribas, ką šie modeliai gali pasiekti, iššūkių išlieka. Vienas iš pagrindinių esamų LLM, tokių kaip GPT-4, sunkumų yra rasti tinkamą pusiausvyrą tarp bendrojo mąstymo, kodavimo gebėjimų ir vizualinio supratimo. Daugelis modelių puikiai tinka vienoje srityje, o kitose – prasčiau, todėl kūrėjams ir tyrėjams sunku rasti vieną modelį, kuris galėtų veiksmingai patenkinti įvairius poreikius. Tai sukuria neefektyvumą ir išryškina universalesnių sprendimų poreikį.

Turinys

Gemini-exp-1121: Svarbus atnaujinimas

„Google“ atnaujino „Gemini-exp-1121“, kuri 20 % lenkia GPT-4o kodavimo, matematikos ir regėjimo srityse. Gemini-exp-1121 yra naujausias eksperimentinis Google Gemini serijos AI modelių papildymas, sukurtas siekiant patenkinti augantį visapusiškos AI sistemos poreikį. Palyginti su OpenAI GPT-4o, Gemini-exp-1121 pagerėjo, ypač kodavimo, matematinio samprotavimo ir vizualinio supratimo srityse. Šis atnaujinimas yra esminė pažanga, pagerinanti „Google“ padėtį dirbtinio intelekto ekosistemoje kartu su „OpenAI“. Gemini-exp-1121 siekiama pašalinti ankstesnių LLM galimybių spragas gerinant kodavimo sklandumą, tobulinant sudėtingų problemų sprendimo gebėjimus ir tobulinant suvokimo įgūdžius.

Nuotrauka daryta 2024 m. lapkričio 22 d.: Šaltinis https://lmarena.ai/

Techniniai patobulinimai ir privalumai

Techniškai Gemini-exp-1121 yra keletas reikšmingų patobulinimų. Šie patobulinimai apima optimizuotą transformatoriaus architektūrą ir pažangius paieškos mechanizmus, kurie padidina jo mokymąsi realiojo laiko duomenimis, padeda modeliui išlikti aktualiam ir tiksliui. Kodavimo našumo pagerėjimas siejamas su išsamiu koregavimu naudojant realaus pasaulio programavimo duomenis iš įvairių kalbų ir sistemų. Be to, modeliui naudingi patobulinti samprotavimo galimybių algoritmai, naudojant gilesnę konteksto analizę, kad būtų veiksmingiau išspręstos sudėtingos matematikos problemos. Patobulintą vizualinį supratimą palengvina daugiarūšė architektūra, galinti sklandžiai apdoroti teksto ir vaizdo įvestis, todėl ji tinka tokioms užduotims kaip vaizdinis pasakojimas ir kodo generavimas pagal dizaino eskizus.

Gemini-exp-1121 poveikis neapsiriboja techniniais patobulinimais; tai daro įtaką kūrėjų ir duomenų mokslininkų požiūriui į problemų sprendimą. „Google“ eksperimentai rodo, kad „Gemini-exp-1121“ kodavimo užduotis atlieka su didesniu sėkmingumo rodikliu, palyginti su GPT-4o, ir pasiekia maždaug 20 % daugiau teisingų rezultatų, susijusių su etaloninėmis problemomis. Jo vizualinio supratimo galimybės taip pat leidžia kurti aprašymus ir kontekstines išvadas tiksliau nei jo pirmtakai. Dėl šios pažangos jis yra naudingas įrankis įmonėms, norinčioms automatizuoti darbo eigą, apimančią tiek kodą, tiek vaizdinius komponentus, pvz., programų kūrimą ir produktų dizainą. Dėmesys patobulintoms samprotavimo galimybėms taip pat daro „Gemini-exp-1121“ perspektyviu švietimo ir tyrimų aplinkoje, kur būtini sudėtingi problemų sprendimo įgūdžiai.

Išvada

„Google Gemini-exp-1121“ yra svarbus žingsnis į priekį LLM erdvėje, pašalindamas našumo spragas keliose srityse, kurios tradiciškai buvo sudėtingos dirbtinio intelekto modeliams. Jo 20 % patobulinimas pagrindinėse srityse, tokiose kaip kodavimas, matematika ir vizija, suteikia praktinės naudos įvairiose programose, todėl jis yra stiprus GPT-4o konkurentas. Integruodama patobulintą samprotavimą, pagerintą kodavimo našumą ir pažangų vaizdo apdorojimą, „Google“ nustatė, kad Gemini-exp-1121 yra universalus sprendimas daugeliui iššūkių, su kuriais šiandien susiduria dirbtinio intelekto specialistai. Ši pažanga pabrėžia nuolatinį AI galimybių tobulinimą, žadantį veiksmingesnius ir universalesnius įrankius įvairių pramonės šakų profesionalams.

Patikrinkite į Išsami informacija čia. Visi nuopelnai už šį tyrimą tenka šio projekto tyrėjams. Taip pat nepamirškite sekti mūsų Twitter ir prisijunk prie mūsų Telegramos kanalas ir LinkedIn group. Jei jums patinka mūsų darbai, jums patiks ir mūsų darbai naujienlaiškis.. Nepamirškite prisijungti prie mūsų 55k+ ML SubReddit.

(NEMOKAMA AI VIRTUALI KONFERENCIJA) „SmallCon“: nemokama virtuali „GenAI“ konferencija „Meta“, „Mistral“, „Salesforce“, „Harvey AI“ ir kt.. Prisijunkite prie mūsų gruodžio 11 d. šiame nemokamajame virtualiame renginyje ir sužinokite, ko reikia norint sukurti didelius mažus modelius iš AI pirmtakų, tokių kaip Meta, Mistral AI, Salesforce, Harvey AI, Upstage, Nubank, Nvidia, Hugging Face ir kt.

Aswin AK yra MarkTechPost konsultavimo praktikantas. Jis siekia dvigubo laipsnio Indijos technologijos institute, Kharagpur. Jis yra aistringas duomenų mokslui ir mašininiam mokymuisi, turintis tvirtą akademinį išsilavinimą ir praktinę patirtį sprendžiant realaus gyvenimo kelių sričių iššūkius.

🐝🐝 Perskaitykite šią „Kili Technology“ AI tyrimo ataskaitą „Didelių kalbos modelio pažeidžiamumo įvertinimas: lyginamoji raudonųjų komandų sudarymo metodų analizė“

Source link

„Google“ naujinimai „Gemini-exp-1121“: AI tobulinimas kodavimo, matematikos ir vizualinio supratimo srityse

Gemini-exp-1121: Svarbus atnaujinimas

Techniniai patobulinimai ir privalumai

Išvada

Latest News

ASUS Pad Arrives in India Starting at Rs 45,990 With Premium OLED Display

Kauno miesto savivaldybė Iškilmingai pagerbti Kauno šimtukininkai ir jų mokytojai: įteiktos premijos ir padėkos

PDF Labeling vs Document Annotation vs Data Extraction: Clearing Up the Terminology

JetBrains Open-Sources KotlinLLM: Smart Macros That Generate Kotlin Source Code at Runtime and Hot-Reload It Through JDI

Gemini-exp-1121: Svarbus atnaujinimas

Techniniai patobulinimai ir privalumai

Išvada

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.

Latest News

ASUS Pad Arrives in India Starting at Rs 45,990 With Premium OLED Display

Kauno miesto savivaldybė Iškilmingai pagerbti Kauno šimtukininkai ir jų mokytojai: įteiktos premijos ir padėkos

PDF Labeling vs Document Annotation vs Data Extraction: Clearing Up the Terminology

JetBrains Open-Sources KotlinLLM: Smart Macros That Generate Kotlin Source Code at Runtime and Hot-Reload It Through JDI