Dirbtinio intelekto (DI) sritis ir toliau vystosi, o konkurencija tarp didelių kalbų modelių (LLM) išlieka intensyvi. Nepaisant pastarojo meto pažangos, stumiančios ribas, ką šie modeliai gali pasiekti, iššūkių išlieka. Vienas iš pagrindinių esamų LLM, tokių kaip GPT-4, sunkumų yra rasti tinkamą pusiausvyrą tarp bendrojo mąstymo, kodavimo gebėjimų ir vizualinio supratimo. Daugelis modelių puikiai tinka vienoje srityje, o kitose – prasčiau, todėl kūrėjams ir tyrėjams sunku rasti vieną modelį, kuris galėtų veiksmingai patenkinti įvairius poreikius. Tai sukuria neefektyvumą ir išryškina universalesnių sprendimų poreikį.
Gemini-exp-1121: Svarbus atnaujinimas
„Google“ atnaujino „Gemini-exp-1121“, kuri 20 % lenkia GPT-4o kodavimo, matematikos ir regėjimo srityse. Gemini-exp-1121 yra naujausias eksperimentinis Google Gemini serijos AI modelių papildymas, sukurtas siekiant patenkinti augantį visapusiškos AI sistemos poreikį. Palyginti su OpenAI GPT-4o, Gemini-exp-1121 pagerėjo, ypač kodavimo, matematinio samprotavimo ir vizualinio supratimo srityse. Šis atnaujinimas yra esminė pažanga, pagerinanti „Google“ padėtį dirbtinio intelekto ekosistemoje kartu su „OpenAI“. Gemini-exp-1121 siekiama pašalinti ankstesnių LLM galimybių spragas gerinant kodavimo sklandumą, tobulinant sudėtingų problemų sprendimo gebėjimus ir tobulinant suvokimo įgūdžius.
Techniniai patobulinimai ir privalumai
Techniškai Gemini-exp-1121 yra keletas reikšmingų patobulinimų. Šie patobulinimai apima optimizuotą transformatoriaus architektūrą ir pažangius paieškos mechanizmus, kurie padidina jo mokymąsi realiojo laiko duomenimis, padeda modeliui išlikti aktualiam ir tiksliui. Kodavimo našumo pagerėjimas siejamas su išsamiu koregavimu naudojant realaus pasaulio programavimo duomenis iš įvairių kalbų ir sistemų. Be to, modeliui naudingi patobulinti samprotavimo galimybių algoritmai, naudojant gilesnę konteksto analizę, kad būtų veiksmingiau išspręstos sudėtingos matematikos problemos. Patobulintą vizualinį supratimą palengvina daugiarūšė architektūra, galinti sklandžiai apdoroti teksto ir vaizdo įvestis, todėl ji tinka tokioms užduotims kaip vaizdinis pasakojimas ir kodo generavimas pagal dizaino eskizus.
Gemini-exp-1121 poveikis neapsiriboja techniniais patobulinimais; tai daro įtaką kūrėjų ir duomenų mokslininkų požiūriui į problemų sprendimą. „Google“ eksperimentai rodo, kad „Gemini-exp-1121“ kodavimo užduotis atlieka su didesniu sėkmingumo rodikliu, palyginti su GPT-4o, ir pasiekia maždaug 20 % daugiau teisingų rezultatų, susijusių su etaloninėmis problemomis. Jo vizualinio supratimo galimybės taip pat leidžia kurti aprašymus ir kontekstines išvadas tiksliau nei jo pirmtakai. Dėl šios pažangos jis yra naudingas įrankis įmonėms, norinčioms automatizuoti darbo eigą, apimančią tiek kodą, tiek vaizdinius komponentus, pvz., programų kūrimą ir produktų dizainą. Dėmesys patobulintoms samprotavimo galimybėms taip pat daro „Gemini-exp-1121“ perspektyviu švietimo ir tyrimų aplinkoje, kur būtini sudėtingi problemų sprendimo įgūdžiai.
Išvada
„Google Gemini-exp-1121“ yra svarbus žingsnis į priekį LLM erdvėje, pašalindamas našumo spragas keliose srityse, kurios tradiciškai buvo sudėtingos dirbtinio intelekto modeliams. Jo 20 % patobulinimas pagrindinėse srityse, tokiose kaip kodavimas, matematika ir vizija, suteikia praktinės naudos įvairiose programose, todėl jis yra stiprus GPT-4o konkurentas. Integruodama patobulintą samprotavimą, pagerintą kodavimo našumą ir pažangų vaizdo apdorojimą, „Google“ nustatė, kad Gemini-exp-1121 yra universalus sprendimas daugeliui iššūkių, su kuriais šiandien susiduria dirbtinio intelekto specialistai. Ši pažanga pabrėžia nuolatinį AI galimybių tobulinimą, žadantį veiksmingesnius ir universalesnius įrankius įvairių pramonės šakų profesionalams.
Patikrinkite į Išsami informacija čia. Visi nuopelnai už šį tyrimą tenka šio projekto tyrėjams. Taip pat nepamirškite sekti mūsų Twitter ir prisijunk prie mūsų Telegramos kanalas ir LinkedIn group. Jei jums patinka mūsų darbai, jums patiks ir mūsų darbai naujienlaiškis.. Nepamirškite prisijungti prie mūsų 55k+ ML SubReddit.
(NEMOKAMA AI VIRTUALI KONFERENCIJA) „SmallCon“: nemokama virtuali „GenAI“ konferencija „Meta“, „Mistral“, „Salesforce“, „Harvey AI“ ir kt.. Prisijunkite prie mūsų gruodžio 11 d. šiame nemokamajame virtualiame renginyje ir sužinokite, ko reikia norint sukurti didelius mažus modelius iš AI pirmtakų, tokių kaip Meta, Mistral AI, Salesforce, Harvey AI, Upstage, Nubank, Nvidia, Hugging Face ir kt.
Aswin AK yra MarkTechPost konsultavimo praktikantas. Jis siekia dvigubo laipsnio Indijos technologijos institute, Kharagpur. Jis yra aistringas duomenų mokslui ir mašininiam mokymuisi, turintis tvirtą akademinį išsilavinimą ir praktinę patirtį sprendžiant realaus gyvenimo kelių sričių iššūkius.
🐝🐝 Perskaitykite šią „Kili Technology“ AI tyrimo ataskaitą „Didelių kalbos modelio pažeidžiamumo įvertinimas: lyginamoji raudonųjų komandų sudarymo metodų analizė“