Didelių kalbos modeliai (LLM) yra daugialypių agentų sistemų pagrindas, leidžiantis keliems AI agentams bendradarbiauti, bendrauti ir išspręsti problemas. Šie agentai naudoja LLM, norėdami suprasti užduotis, generuoti atsakymus ir priimti sprendimus, imituodami komandinį darbą tarp žmonių. Tačiau efektyvumas atsilieka vykdant tokio tipo sistemas, nes jos yra pagrįstos fiksuotais dizainais, kurie nekeičia visų užduočių, todėl jos naudoja per daug išteklių, kad galėtų spręsti paprastas ir sudėtingas problemas, taip švaistyti skaičiavimus ir sukelti lėtą reakciją. . Todėl tai sukuria didelius iššūkius, bandant subalansuoti tikslumą, greitį ir kainą, tvarkant įvairias užduotis.
Šiuo metu kelių agentų sistemos priklauso nuo esamų metodų, tokių kaip Kupranugaris, autogenai, metagptas, dspy, evoprompting, gptswarm, ir EVOAGENTkurios orientuojasi į konkrečių užduočių, tokių kaip greitas derinimas, agento profiliavimas ir komunikacija, optimizavimui. Tačiau šie metodai kovoja su pritaikomumu. Jie vadovaujasi iš anksto pritvirtintais dizainais, nepakeičiant įvairių užduočių, todėl sudėtingų ir paprastų klausimų tvarkymas yra šiek tiek neveiksmingas. Jiems trūksta lankstumo atliekant rankinius metodus, tuo tarpu automatizuota sistema gali nukreipti tik į geriausios konfigūracijos paiešką be dinaminio efektyvumo. Tai daro šiuos metodus brangiai skaičiuojant ir lemia mažesnį bendrą našumą, kai jie taikomi realaus pasaulio iššūkiams.

Siekdami išspręsti esamų daugiaagenčių sistemų apribojimus, tyrėjai pasiūlė Maas (kelių agentų architektūros paieška). Ši sistema naudoja tikimybinį agento supernetą, kad būtų sukurta nuo užklausos priklausoma daugialypės terpės architektūra. Užuot pasirinkęs fiksuotą optimalią sistemą, Maas Dinamiškai pavyzdžiai pritaikė daugialypės terpės sistemas kiekvienai užklausai, subalansuojant našumą ir skaičiavimo išlaidas. Paieškos erdvę apibrėžia agentų operatoriai, kurie yra LLM pagrįstos darbo eigos, apimančios kelis agentus, įrankius ir raginimus. „Supernet“ sužino apie galimą agentų architektūrą pasiskirstymą, optimizuodamas jį remiantis užduoties naudingumu ir išlaidų apribojimais. Kontrolieriaus tinklo pavyzdžiai yra užklausoje esanti architektūra, naudodama a Ekspertų mišinys (MOE)-stiliaus efektyvaus atrankos mechanizmas. Sistema optimizuoja per sąnaudų žinomą empirinę empirinę Bayes Monte CarloAgentų operatorių atnaujinimas naudojant tekstinius gradientus pagrįstus metodus. Sistema teikia automatizuotą daugialypės terpės evoliuciją, leidžiančią efektyviai ir pritaikant įvairias ir sudėtingas užklausas.

Tyrėjai įvertino Maas Šeši vieši etalonai per matematikos samprotavimus (GSM8K, matematika, daugiapakopė) Kodo generavimas („Humaneval“, MBPP), ir Įrankių naudojimas (GAIA)palyginus su 14 bazinių linijųįskaitant vieno agento metodus, rankomis pagamintas daugialypės terpės sistemas ir automatinius metodus. Maas nuosekliai aplenkė visas bazines linijas, pasiekdamas vidutinį geriausią balą 83,59% per užduotis ir reikšmingai pagerinti 18,38% ant GAIA 1 lygis Užduotys. Išlaidų analizė parodė, kad „Maas“ yra efektyvus išteklius, reikalaujant mažiausių mokymo žetonų, mažiausios API išlaidos ir trumpiausias sienos pergalės laikas. Atvejo tyrimai pabrėžė jo pritaikomumą dinamiškai optimizuojant kelių agentų darbo eigas.


Apibendrinant galima pasakyti, kad metodas fiksuotas tradicinių daugiaagentų sistemų problemas, naudojant agentą supernetą, pritaikytą prie skirtingų užklausų. Tai leido sistemai veikti geriau, protingai naudoti išteklius ir tapti lankstesniais bei keičiamais. Būsimame darbe, Maas Gali būti išplėtotas į lanksčią, tačiau išplėstinę sistemą, skirtą tobulinti automatizavimą ir savarankiškumą būsimame darbe. Būsimame darbe taip pat gali būti galima optimizuoti mėginių ėmimo strategijas, patobulinti domenų pritaikomumą ir įtraukti realaus pasaulio apribojimus, siekiant padidinti kolektyvinį intelektą.
Patikrinkite popierius. Visas šio tyrimo kreditas skirtas šio projekto tyrėjams. Be to, nepamirškite sekti mūsų „Twitter“ ir prisijunkite prie mūsų „Telegram“ kanalas ir „LinkedIn GrOUP. Nepamirškite prisijungti prie mūsų 75K+ ml subreddit.
🚨 Rekomenduojama atvirojo kodo AI platforma: „„ Intellagent “yra atvirojo kodo daugialypės terpės sistema, skirta įvertinti sudėtingą pokalbio AI sistemą“ (Paaukštintas)
„Divyesh“ yra konsultavimo praktikantas „MarktechPost“. Jis siekia žemės ūkio ir maisto inžinerijos BTech iš Indijos technologijos instituto Kharagpur. Jis yra duomenų mokslo ir mašinų mokymosi entuziastas, norintis integruoti šias pagrindines technologijas į žemės ūkio sritį ir išspręsti iššūkius.
✅ (rekomenduojama) Prisijunkite prie mūsų telegramos kanalo


