AI pramonė šiuo metu yra apsėsta „agentų“ – autonominių programų, kurios atlieka daugiau nei tik pokalbius. Tačiau dauguma dabartinių kelių agentų sistemų priklauso nuo trapios, sunkiai užkoduotos euristikos, kuri nepavyksta pasikeitus aplinkai.
Google DeepMind mokslininkai pasiūlė naują sprendimą. Tyrėjų grupė teigė, kad tam, kad „agentinis tinklas“ išsiplėstų, agentai turi pereiti nuo paprasto užduočių padalijimo ir priimti į žmones panašius organizacinius principus, tokius kaip valdžia, atsakomybė ir atskaitomybė.
„Pažangios“ delegacijos apibrėžimas
Standartinėje programinėje įrangoje paprogramė tiesiog „perduodama“. Protinga delegacija yra kitoks. Tai sprendimų seka, kai deleguotojas perduoda įgaliojimus ir atsakomybę deleguotajam. Šis procesas apima rizikos įvertinimą, gebėjimų suderinimą ir pasitikėjimo sukūrimą.
5 sistemos ramsčiai
Norėdami tai sukurti, tyrimo grupė nustatė 5 pagrindinius reikalavimus, susietus su konkrečiais techniniais protokolais:
| Karkasinis ramstis | Techninis įgyvendinimas | Pagrindinė funkcija |
| Dinaminis vertinimas | Užduočių skaidymas ir priskyrimas | Smulkiai numanoma agento būsena ir pajėgumas. |
| Adaptyvus vykdymas | Adaptyvusis koordinavimas | Konteksto poslinkių ir vykdymo laiko gedimų tvarkymas. |
| Struktūrinis skaidrumas | Stebėjimas ir patikrinamas užbaigimas | Tiek proceso, tiek galutinio rezultato auditas. |
| Scalable Market | Pasitikėjimas ir reputacija bei kelių tikslų optimizavimas | Veiksmingas, patikimas koordinavimas atvirose rinkose. |
| Sisteminis atsparumas | Saugumas ir leidimų tvarkymas | Pakopinių gedimų ir kenkėjiško naudojimo prevencija. |
Inžinerinė strategija: išskaidymas pagal sutartį pirmiausia
Svarbiausias poslinkis yra sutartis-pirmasis skilimas. Pagal šį principą delegatorius paskiria užduotį tik tada, kai galima tiksliai patikrinti rezultatą.
Jei užduotis yra pernelyg subjektyvi ar sudėtinga, kad ją būtų galima patikrinti, pvz., „parašyti įtikinamą tyrimo straipsnį“, sistema turi rekursyviai ją išskaidyti. Tai tęsiasi tol, kol papildomos užduotys atitinka turimus patikrinimo įrankius, pvz., vienetų testus arba formalius matematinius įrodymus.
Rekursyvus patikrinimas: gamybos grandinė
Delegavimo grandinėje, pvz 𝐴 → 𝐵 → 𝐶atskaitomybė yra pereinamoji.
- Agentas B yra atsakingas už darbo patikrinimą C.
- Kai agentas B grąžina rezultatą Aji turi pateikti visą kriptografiškai pasirašytų atestacijų grandinę.
- Agentas A tada atlieka 2 etapų patikrą: patikrinimą Btiesioginį darbą ir tai tikrinti B teisingai patikrinta C.
Sauga: žetonai ir tuneliai
Šių grandinių mastelis kelia didžiulę saugumo riziką, įskaitant Duomenų išfiltravimas, Užpakalinių durų implantavimasir Modelio ištraukimas.
Norėdami apsaugoti tinklą, „DeepMind“ komanda siūlo Delegavimo galimybių prieigos raktai (DCT). Remiantis tokiomis technologijomis kaip Makaronai arba Sausainiaišiuose žetonuose naudojami „kriptografiniai įspėjimai“, kad būtų laikomasi mažiausios privilegijos principo. Pavyzdžiui, agentas gali gauti prieigos raktą, leidžiantį SKAITYTI konkretų „Google“ disko aplanką, bet uždrausti bet kokias WRITE operacijas.
Dabartinių protokolų įvertinimas
Tyrimo grupė išanalizavo, ar dabartiniai pramonės standartai yra paruošti šiai sistemai. Nors šie protokolai yra pagrindas, visuose juose yra „trūkstamų dalių“, skirtų didelės svarbos delegacijai.
- MCP (modelio konteksto protokolas): Standartizuoja modelių prijungimą prie įrankių. Tarpas: Jam trūksta politikos sluoksnio, leidžiančio valdyti leidimus giliose delegavimo grandinėse.
- A2A (agentas agentui): Tvarko atradimų ir užduočių gyvavimo ciklus. Tarpas: Jame trūksta standartizuotų nulinių žinių įrodymų (ZKP) arba skaitmeninio parašo grandinių antraščių.
- AP2 (Agent Payments Protocol): Įgalioja agentus leisti lėšas. Tarpas: Ji negali savaime patikrinti darbo kokybės prieš išleisdama mokėjimą.
- UCP (Universal Commerce Protocol): Standartizuoja komercinius sandorius. Tarpas: Jis optimizuotas apsipirkimui / įvykdymui, o ne abstrakčioms skaičiavimo užduotims.
Key Takeaways
- Peržengti euristikos ribas: Dabartinės AI delegacijos remiasi paprasta, sunkiai užkoduota euristika, kuri yra trapi ir negali dinamiškai prisitaikyti prie aplinkos pokyčių ar netikėtų gedimų. Protingam delegavimui reikalinga prisitaikanti sistema, apimanti įgaliojimų perdavimą, atsakomybę ir atskaitomybę.
- „Pirmiausia sutartis“ užduočių skaidymas: Sudėtingiems tikslams delegatoriai turėtų taikyti „pirmiausia sutartis“ metodą, kai užduotys išskaidomos tol, kol subvienetai atitinka konkrečias automatizuotas tikrinimo galimybes, pvz., vienetų testus ar formalius įrodymus.
- Pereinamoji atskaitomybė grandinėse: Ilgose delegavimo grandinėse (pvz., 𝐴 → 𝐵 → 𝐶) atsakomybė yra pereinamoji. Agentas B yra atsakingas už C darbą, o agentas A turi patikrinti tiek tiesioginį B darbą, tiek tai, kad B teisingai patikrino C patvirtinimus.
- Sumažintas saugumas per žetonus: Kad išvengtų sisteminių pažeidimų ir „supainioto pavaduotojo problemos“, agentai turėtų naudoti delegavimo galimybių prieigos raktus (DCT), kurie suteikia susilpnintą įgaliojimą. Tai užtikrina, kad agentai veiktų pagal mažiausiųjų privilegijų principą, o prieiga ribojama iki konkrečių išteklių ir leidžiamų operacijų pogrupių.
Patikrinkite Popierius čia. Be to, nedvejodami sekite mus Twitter ir nepamirškite prisijungti prie mūsų 100 000+ ML SubReddit ir Prenumeruoti mūsų naujienlaiškis. Palauk! ar tu telegramoje? dabar galite prisijungti prie mūsų ir per telegramą.

Michal Sutter yra duomenų mokslo profesionalas, Paduvos universiteto duomenų mokslo magistro laipsnis. Turėdamas tvirtą statistinės analizės, mašininio mokymosi ir duomenų inžinerijos pagrindą, Michal puikiai sugeba sudėtingus duomenų rinkinius paversti įgyvendinamomis įžvalgomis.



