„Alibaba“ išleido OpenSandboxatvirojo kodo įrankis, sukurtas AI agentams teikti saugią, izoliuotą aplinką, skirtą kodo vykdymui, interneto naršymui ir modelių mokymui. Išleistas pagal Apache 2.0 licencijasiūlomos sistemos tikslas yra standartizuoti AI agentų krūvos „vykdymo sluoksnį“, siūlydama vieningą API, veikiančią įvairiose programavimo kalbose ir infrastruktūros teikėjuose. Įrankis sukurtas pagal tą pačią vidinę infrastruktūrą, kurią „Alibaba“ naudoja didelio masto AI darbo krūviams.
Techninė spraga agentų darbo eigoje
Savarankiško agento kūrimas paprastai apima du komponentus: „smegenis“ (dažniausiai tai yra didelės kalbos modelis) ir „įrankius“ (kodo vykdymą, prieigą prie žiniatinklio arba failų manipuliavimą). Siekiant užtikrinti saugią šių įrankių aplinką, kūrėjai turėjo rankiniu būdu konfigūruoti „Docker“ konteinerius, valdyti sudėtingą tinklo izoliaciją arba pasikliauti trečiųjų šalių API.
„OpenSandbox“ tai išsprendžia suteikdama standartizuotą saugią aplinką, kurioje agentai gali vykdyti savavališką kodą arba sąveikauti su sąsajomis nekeldami pavojaus pagrindinės sistemos vientisumui. Tai abstrahuoja pagrindinę infrastruktūrą, leidžiančią kūrėjams pereiti nuo vietinės plėtros prie gamybos masto diegimo naudojant vieną API.
Architektūra
OpenSandbox architektūra yra pastatytas ant modulinio keturių sluoksnių kamino– apimantis SDK sluoksnis, specifikacijų sluoksnis, vykdymo laikas ir smėlio dėžės egzempliorių sluoksnis-Sukurtas atsieti kliento logiką nuo vykdymo aplinkos. Iš esmės sistema naudoja FastAPI pagrįstą serverį, kad galėtų valdyti smėlio dėžių gyvavimo ciklą per Docker arba Kubernetes vykdymo laiką, o ryšys yra standartizuotas pagal OpenAPI specifikacijas (smėlio dėžės gyvavimo ciklo ir vykdymo specifikacijas). Kiekviename izoliuotame konteineryje „OpenSandbox“ įveda didelio našumo „Go“ pagrįstą vykdymo demoną (execd), kuris sąveikauja su vidiniais „Jupyter“ branduoliais, kad užtikrintų būsenos kodo vykdymą, išvesties srautinį perdavimą realiuoju laiku per serverio išsiųstus įvykius (SSE) ir visapusišką failų sistemos valdymą, užtikrinantį „protokolų pirmumo“ metodą, kuris išlieka nuoseklus bet kuriame pagrindiniame konteineryje.


Pagrindinės techninės galimybės
„OpenSandbox“ sukurtas taip, kad būtų agnostikas aplinkai. Tai palaiko Dokeris vietos plėtrai ir Kubernetes paskirstytoms, gamybinio lygio serijoms. Platformoje yra keturi pagrindiniai smėlio dėžių tipai:
- Kodavimo agentai: Programinės įrangos kūrimo užduotims optimizuotos aplinkos, kuriose agentai gali rašyti, išbandyti ir derinti kodą.
- GUI agentai: Palaiko pilnai VNC staliniai kompiuteriaileidžianti agentams sąveikauti su grafinėmis vartotojo sąsajomis.
- Kodo vykdymas: Didelio našumo vykdymo laikas, skirtas vykdyti konkrečius scenarijus arba skaičiavimo užduotis.
- RL treniruotės: Izoliuotos aplinkos, pritaikytos sustiprinto mokymosi (RL) darbo krūviams, leidžiančios saugiai kartoti mokymus.
Sistema naudoja a Vieninga APIkuris užtikrina, kad sąveikos modeliai išliktų nuoseklūs, nepaisant pagrindinės kalbos ar vykdymo laiko. Šiuo metu „OpenSandbox“ teikia SDK Python, TypeScript ir Java / Kotlinsu C# ir Go įtraukta į plėtros planą.
Integracija ir ekosistemų palaikymas
Reikšminga „OpenSandbox“ savybė yra jos suderinamumas su esamomis AI sistemomis ir kūrėjo įrankiais. Suteikdamas saugų vykdymo lygmenį, jis leidžia agentams, sukurtiems įvairiose platformose, atlikti „realaus pasaulio“ veiksmus. Šiuo metu palaikomos integracijos apima:
- Modelio sąsajos: Claude Code, Gemini CLI ir OpenAI Codex.
- Orkestravimo karkasai: LangGraph ir Google ADK (Agent Development Kit).
- Automatizavimo įrankiai: „Chrome“ ir „Playwright“ naršyklėje pagrįstoms užduotims atlikti.
- Vizualizacija: Visiškas VNC palaikymas vizualiniam stebėjimui ir sąveikai.
Tai reiškia, kad agentui gali būti pavesta „išgryninti svetainę ir parengti tiesinės regresijos modelį“ per vieną atskirą seansą. Agentas naudoja „Playwright“ naršydamas internete, atsisiunčia duomenis į smėlio dėžės vietinę failų sistemą ir vykdo „Python“ kodą, kad apdorotų tuos duomenis – visa tai neišeidamas iš saugios „OpenSandbox“ aplinkos.
Diegimas ir konfigūravimas
Projekte pirmenybė teikiama supaprastintai kūrėjo patirčiai (DX). Norint nustatyti vietinį vykdymo serverį, reikia trijų pagrindinių komandų per komandų eilutės sąsają:
pip install opensandbox-server— Diegiami serverio komponentai.opensandbox-server init-config— Sugeneruoja reikiamus aplinkos konfigūracijos failus.opensandbox-server— Paleidžiamas serveris ir pateikiama API sąveikai tarp agento.
Kai serveris veikia, kūrėjai gali naudoti pateiktus SDK programiškai kurti, valdyti ir nutraukti smėlio dėžes. Tai sumažina kelių failų valdymo, procesų izoliavimo ir tinklo tarpinio serverio įrankių „sujungimo“ sąnaudas.
Key Takeaways
- Vieningas, kalbos agnostinis vykdymas: „OpenSandbox“ teikia nuoseklią API, skirtą AI agentams vykdyti kodą, naršyti internete ir sąveikauti su GUI. Nors šiuo metu ji palaiko Python, TypeScript ir Java / KotlinSDK, skirti C# ir Go yra veiksmų plane.
- Infrastruktūros lankstumas („Docker“ ir „Kubernetes“): Įrankis sukurtas taip, kad būtų sklandžiai keičiamas nuo kūrėjo vietinio įrenginio iki įmonės lygio gamybos. Jis naudojasi Dokeris vietinei izoliacijai ir Kubernetes paskirstytiems, didelio masto diegimams, pašalinant „aplinkos dreifus“, dažnai atsirandančius perkeliant agentus iš kūrėjo į debesį.
- Plati ekosistemų integracija: Jis sukurtas taip, kad būtų galima tiesiogiai prijungti prie pirmaujančių AI sistemų ir įrankių, įskaitant LangGraph, Claude Code, Gemini CLI, OpenAI Codex ir Google ADKtaip pat automatizavimo bibliotekos kaip Dramaturgas ir Chrome.
- „Smėlio dėžės priklausomybės“ panaikinimas: Pateikdami nemokamą atvirojo kodo alternatyvą pagal Apache 2.0 licencija„Alibaba“ pašalina priklausomybę nuo brangių, valdomų smėlio dėžės paslaugų, kurios ima mokestį už minutę arba įpareigoja pardavėją užblokuoti.
- Aukštos kokybės sąveika (VNC ir žiniatinklis): Be paprasto scenarijaus vykdymo, OpenSandbox palaiko pilni VNC staliniai kompiuteriai ir naršyklės automatizavimas. Tai leidžia agentams atlikti sudėtingas daugiarūšes užduotis, pvz., naršyti žiniatinklio sąsajose arba naudoti darbalaukio programas, saugioje, „sprogimui atsparioje“ aplinkoje.
Patikrinkite Repo, dokumentai ir Pavyzdžiai. Be to, nedvejodami sekite mus Twitter ir nepamirškite prisijungti prie mūsų 120 000+ ML SubReddit ir Prenumeruoti mūsų naujienlaiškis. Palauk! ar tu telegramoje? dabar galite prisijungti prie mūsų ir per telegramą.

