„Bagel“ yra nauja AI modelio architektūra, pakeičianti atvirojo kodo AI kūrimą įgalindama neleistiną įnašą ir užtikrindama, kad bendradarbiams būtų priskirtos pajamos. Jo dizainas integruoja pažangią kriptografiją su mašininio mokymosi metodais, kad būtų sukurta patikima, saugi, bendradarbiaujanti ekosistema. Pirmoji jų platforma Bakery yra unikali AI modelio koregavimo ir pajamų gavimo platforma, sukurta remiantis Bagel modelio architektūra. Tai sukuria bendradarbiavimo erdvę, kurioje kūrėjai gali tiksliai sureguliuoti AI modelius nepakenkdami savo nuosavybės išteklių privatumui ir neatskleisdami jautrių modelio parametrų.
Kilmė ir vizija
Bagel idėja kilo jos įkūrėjui, Bidhanas Rojusturintis turtingą inžinerijos ir mašininio mokymosi patirtį ir prisidėjęs prie didžiausios pasaulyje ML infrastruktūros „Amazon Alexa“, „Cash App“ ir „Instacart“. Pripažindamas atvirojo kodo dirbtinio intelekto, kaip labdaros modelio, netvarumą, Roy'us numatė sistemą, kuri paskatintų bendradarbius, nes jų darbas būtų pelningas. Jo įvadas į kriptografiją, kai jis dirbo „Cash App“ Bitcoin prekybos platformoje 2017 m., tapo pagrindu Bagel novatoriškam požiūriui derinti kriptografinius metodus su AI kūrimu.
Unikalus „Bagel“ vertės pasiūlymas yra pagrįstas trimis pagrindiniais ramsčiais:
- Priskyrimas: „Bagel“ užtikrina, kad kiekvienas struktūrinis ar parametrinis indėlis būtų patikrinamai priskiriamas naudojant naują ZKLoRA metodą, suteikiant skaidrų kūrybinio darbo pėdsaką ir skatinant atsakomybę kuriant dirbtinį intelektą bendradarbiaujant.
- Nuosavybė: Bendraautojai išlaiko nuolatines pretenzijas dėl savo naujovių naudodami privatumą išsaugančius konteinerius ir parametrų užmaskavimą, todėl nebereikia sudaryti tradicinių licencijavimo sutarčių ir kartu apsaugoti intelektinę nuosavybę.
- Privatumas: Saugus modelio inkapsuliavimas ir daugiasluoksnis užmaskavimas apsaugo patentuotus komponentus, užkertant kelią neteisėtai prieigai net nepatikimose arba išorinėse skaičiavimo aplinkose, užtikrinant privatumą ir pasitikėjimą viso kūrimo proceso metu.
Pagrindinės „Bagel“ naujovės
- Neleistinas indėlis: „Bagel“ leidžia kūrėjams, tyrėjams ir išteklių savininkams prisidėti prie AI modelio kūrimo nereikalaujant aiškių leidimų ar išankstinių susitarimų. Šis decentralizuotas metodas pašalina kliūtis patekti į rinką.
- Pajamų priskyrimas: Unikali „Bagel“ savybė yra galimybė sąžiningai priskirti ir paskirstyti pajamas visiems ekosistemų dalyviams. Platforma tiksliai seka įnašus ir modelio patobulinimus naudodama kriptografijos metodus, užtikrindama, kad bendradarbiams būtų proporcingai atlyginama.
- Kriptografija atitinka mašininį mokymąsi: Novatoriška „Bagel“ architektūra remiasi kriptografinių metodų ir mašininio mokymosi pažanga, įskaitant:
- Parametrų atžvilgiu efektyvus tikslus derinimas (PEFT): Jis optimizuoja modelio koregavimo procesus, sumažindamas išteklių poreikį ir išlaikydamas našumą.
- ZKLoRA: Naujausia „Bagel Research Team“ naujovė – nulinių žinių protokolas, kuris patikrina LoRA atnaujinimus, kad būtų suderinamas su baziniu modeliu, neatskleidžiant patentuotų duomenų, užtikrinant saugų ir efektyvų bendradarbiavimą.
„Bagel“ architektūra įgyvendinama per platformą „Bakery“. Tai įgalina decentralizuotą dirbtinio intelekto kūrimą, nes kūrėjai gali saugiai prisidėti prie modelių ir optimizavimo, duomenų rinkinių teikėjai gali privačiai dalytis patentuotais duomenimis, naudojant kriptografinius metodus, o išteklių savininkai gali pasiūlyti skaičiavimo galią išsaugant kontrolę ir privatumą. Kepykloje keli bendradarbiai gali dalyvauti kuriant AI modelius:
- Bendraautoris gali pateikti bazinį modelį.
- Trečioji šalis galėtų pasiūlyti GPU išteklius iš atokios vietos.
Dabar pažvelkime į jų naujausius tyrimus apie ZKLoRA. Šiame tyrime „Bagel Research Team“ daugiausia dėmesio skiria tam, kad būtų galima efektyviai ir saugiai patikrinti žemo rango adaptacijos (LoRA) atnaujinimus, skirtus LLM paskirstytoje mokymo aplinkoje. Tradiciškai koreguojant šiuos modelius dalyvauja išoriniai bendradarbiai, teikiantys LoRA naujinimus, tačiau patikrinti, ar šie naujinimai tikrai suderinami su baziniu modeliu, kartu apsaugant patentuotus parametrus, kyla iššūkių.
Esami metodai, pvz., perėjimas į priekį arba rankinis didelių parametrų rinkinių tikrinimas, yra neįmanomi skaičiuojant, ypač modeliams su milijardais parametrų. Taip pat turi būti apsaugoti autorių patentuoti LoRA svoriai, o bazinio modelio savininkai turi patikrinti atnaujinimų tikslumą ir galiojimą. Tai sukuria dvejopą iššūkį: išlaikyti pasitikėjimą decentralizuotu ir bendradarbiaujančiu AI plėtojimu, kartu išsaugant intelektinę nuosavybę ir skaičiavimo efektyvumą. Tvirto ir veiksmingo LoRA naujinimų tikrinimo mechanizmo trūkumas riboja jų mastelį ir saugų naudojimą realiose programose.
Siekdama išspręsti aukščiau minėtą iššūkį, Bagel tyrimų komanda pristatė ZKLoRA. Šis nulinių žinių protokolas sujungia kriptografinius metodus su koregavimo metodais, kad būtų užtikrintas saugus LoRA naujinimų patikrinimas neatskleidžiant asmeninio svorio. ZKLoRA naudoja nulinių žinių įrodymus, daugianario įsipareigojimus ir glaustus kriptografinius dizainus, kad efektyviai patikrintų LoRA suderinamumą su baziniais modeliais. Ši naujovė leidžia LoRA bendradarbiams apsaugoti savo intelektinę nuosavybę, o bazinio modelio naudotojai gali patikimai patvirtinti naujinimus.
ZKLoRA protokolas veikia per struktūrizuotą procesą. Pirma, bazinio modelio vartotojas suteikia dalinį aktyvavimą paleisdamas nepakeistus modelio sluoksnius. Tada šiuos dalinius aktyvavimus naudoja LoRA savininkas, kuris taiko savo patentuotus naujinimus ir sukuria nulinių žinių įrodymą. Šis įrodymas užtikrina, kad LoRA naujinimai yra galiojantys ir suderinami su baziniu modeliu, neatskleidžiant patentuotos informacijos. Tikrinimas, kuris vienam moduliui užtrunka vos 1–2 sekundes, užtikrina kiekvieno LoRA atnaujinimo vientisumą, net ir modeliuose su milijardais parametrų. Pavyzdžiui, 70 milijardų parametrų modelį su 80 LoRA modulių galima patikrinti vos per kelias minutes. Dėl šio efektyvumo ZKLoRA yra keičiamo dydžio sprendimas sąlygomis, kai reikia dažnai ar didelio masto suderinamumo patikros.
Be to, ZKLoRA buvo griežtai įvertinta įvairiose LLM, įskaitant tokius modelius kaip distilgpt2, Llama-3.3-70B ir Mixtral-8x7B. Tyrėjai išanalizavo bendrą LoRA modulių skaičiaus ir jų vidutinių parametrų dydžių patikrinimo laiką, įrodymo generavimo laiką ir nustatymų laiką. Rezultatai parodė, kad net esant didesniam LoRA skaičiui, patikrinimo laikas pailgėjo nedaug dėl glausto ZKLoRA dizaino pobūdžio. Pavyzdžiui, modeliui su 80 LoRA modulių vienam moduliui patikrinti prireikė mažiau nei 2 sekundžių, o bendras įrodymo generavimo ir nustatymų laikas, nors ir priklausė nuo modulio dydžio, išliko valdomas. Tai parodo ZKLoRA gebėjimą valdyti kelių adapterių scenarijus didelio masto diegimuose su minimaliomis skaičiavimo sąnaudomis.
Tyrimas pabrėžia keletą pagrindinių dalykų, kurie pabrėžia ZKLoRA poveikį:
- Protokolas patikrina LoRA modulius vos per 1–2 sekundes, net ir modeliuose su milijardais parametrų, užtikrindamas pritaikymą realiuoju laiku.
- ZKLoRA efektyviai keičia mastelį su daugybe LoRA modulių, išlaikant valdomus įrodymo generavimo ir tikrinimo laikus.
- Integruodama kriptografinius metodus, tokius kaip nulinių žinių įrodymai ir diferencinis privatumas, ZKLoRA užtikrina patentuotų LoRA naujinimų ir bazinių modelių saugumą.
- Protokolas įgalina pasitikėjimu grindžiamą bendradarbiavimą tarp geografiškai paskirstytų komandų nepažeidžiant duomenų vientisumo ar intelektinės nuosavybės.
- Su minimaliomis skaičiavimo sąnaudomis ZKLoRA tinka dažniems suderinamumo patikrinimams, kelių adapterių scenarijams ir sutartimis pagrįstiems mokymo vamzdynams.
Apibendrinant galima pasakyti, kad „Bagel“ pakeitė decentralizuotą dirbtinio intelekto plėtrą, naudodamas novatorišką platformą „Bakery“ ir „ZKLoRA“ protokolą. Jie išsprendė esminius iššūkius, susijusius su LLM koregavimu, pvz., saugiai ir efektyviai patikrino LoRA naujinimus išsaugant intelektinę nuosavybę. „Bagel“ taip pat suteikė tvirtą pasitikėjimu grindžiamo bendradarbiavimo sistemą. Kepyklėlė leidžia atvirojo kodo bendradarbiams efektyviai užsidirbti pinigų iš savo darbo. Tuo pačiu metu ZKLoRA naudoja pažangias kriptografines technologijas, tokias kaip nulinių žinių įrodymai ir diferencinis privatumas, kad užtikrintų saugius ir keičiamo dydžio suderinamumo patikrinimus. Patvirtinimo laikas – net 1–2 sekundės vienam moduliui, net ir kelių milijardų parametrų modeliams, ZKLoRA demonstruoja nepaprastą efektyvumą ir yra praktiškas sprendimas realaus pasaulio programoms. Galiausiai, Bakery yra pirmasis produktas, kuriame naudojama Bagel modelio architektūra. Ši architektūra yra pagrindinis primityvus, kurį gali panaudoti būsimi produktai, kuriuos sukūrė Bagel komanda ir kitos įmonės, siekiančios naujovių atvirojo kodo AI erdvėje.
Šaltiniai:
Dėkojame „Bagel AI“ komandai už vadovavimą mintims / išteklius už šį straipsnį. Bagel AI komanda mus palaikė šiame turinyje / straipsnyje.

Asif Razzaq yra „Marktechpost Media Inc.“ generalinis direktorius. Kaip verslininkas ir inžinierius, Asif yra įsipareigojęs panaudoti dirbtinio intelekto potencialą socialinei gerovei. Naujausias jo siekis yra dirbtinio intelekto medijos platformos „Marktechpost“ paleidimas, kuri išsiskiria išsamia mašininio mokymosi ir gilaus mokymosi naujienomis, kurios yra techniškai pagrįstos ir lengvai suprantamos plačiajai auditorijai. Platforma gali pasigirti daugiau nei 2 milijonais peržiūrų per mėnesį, o tai rodo jos populiarumą tarp auditorijos.
📄 Susipažinkite su „Aukštis”: vienintelis savarankiškas projektų valdymo įrankis (remiama)