Pažangių dirbtinio intelekto technologijų, įskaitant kelių agentų sistemas (MAS), kurias maitina LLM, pritaikymas organizacijoms kelia didelių iššūkių dėl didelio techninio sudėtingumo ir diegimo išlaidų. No-Code platformos pasirodė kaip perspektyvus sprendimas, leidžiantis kurti dirbtinio intelekto sistemas nereikalaujant programavimo patirties. Šios platformos sumažina AI pritaikymo kliūtis, todėl net ir netechniniai vartotojai gali efektyviai panaudoti AI įrankius. Prognozuojama, kad iki 2025 m. beveik 70 % taikomųjų programų bus naudojamos žemo kodo arba be kodo platformos, o tai rodo, kad jų vaidmuo demokratizuoja AI technologijas. Be to, LLM pasirodė esantys transformuojantys įvairiose programose, įskaitant generuojamąjį AI, kuriantį naują turinį, pvz., tekstą, vaizdus ir vaizdo įrašus, ir daugiarūšį AI, integruojantį įvairias duomenų formas tokioms užduotims kaip vaizdų atpažinimas ir kelių transporto rūšių paieška.
LLM pagrindu sukurtos MAS kūrimas dar labiau patobulino AI galimybes, suteikdamas galimybę keliems autonominiams agentams bendradarbiauti atliekant sudėtingas užduotis, sąveikaujant natūralia kalba. Šiose sistemose integruoti specializuoti agentai, kurie apdoroja duomenis iš įvairių būdų, valdo laiko ir erdvinius ryšius ir koordinuoja užduočių paskirstymą. Taikant daugiarūšio mokymosi metodus, pvz., erdvių įterpimą ir kryžminio dėmesio mechanizmus, geriau suprasti įvairių duomenų tipus, todėl galima atlikti tokias užduotis kaip vaizdo transformavimas į tekstą ir kryžminė paieška. Dėl šios pažangos dirbtinio intelekto sistemos tampa lankstesnės, veiksmingesnės ir prieinamesnės, todėl įmonės aplinkoje skatinamos naujovės ir sprendžiami įgyvendinimo iššūkiai.
Tyrėjai iš SAMSUNG SDS (Seulas) sukūrė daugiarūšį LLM pagrįstą MAS, naudodami No-Code platformas, kad supaprastintų AI integravimą į verslo procesus, nereikalaujant profesionalių kūrėjų. Sistema, sukurta naudojant tokius įrankius kaip „Flowise“, integruoja multimodalinius LLM, vaizdo generavimą su stabilia difuzija ir RAG pagrįstą MAS. Įvertintas naudojant tokius naudojimo atvejus, kaip vaizdo kodo generavimas ir klausimų ir atsakymų sistemos, pabrėžiama bendradarbiavimo agentų sinergija. Tyrime akcentuojamas techninis įgyvendinimas, pritaikomumas verslui ir veiklos įvertinimas, parodomas geresnis efektyvumas ir prieinamumas ne ekspertams ir MVĮ. Tyrimas siūlo keičiamo dydžio AI pritaikymo metodiką, sumažinančią rankinių užduočių skaičių ir skatinančią praktinį MAS naudojimą įvairiose pramonės šakose.
Įdiegus daugiarūšį LLM pagrįstą MAS naudojant Flowise platformą, reikia ją nustatyti debesyje, saugiai valdyti API raktus ir integruoti išorines paslaugas, tokias kaip OpenAI ir Stable Diffusion. Hibridinė reliacinė ir NoSQL duomenų bazių sistema efektyviai tvarko struktūrizuotus ir nestruktūruotus duomenis. Vaizdo analizės, RAG paieškos, vaizdo generavimo ir vaizdo įrašų generavimo agentai apdoroja įvesties tipus, pvz., tekstą, vaizdus ir garsą, kad sukurtų atitinkamą išvestį, pvz., tekstą, nuotraukas ir vaizdo įrašus. Šie agentai yra integruoti į vieningą darbo eigą su žiniatinklio vartotojo sąsaja, užtikrinančia sklandų funkcionalumą ir įvesties apdorojimą realiuoju laiku.
Tyrime aptariamas multimodalinio MAS įgyvendinimas ir rezultatai, daugiausia dėmesio skiriant įvairiems naudojimo atvejams, tokiems kaip vaizdo analizė, kodo generavimas, RAG pagrįsta paieška, vaizdų generavimas ir vaizdo įrašų generavimas. Sistema apdoroja nepilnus kodo vaizdus, generuoja kodą bendradarbiaudama tarp agentų ir peržiūri jo kokybę. RAG paieškos agentai prireikus nuskaito atsakymus iš RAG žinių ir išorinių šaltinių. Vaizdo generavimo agentai kuria vaizdinius elementus iš teksto aprašymų ar eskizų, o vaizdo įrašų generavimo agentai kuria vaizdo įrašus pagal teksto ar vaizdo įvestį. Šių agentų integravimas į vieningą sistemą leidžia sklandžiai bendrauti ir atlikti užduotis.
Apibendrinant, tyrime pristatomas daugiarūšis LLM pagrįstas MAS, sukurtas naudojant No-Code platformą Flowise, siekiant supaprastinti AI pritaikymą įmonėse. Tai parodo sistemos efektyvumą automatizuojant tokias užduotis kaip kodo generavimas, vaizdų ir vaizdo įrašų kūrimas bei RAG pagrįsti užklausų atsakymai, sumažinant specializuotų kūrimo komandų poreikį. Tyrimas pabrėžia praktinę AI naudą verslui, pavyzdžiui, efektyvumo ir turinio generavimo gerinimą. Ji taip pat siūlo naują metodiką, kaip integruoti multimodalinius duomenis su No-Code platformomis, tačiau pripažįsta tinkinimo, duomenų tvarkymo ir agentų komunikacijos apribojimus, kuriuos reikia toliau tobulinti.
Patikrinkite Popierius. Visi nuopelnai už šį tyrimą tenka šio projekto tyrėjams. Taip pat nepamirškite sekti mūsų Twitter ir prisijunk prie mūsų Telegramos kanalas ir LinkedIn group. Nepamirškite prisijungti prie mūsų 60k+ ML SubReddit.
🚨 NEMOKAMAS BŪTINAS AI internetinis seminaras (2025 M. SAUSIO 15 d.): padidinkite LLM tikslumą naudodami sintetinius duomenis ir įvertinimo informaciją–Prisijunkite prie šio internetinio seminaro, kad gautumėte veiksmingų įžvalgų, kaip padidinti LLM modelio našumą ir tikslumą, kartu išsaugant duomenų privatumą.
Sana Hassan, „Marktechpost“ konsultacinė praktikantė ir „IIT Madras“ dviejų laipsnių studentė, aistringai taiko technologijas ir dirbtinį intelektą sprendžiant realaus pasaulio iššūkius. Labai domisi praktinių problemų sprendimu, jis atneša naują požiūrį į AI ir realaus gyvenimo sprendimų sankirtą.
✅ (Rekomenduojama skaityti) „Nebius AI Studio“ plečiasi regėjimo modeliais, naujais kalbos modeliais, įterpimais ir LoRA (reklamuojama)