Išplėstinių AI modelių atsiradimas paskatino inovacijas, kaip mašinos apdoroja informaciją, sąveikauja su žmonėmis ir vykdė užduotis realiame pasaulyje. Du kylantys novatoriški metodai yra dideli koncepcijos modeliai (LCMS) ir dideli veiksmų modeliai (LAMS). Nors abu išplečia didelių kalbų modelių (LLMS) pagrindines galimybes, jų tikslai ir programos skiriasi.
LCMS veikia abstrakčiomis, kalbomis-agnostinėmis reprezentacijomis, vadinamomis „koncepcijomis“, leidžiančiomis joms pagrįsti aukštesnį abstrakcijos lygį. Tai palengvina niuansuotą kalbų ir būdų supratimą, palaikant tokias užduotis kaip ilgalaikis samprotavimas ir daugiapakopis planavimas. Kita vertus, LAMS yra skirtos veiksmams vykdyti, vartotojo ketinimams paversti veiksmingais žingsniais tiek skaitmeninėje, tiek fizinėje aplinkoje. Šie modeliai puikiai aiškina komandas, automatizuodami procesus ir dinamiškai pritaikomi prie aplinkos atsiliepimų.
LCMS ir LAMS siūlo išsamią sistemą, skirtą susieti pertrauką tarp kalbos supratimo ir realaus pasaulio veiksmų. Jų integracija turi didžiulį agentų grafikų sistemų potencialą, kai intelektualūs agentai reikalauja patikimų samprotavimų ir vykdymo galimybių, kad galėtų efektyviai veikti.
Dideli koncepcijos modeliai (LCMS): išsami apžvalga
Dideli koncepcijos modeliai (LCMS) pagal „Meta Elevate“ samprotavimus nuo prieigos raktų analizės iki abstraktaus, kalbos-agnostikos ir modalumo-agnostinio konceptualaus lygio. Šiais modeliais siekiama apibendrinti ir apdoroti informaciją su neprilygstamu pritaikomumu ir masteliu, atsižvelgiant į kai kuriuos tradicinių LLM apribojimus. Jų novatoriška architektūra ir požiūris į informacijos tvarkymą suteikia unikalių galimybių pažangių AI programų.
Anotacija ir modalumas-agnostiniai samprotavimai
LCMS esmė yra jų sugebėjimas veikti „sąvokose“, o ne konkrečiuose kalbos žetonuose. Ši abstrakcija suteikia galimybę LCMS įsitraukti į samprotavimus, kurie peržengia kalbines ar modalumo kliūtis. Užuot sutelkę dėmesį į tam tikros kalbos ar įvesties būdo painiavą, šie modeliai apdoroja pagrindines reikšmes ir struktūras, leidžiančias jiems generuoti tikslius rezultatus įvairiuose kalbiniuose ir modaliniuose kontekstuose.
Pavyzdžiui, LCM, apmokytas anglų kalbos duomenimis, gali sklandžiai apibendrinti savo galimybes kitoms kalboms ar būdams, įskaitant kalbą ir vaizdinius duomenis, be papildomo derinimo. Šis mastelio keitimas priskiriamas jo pagrindui sonaro įterpimo erdvėje – sudėtinga sistema, palaikanti daugiau nei 200 kalbų ir daugybę būdų.
Pagrindinės LCMS charakteristikos
- Hierarchinė aiškumo struktūra: LCMS naudoja aiškią hierarchinę struktūrą, padidindama ilgos formos išvesties skaitomumą. Šis dizainas palaiko logiškai struktūrizuoto turinio generavimą, todėl prireikus lengviau interpretuoti ir modifikuoti.
- Ilgų kontekstų tvarkymas: skirtingai nuo tradicinių transformatorių modelių, kurių skaičiavimo sudėtingumo mastelio keitimas kvadratiškai su sekos ilgiu, LCMS yra optimizuoti efektyviau tvarkyti išsamius kontekstus. Pasitelkdami trumpesnes sekas savo koncepcinėje sistemoje, jie sušvelnina apdorojimo apribojimus ir sustiprina ilgos formos samprotavimo galimybes.
- Nepriklausomas nulinio šūvio apibendrinimas: LCMS „Excel“ yra „Zero-Shot“ apibendrinimas, leidžiantis jiems atlikti užduotis įvairiomis kalbomis ir būdais, su kuriais jie nebuvo aiškiai susidūrę mokymo metu. Pavyzdžiui, jų sugebėjimas apdoroti mažai išteklių kalbas, tokias kaip „Pashto“ ar „Birmiečiai“, rodo jų universalumą ir jų konceptualios samprotavimo sistemos tvirtumą.
- Moduliškumas ir išplėtimas: Atskyrus koncepcijos kodavimo įrenginius ir dekoderius, LCMS išvengia trukdžių ir konkurencijos, pastebėtos daugialypiuose LLM. Šis moduliškumas užtikrina, kad skirtingus komponentus galima savarankiškai optimizuoti, padidinant jų pritaikomumą prie specializuotų programų.
Programos ir apibendrinimas
LCM yra naudingos atliekant užduotis, reikalaujančias visapusiško supratimo ir struktūrizuotų samprotavimų, tokių kaip apibendrinimas, vertimas ir planavimas. Dėl jų sugebėjimo tvarkyti įvairius būdus, įskaitant tekstą, kalbą ir vaizdinius duomenis, jie yra idealūs kandidatai integruoti į sudėtingas AI sistemas. Be to, jų apibendrinimo galimybės buvo įrodytos atliekant išsamius vertinimus. Pavyzdžiui, LCMS pralenkia palyginamus modelius, sukuriančius nuoseklius išėjimus daugiakalbėms apibendrinimo užduotims, ypač mažai išteklių kalbomis.
Dideli veiksmų modeliai (LAMS): išsami apžvalga
„Microsoft“, Pekino universitetas, Eindhoveno technologijos universitetas ir Zhejiang universitetas sukūrė didelius veiksmų modelius (LAMS), praplečiančius tradicinių LLM galimybes, kad būtų galima tiesiogiai vykdyti veiksmus skaitmeninėje ir fizinėje aplinkoje. Šie modeliai užpildo atotrūkį tarp kalbos supratimo ir realaus pasaulio įsitraukimo, leidžiant pasiekti apčiuopiamus, į užduotis orientuotus rezultatus.
Perėjimas nuo llms prie LAMS
Nors LLMS tobulėja kurdami į žmogų panašų tekstą ir teikiant kalbas pagrįstas įžvalgas, jie iš esmės apsiriboja pasyviais rezultatais. Jie negali dinamiškai sąveikauti su pasauliu, nesvarbu, ar naršote skaitmenines sąsajas, ar atlikdami fizines užduotis. LAMS atkreipia dėmesį į šį apribojimą, remdamasis LLMS pagrindinėmis galimybėmis ir integruojant pažangiausius veiksmo generavimo mechanizmus. Jie yra sukurti:
- Aiškinkite vartotojo ketinimus: LAMS analizuoja įvairias įvesties formas – tekstas, balso komandos ar net vaizdiniai duomenys – išsiaiškinti vartotojo tikslus. Skirtingai nuo LLMS, kuri pirmiausia generuoja tekstinius atsakymus, LAMS šiuos ketinimus paverčia veiksmais.
- Vykdykite užduotis realaus pasaulio kontekste: Bendraudami su savo aplinka, LAMS gali savarankiškai atlikti užduotis, tokias kaip naršymo svetainės, skaitmeninių įrankių valdymas ar fizinių įrenginių valdymas. Ši galimybė yra esminis poslinkis link veiksmingo intelekto.
Pagrindinės LAMS savybės
- Veiksmų generavimas: LAMS generuoja išsamias, atsižvelgiant į kontekstą veikiančių veiksmų sekas, atitinkančias vartotojo reikalavimus. Pvz., Kai nurodoma įsigyti prekę internetu, LAM gali savarankiškai pereiti į svetainę, ieškoti prekės ir užpildyti pirkinį.
- Pritaikomumas: Šie modeliai gali iš naujo planuoti ir dinamiškai sureguliuoti veiksmus reaguodami į atsiliepimą apie aplinką, užtikrindami patikimumą ir patikimumą sudėtinguose scenarijuose.
- Specializacija: LAMS yra optimizuotos atliekant domenui skirtas užduotis. Daugiausia dėmesio skiriant tam tikroms operacinėms apimtims, efektyvumas ir našumas yra panašus į ar geriau nei apibendrinti LLM. Ši specializacija daro juos tinkamomis suvaržytoms ištekliams, tokioms kaip „Edge“ įrenginiai.
- Integracija su agentais: LAMS dažnai įterpiamos į agentų sistemas, kurios suteikia būtinus įrankius sąveikauti su aplinka. Šie agentai renka stebėjimus, naudoja įrankius, palaiko atmintį ir įgyvendina grįžtamojo ryšio kilpas, kad palaikytų veiksmingą užduoties vykdymą.
LAMS taikymas
LAMS jau pademonstravo savo naudingumą įvairiose srityse. Automatinėje skaitmeninėje navigacijojeModeliai, tokie kaip „GPT-V“, integruoti į agentų sistemas, parodė pažadą atlikti interneto navigacijos užduotis. Jie automatizuoja procesus, tokius kaip informacijos paieška, internetinių operacijų užpildymas ar turinio valdymas keliose platformose. Taip pat, už Užduočių automatizavimas GUI aplinkojeLAMS sustiprina žmogaus ir kompiuterio sąveiką automatizuodami vartotojo sąsajos užduotis ir sumažindami rankines pastangas kartojant ar sudėtingas operacijas.
LCMS ir LAMS, skirtos agentūrinėms grafikų sistemoms
Agentrinėms grafikų sistemoms reikia sudėtingų samprotavimų, planavimo ir veiksmų vykdymo galimybių efektyviai funkcionuoti. LCMS ir LAMS derinys yra galinga architektūra, tenkinanti šiuos poreikius, pasinaudojant kiekvieno modelio tipo stipriosiomis pusėmis.
LCMS agentinėse sistemose
LCMS pateikia koncepcinę sistemą, kuri išsiskiria samprotavimais ir abstrakčiu mąstymu. Jie gali apibendrinti žinias įvairiuose kontekstuose, apdorodami informaciją apie agnostiką ir modalumą-agnostiniu būdu. Tai daro juos ypač vertingus valdant ilgalaikius scenarijus, kai kritiški yra supratimo priklausomybės ir išlaikymo nuoseklumo palaikymas.
- Hierarchinis planavimas: LCMS gebėjimas veikti naudojant aiškias hierarchines struktūras AIDS sudaro struktūrizavimo planus ir išvestis. Šis hierarchinis samprotavimas yra labai svarbus agentinėse grafikų sistemose, kurios dažnai apima sudėtingas, kelių žingsnių užduotis.
- Kryžminio modulio integracija: Veikdami sonaro įterpimuose, LCMS palaiko daugiamodalinius duomenų įvestis, tokius kaip tekstas, kalba ir vaizdiniai duomenys. Tai užtikrina sklandų integraciją į skirtingus informacinius šaltinius agentinės grafiko sistemoje.
LAMS agentinėse sistemose
LAMS, sutelkiant dėmesį į veiksmų generavimą, pateikia agentų sistemų vykdymo sluoksnį. Jie aiškina vartotojų ketinimus ir paverčia juos konkrečiais veiksmais, kurie sąveikauja su skaitmenine ar fizine aplinka.
- Užduoties vykdymas: LAMS puikiai supranta sudėtingus tikslus, į kuriuos galima įgyvendinti. Jų pritaikomumas padidina šią galimybę, leidžiančią jiems iš naujo planuoti ir realiu laiku pritaikyti veiksmus, remiantis atsiliepimais.
- Dinaminė sąveika: LAMS integruoja su agentų sistemomis, kad sąveikauja su įrankiais ir aplinka. Ši sąveika leidžia naršyti žiniatinklio, programų valdymu ir fizinio įrenginio manipuliavimu.
LCM ir LAMS sinergija
LCM ir LAM integracija į agentinę grafiko sistemą panaudoja abiejų modelių stipriąsias puses. LCMS pateikia samprotavimo ir planavimo galimybes, būtinas norint suprasti sudėtingus kontekstus, o LAMS vykdo šiuos planus realaus pasaulio nustatymuose.
- Žinių grafiko integracija: Žinių grafikai yra vienijanti sistema, leidžianti abiems modeliams pasiekti struktūrizuotą informaciją, kad būtų galima geriau planuoti ir vykdyti. Tai padidina sistemos sugebėjimą modeliuoti ryšius, saugoti atmintį ir pasirinkti tinkamus įrankius.
- Papildomos stipriosios pusės: Nors LCMS nagrinėja abstrakčius samprotavimus ir daugialypį supratimą, LAMS daugiausia dėmesio skiria realaus pasaulio veiksmams. Šis papildomas funkcionalumas užtikrina patikimą kognityvinių ir fizinių sričių našumą, tenkinančią sudėtingų agentų sistemų reikalavimus.
Apibendrinant, LCMS ir LAMS integracija įgalina sistemas, kurios sujungia abstrakčius samprotavimus su praktiniu vykdymu. LCMS puikiai tinka apdoroti aukšto lygio koncepcijas, tvarkyti ilgus kontekstus ir samprotavimus įvairiose kalbose ir būduose. LAMS papildo šias galimybes generuodami ir vykdydami veiksmus, kurie atlieka vartotojo ketinimus realaus pasaulio scenarijais. Agentrinėse grafikų sistemose LCMS ir LAMS sinergija siūlo vieningą metodą sprendžiant sudėtingas užduotis, kurias reikia planuoti ir vykdyti. Pasitelkdamos žinių grafikus, šios sistemos įgyja sustiprintą atmintį, samprotavimus ir sprendimų priėmimo galimybes, sudarydamos kelią protingesniems ir autonominiams agentams. Nors išlieka iššūkiai, įskaitant mastelio, saugos ir išteklių efektyvumą, nuolatiniai LCM ir LAM architektūros pažanga žada spręsti šias problemas.
Šaltiniai
Be to, nepamirškite sekti mūsų „Twitter“ ir prisijunkite prie mūsų „Telegram“ kanalas ir „LinkedIn GrOUP. Nepamirškite prisijungti prie mūsų 70K+ ml subreddit.
🚨 (Rekomenduojama skaityti) „Nebius AI Studio“ plečiasi su „Vision“ modeliais, naujais kalbų modeliais, įterpimais ir „Lora“ (Paaukštintas)
Aswinas AK yra „MarktechPost“ konsultavimo praktikantas. Jis siekia dvigubo laipsnio Indijos technologijos institute Kharagpur. Jis aistringai vertina duomenų mokslą ir mašininį mokymąsi, sukelia stiprią akademinę patirtį ir praktinę patirtį sprendžiant realaus gyvenimo įvairių sričių iššūkius.
📄


