„Meta AI“ tiesiog atviro kodo „Llama 3.3“: naujas 70B daugiakalbis didelės kalbos modelis (LLM)

Ką tik išleistas Meta AI Lama 3.3atvirojo kodo kalbos modelis, sukurtas siekiant pasiūlyti geresnį teksto programų, pvz., sintetinių duomenų generavimo, našumą ir kokybę už daug mažesnę kainą. „Llama 3.3“ sprendžia kai kuriuos pagrindinius NLP erdvės iššūkius, pateikdama įperkamesnį ir lengviau naudojamą sprendimą. Šios versijos patobulinimai daugiausia susiję su nauju derinimo procesu ir pažanga internetinio sustiprinimo mokymosi srityje. Iš esmės „Llama 3.3“ našumas panašus į savo pirmtaką „Llama 3.1–405B“, tačiau mažesnis, 70 milijardų parametrų modelis, kuris gali veikti naudojant įprastą kūrėjo aparatinę įrangą. Dėl to pažangios AI galimybės tampa labiau prieinamos platesnei auditorijai.

„Llama 3.3“ yra su keliais techniniais atnaujinimais, kurie padidina jos praktiškumą. Vienas iš pagrindinių patobulinimų yra parametrų skaičiaus sumažinimas – nuo 405 milijardų Llama 3.1 iki vos 70 milijardų – neprarandant našumo. Tai buvo pasiekta optimizuojant internetines nuostatas ir geriau suderinant mokymo procesą. Modelio suderinimas su vartotojo nuostatomis, pagrįstas mokymu, reiškia, kad jis gali sukurti tinkamesnius ir kontekstą suvokiančius atsakymus. Mažesnis dydis taip pat palengvina diegimą, nes reikalauja mažiau skaičiavimo galios ir atminties. Kūrėjai dabar gali paleisti Llama 3.3 savo asmeniniuose kompiuteriuose, o ne pasikliauti brangiais GPU ar debesų infrastruktūra, o tai žymiai padidina prieigą prie aukštos kokybės NLP įrankių.

„Meta AI“ plačiai išbandė „Llama 3.3“, o rezultatai buvo įspūdingi. Modelis gerai veikė keliuose etalonuose, puikiai atlikdamas tokias užduotis kaip atsakymas į klausimus, apibendrinimas ir sintetinių duomenų generavimas. Jo našumas panašus į didesnio Llama 3.1–405B modelio našumą, tačiau su daug mažesniais skaičiavimo reikalavimais. Dėl to tai puiki galimybė kūrėjams ir organizacijoms, kurios anksčiau negalėjo sau leisti naudoti didelių kalbų modelių. „Llama 3.3“ taip pat turi puikias daugiakalbes galimybes, todėl ji puikiai tinka programoms, kurioms reikia niuansų kelių kalbų supratimo. Meta AI pabrėžė savo ekonomiškai efektyvią išvadą, todėl tai yra praktiškas pasirinkimas kuriant turinį, generuojant sintetinius duomenis ir interaktyvius įrankius, tokius kaip pokalbių robotai, ypač ribotų išteklių aplinkoje.

Apibendrinant galima pasakyti, kad „Llama 3.3“ yra didelis žingsnis į priekį, kad galingi kalbų modeliai būtų prieinamesni. Siūlydamas daug didesnio modelio, kuris gali veikti naudojant standartinę aparatinę įrangą, našumą, „Meta AI“ padeda sumažinti kliūtis naudoti pažangias NLP technologijas. „Llama 3.3“ suteikia sudėtingų AI įrankių platesniam žmonių ratui, įskaitant kūrėjus, pedagogus ir tyrėjus, skatinant daugiau naujovių ir kūrybiškumo dirbtinio intelekto erdvėje.

Patikrinkite modelis ant apsikabinusio veido. Visi nuopelnai už šį tyrimą tenka šio projekto tyrėjams. Taip pat nepamirškite sekti mūsų Twitter ir prisijunk prie mūsų Telegramos kanalas ir LinkedIn group. Jei jums patinka mūsų darbai, jums patiks ir mūsų darbai naujienlaiškis.. Nepamirškite prisijungti prie mūsų 60k+ ML SubReddit.

🚨 (Partneris su mumis): „Kitas žurnalas/ataskaita – gaminamas atvirojo kodo AI“

Asifas Razzaqas yra „Marktechpost Media Inc.“ generalinis direktorius. Kaip verslininkas ir inžinierius, Asif yra įsipareigojęs panaudoti dirbtinio intelekto potencialą socialinei gerovei. Naujausias jo siekis yra dirbtinio intelekto medijos platformos „Marktechpost“ paleidimas, kuri išsiskiria išsamia mašininio mokymosi ir gilaus mokymosi naujienomis, kurios yra techniškai pagrįstos ir lengvai suprantamos plačiajai auditorijai. Platforma gali pasigirti daugiau nei 2 milijonais peržiūrų per mėnesį, o tai rodo jos populiarumą tarp auditorijos.

🚨🚨NEMOKAMAS AI INTERNETINĖS SEMINARAS: „Fast Track your LLM Apps with deepset & Haystack“ (reklamuojama)

Source link

„Meta AI“ tiesiog atviro kodo „Llama 3.3“: naujas 70B daugiakalbis didelės kalbos modelis (LLM)

Latest News

ProxyWing Residential Proxy: praktinė apžvalga rinkodaros specialistams ir tyrinėtojams

nuo grandiozinių projektų iki naujų patogumų gyventojams

Esminiai kibernetinio saugumo įrankiai, kuriuos 2026 m. turėtų naudoti kiekvienas kūrėjas

„Hermes“ agentas prideda asinchroninių antrinių agentų, todėl deleguotas darbas nebeblokuoja tėvų pokalbių

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.

Latest News

ProxyWing Residential Proxy: praktinė apžvalga rinkodaros specialistams ir tyrinėtojams

nuo grandiozinių projektų iki naujų patogumų gyventojams

Esminiai kibernetinio saugumo įrankiai, kuriuos 2026 m. turėtų naudoti kiekvienas kūrėjas

„Hermes“ agentas prideda asinchroninių antrinių agentų, todėl deleguotas darbas nebeblokuoja tėvų pokalbių