Norint įveikti esamų didelio masto modelių apribojimus, reikalingi didelio našumo AI modeliai, kurie gali veikti per kraštus ir asmeniniuose įrenginiuose. Šie modeliai reikalauja didelių skaičiavimo išteklių, todėl jie priklauso nuo debesų aplinkos, o tai kelia pavojų privatumui, padidina delsą ir padidina išlaidas. Be to, debesų priklausomybė netinka scenarijams neprisijungus.
Pristatome Ministral 3B ir Ministral 8B
„Mistral AI“ neseniai pristatė du novatoriškus modelius, kuriais siekiama pakeisti įrenginio ir krašto AI galimybes – „Ministral 3B“ ir „Ministral 8B“. Šie modeliai, bendrai žinomi kaip les Ministraux, sukurti taip, kad galingas kalbų modeliavimo galimybes tiesiogiai pateiktų įrenginiuose, todėl nebereikės debesų kompiuterijos išteklių. Įrenginio AI tampa vis labiau integruota tokiose srityse kaip sveikatos priežiūra, pramonės automatizavimas ir plataus vartojimo elektronika, todėl nauji „Mistral AI“ pasiūlymai yra didelis šuolis įgalinant programas, kurios gali atlikti pažangius skaičiavimus vietoje, saugiai ir ekonomiškiau. Šie modeliai skirti iš naujo apibrėžti, kaip dirbtinis intelektas sąveikauja su fiziniu pasauliu, siūlydami naują savarankiškumo ir prisitaikymo lygį.
Techninė informacija ir privalumai
„Les Ministraux“ techninis dizainas sukurtas siekiant išlaikyti energijos vartojimo efektyvumo ir našumo pusiausvyrą. Ministral 3B ir 8B yra transformatorių pagrindu veikiantys kalbų modeliai, optimizuoti mažesnei energijos sąnaudai, nepakenkiant tikslumui ir išvadų galimybėms. Modeliai pavadinti pagal atitinkamų parametrų skaičių – 3 milijardus ir 8 milijardus parametrų, kurie yra ypač veiksmingi kraštinėse aplinkose, tačiau yra pakankamai tvirti įvairioms natūralios kalbos apdorojimo užduotims atlikti. „Mistral AI“ panaudojo įvairius genėjimo ir kvantavimo metodus, kad sumažintų skaičiavimo apkrovą, todėl šiuos modelius galima naudoti įrenginiuose su ribota aparatinės įrangos talpa, pavyzdžiui, išmaniuosiuose telefonuose ar įterptosiose sistemose. Ministral 3B yra ypač optimizuotas itin efektyviam diegimui įrenginyje, o Ministral 8B siūlo didesnę skaičiavimo galią naudojimo atvejais, kai reikia daugiau niuansų supratimo ir kalbos generavimo.
Svarba ir našumo rezultatai
Ministerial 3B ir 8B reikšmė neapsiriboja jų techninėmis specifikacijomis. Šie modeliai sprendžia pagrindinius esamos AI technologijos apribojimus, pvz., poreikį sumažinti delsą ir pagerinti duomenų privatumą. Laikydami duomenų apdorojimą vietiniu mastu, les Ministraux užtikrina, kad įrenginyje liktų jautrūs naudotojo duomenys, o tai labai svarbu tokiose srityse kaip sveikatos priežiūra ir finansai. Preliminarūs etaloniniai rodikliai parodė įspūdingus rezultatus – pavyzdžiui, „Ministral 8B“ parodė pastebimą užduočių atlikimo rodiklių padidėjimą, palyginti su esamais įrenginio modeliais, išlaikant efektyvumą. Modeliai taip pat leidžia kūrėjams kurti AI programas, kurios mažiau priklauso nuo interneto ryšio, užtikrinant, kad paslaugos išliktų prieinamos net atokiose arba riboto pralaidumo srityse. Dėl to jie idealiai tinka naudoti, kai patikimumas yra labai svarbus, pavyzdžiui, atliekant operacijas lauke ar reaguojant į avarijas.
Išvada
Les Ministraux: Ministral 3B ir Ministral 8B įdiegimas žymi svarbų žingsnį į priekį AI pramonės siekyje pateikti galingesnes skaičiavimo galimybes tiesiai į pažangiausius įrenginius. „Mistral AI“ sutelkia dėmesį į šių modelių optimizavimą, skirtus naudoti įrenginiuose, sprendžia pagrindinius iššūkius, susijusius su privatumu, delsa ir ekonomiškumu, todėl dirbtinis intelektas tampa prieinamesnis ir universalesnis įvairiose srityse. Teikdami pažangiausią našumą be tradicinės priklausomybės nuo debesies, Ministral 3B ir 8B nutiesia kelią ateičiai, kurioje AI gali veikti sklandžiai, saugiai ir efektyviai pačiame pakraštyje. Tai ne tik pagerina naudotojo patirtį, bet ir atveria naujas galimybes naujovėms, kaip dirbtinį intelektą galima integruoti į kasdienius įrenginius ir darbo eigą.
Patikrinkite Detalės ir 8B modelis. Visi nuopelnai už šį tyrimą tenka šio projekto tyrėjams. Taip pat nepamirškite sekti mūsų Twitter ir prisijunk prie mūsų Telegramos kanalas ir LinkedIn group. Jei jums patinka mūsų darbai, jums patiks ir mūsų darbai naujienlaiškis.. Nepamirškite prisijungti prie mūsų 50 000+ ML SubReddit.
(Būsimas tiesioginis internetinis seminaras – 2024 m. spalio 29 d.) Geriausia platforma, skirta tiksliai suderintiems modeliams aptarnauti: „Predibase Inference Engine“ (reklamuojama)
Asif Razzaq yra „Marktechpost Media Inc.“ generalinis direktorius. Kaip verslininkas ir inžinierius, Asif yra įsipareigojęs panaudoti dirbtinio intelekto potencialą socialinei gerovei. Naujausias jo siekis yra dirbtinio intelekto medijos platformos „Marktechpost“ paleidimas, kuri išsiskiria išsamia mašininio mokymosi ir gilaus mokymosi naujienomis, kurios yra techniškai pagrįstos ir lengvai suprantamos plačiajai auditorijai. Platforma gali pasigirti daugiau nei 2 milijonais peržiūrų per mėnesį, o tai rodo jos populiarumą tarp auditorijos.