IBM išleido Granite 3.0 2B ir 8B AI modelius dirbtinio intelekto įmonėms

Dirbtinis intelektas sparčiai tobulėja, tačiau įmonės susiduria su daugybe kliūčių, bandydamos veiksmingai panaudoti AI. Organizacijoms reikalingi modeliai, kurie būtų pritaikomi, saugūs ir gali suprasti konkrečias domeno aplinkybes, kartu išlaikant atitikties ir privatumo standartus. Tradiciniai AI modeliai dažnai stengiasi užtikrinti tokį pritaikytą našumą, todėl įmonėms reikia kompromiso tarp pritaikymo ir bendro pritaikymo. Be to, daugeliui dirbtinio intelekto modelių trūksta skaidrumo, o tai trukdo pasitikėti įmonių naudotojais.

IBM oficialiai išleido Granite 3.0 AI Models – naują pagrindinių modelių liniją, skirtą įmonėms suteikti pažangias AI galimybes. Šie modeliai yra esminis žingsnis į priekį IBM nuolatinėje pastangoje teikti įmonėms dirbtinio intelekto sprendimus, kurie būtų ne tik našūs, bet ir saugūs bei patikimi. Granite 3.0 modeliai sukurti taip, kad palaikytų įvairius naudojimo atvejus įmonės aplinkoje, pradedant natūralios kalbos supratimu ir baigiant patobulintais sprendimų priėmimo procesais. Sukurta IBM watsonx AI ir duomenų platformoje, „Granite 3.0“ siekia leisti įmonėms lengvai integruoti dirbtinį intelektą į savo darbo eigą, taip padidinant efektyvumą ir laikantis specifinių saugos ir privatumo poreikių, kurių dažnai reikalauja įmonės.

Techniškai kalbant, IBM Granite 3.0 AI modeliai yra sukurti naudojant didelių kalbų modelius (LLM), sukurtus specialiai įmonių AI programoms. Tai apima 8B ir 2B parametrų tankio dekoderio modelius, kurie Hugging Face OpenLLM pirmaujančiųjų sąraše (v2) pralenkė panašaus dydžio Llama-3.1 8B. Modeliai apmokyti naudojant daugiau nei 12 trilijonų žetonų 12 kalbų ir 116 programavimo kalbų, suteikiant universalų natūralios kalbos apdorojimo (NLP) užduočių pagrindą ir užtikrinantį privatumą bei saugumą. Turėdama galimybes suprasti nestruktūrizuotus duomenis, generuoti turinį, apibendrinti informaciją ir netgi palengvinti sudėtingų sprendimų priėmimą, „Granite 3.0“ užtikrina galingas NLP funkcijas saugiai ir skaidriai.

Be to, šie modeliai yra atviri ir išplečiami, todėl kūrėjai gali juos pritaikyti pagal savo įmonės reikalavimus. Modeliai yra licencijuoti pagal Apache 2.0 su atskleistais mokymo duomenimis ir metodais ir yra prieinami IBM Watsonx platformoje bei per partnerius. Pažymėtina, kad modeliai buvo mokomi naudojant 100 % atsinaujinančią energiją, o tai pabrėžia IBM įsipareigojimą siekti tvarumo.

Viena iš svarbiausių priežasčių, kodėl Granite 3.0 yra reikšmingas patobulinimas, yra jos dėmesys atvirumui, išplėtimui ir skaidrumui, o tai pašalina vieną iš pagrindinių kliūčių dirbtinio intelekto pritaikymui įmonės aplinkoje – pasitikėjimą. „Granite 3.0“ suteikia skaidrumo, kaip sukurti modeliai, ir turi visą dokumentaciją, todėl įmonėms lengviau suprasti, kaip modelis priima sprendimus. Be to, Granite 3.0 integracija su Watsonx platforma reiškia, kad ji turi naudos iš Watsonx įrankių rinkinio, kuris apima duomenų valdymo, modelio stebėjimo ir greito derinimo galimybes.

Remiantis IBM etalonu, Granite 3.0 parodė didesnį tikslumą atliekant specifines pramonės užduotis, palyginti su ankstesniais modeliais, todėl įmonių naudotojai gali priimti daugiau sprendimų. Modeliai konkuruoja su Meta ir Mistral AI modeliais pagal akademinius etalonus, pirmauja RAGBench atliekant įmonės užduotis, pasižymi kibernetinio saugumo etalonu ir lenkia bendraamžius pagal funkcijų iškvietimo etalonus. Pramonėje pirmaujantis atsparumas priešpriešinio greito etalono AttaQ dar labiau įrodo Granite 3.0 patikimumą. Atvirojo kodo elementų naudojimas taip pat leidžia organizacijoms atlikti auditą ir tobulinti modelius, kad jie atitiktų konkrečius poreikius, taip sumažinant laiką ir pastangas, kurių reikia dirbtinio intelekto pritaikymui ir diegimui.

„Granite 3.0“ leidimas taip pat apima išvadas efektyvius pasiūlymus, pvz., „Mixture of Experts“ (MoE) modelius – 3B-A800M ir 1B-A400M, skirtus dideliam efektyvumui įrenginiuose, procesoriaus serveriuose ir mažos delsos naudojimo atvejais. Be to, spekuliacinis dekoderio modelis paspartina išvadas 220 % dėl žetonų kondicionavimo naujovių ir dviejų fazių mokymo. Dėl šių pažangų Granite 3.0 ypač patraukli įmonėms, kurioms reikia ne tik didelio našumo, bet ir efektyvių bei ekonomiškų diegimo galimybių.

IBM Granite 3.0 AI modeliai žymi svarbų šuolį įmonės AI srityje, sutelkiant dėmesį į konkrečius saugumo, pritaikomumo ir skaidrumo reikalavimus. Teikdama atvirus ir išplečiamus modelius, integruojamus su IBM Watsonx AI platforma, „Granite 3.0“ padeda įmonėms įveikti kai kurias tradicines AI pritaikymo kliūtis, pvz., susirūpinimą dėl privatumo, tinkinimo trūkumą ir pasitikėjimą AI sistemomis. Dėl „Granite 3.0“ universalumo natūralios kalbos užduotims atlikti, kartu su skaidrumu ir lengvomis integravimo galimybėmis, ji yra vertinga priemonė įmonėms, norinčioms efektyviai ir atsakingai panaudoti dirbtinį intelektą. Organizacijoms ir toliau naršant sudėtingose dirbtinio intelekto įgyvendinimo srityse, IBM Granite 3.0 yra idealus pagrindas inovacijoms skatinti, veiklos efektyvumui ir geresniam sprendimų priėmimui įvairiose pramonės šakose.

Patikrinkite Išsami informacija ir modelis ant apsikabinusio veido. Visi nuopelnai už šį tyrimą tenka šio projekto tyrėjams. Taip pat nepamirškite sekti mūsų Twitter ir prisijunk prie mūsų Telegramos kanalas ir LinkedIn group. Jei jums patinka mūsų darbai, jums patiks ir mūsų darbai naujienlaiškis.. Nepamirškite prisijungti prie mūsų 50 000+ ML SubReddit.

(Būsimas tiesioginis internetinis seminaras – 2024 m. spalio 29 d.) Geriausia platforma, skirta tiksliai suderintiems modeliams aptarnauti: „Predibase Inference Engine“ (reklamuojama)

Asif Razzaq yra „Marktechpost Media Inc.“ generalinis direktorius. Kaip verslininkas ir inžinierius, Asif yra įsipareigojęs panaudoti dirbtinio intelekto potencialą socialinei gerovei. Naujausias jo siekis yra dirbtinio intelekto medijos platformos „Marktechpost“ paleidimas, kuri išsiskiria išsamia mašininio mokymosi ir gilaus mokymosi naujienomis, kurios yra techniškai pagrįstos ir lengvai suprantamos plačiajai auditorijai. Platforma gali pasigirti daugiau nei 2 milijonais peržiūrų per mėnesį, o tai rodo jos populiarumą tarp auditorijos.

Klausykite mūsų naujausių AI podcast'ų ir AI tyrimų vaizdo įrašų čia ➡️

Source link

IBM išleido Granite 3.0 2B ir 8B AI modelius dirbtinio intelekto įmonėms

Latest News

ProxyWing Residential Proxy: praktinė apžvalga rinkodaros specialistams ir tyrinėtojams

nuo grandiozinių projektų iki naujų patogumų gyventojams

Esminiai kibernetinio saugumo įrankiai, kuriuos 2026 m. turėtų naudoti kiekvienas kūrėjas

„Hermes“ agentas prideda asinchroninių antrinių agentų, todėl deleguotas darbas nebeblokuoja tėvų pokalbių

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.

Latest News

ProxyWing Residential Proxy: praktinė apžvalga rinkodaros specialistams ir tyrinėtojams

nuo grandiozinių projektų iki naujų patogumų gyventojams

Esminiai kibernetinio saugumo įrankiai, kuriuos 2026 m. turėtų naudoti kiekvienas kūrėjas

„Hermes“ agentas prideda asinchroninių antrinių agentų, todėl deleguotas darbas nebeblokuoja tėvų pokalbių