„Microsoft“ turi išleido Phi-4, kompaktišką ir efektyvų mažos kalbos modelį Hugging Face pagal MIT licenciją. Šis sprendimas pabrėžia perėjimą prie skaidrumo ir bendradarbiavimo dirbtinio intelekto bendruomenėje, suteikiant kūrėjams ir tyrėjams naujų galimybių.
Kas yra „Microsoft Phi-4“?
Phi-4 yra 14 milijardų parametrų kalbos modelis, sukurtas daugiausia dėmesio skiriant duomenų kokybei ir efektyvumui. Skirtingai nuo daugelio modelių, kurie labai priklauso nuo natūralių duomenų šaltinių, „Phi-4“ apima aukštos kokybės sintetinius duomenis, sugeneruotus taikant novatoriškus metodus, tokius kaip kelių agentų raginimas, nurodymų keitimas ir savaiminio tikrinimo darbo eigos. Šie metodai pagerina jos samprotavimo ir problemų sprendimo galimybes, todėl tinka užduotims, kurioms reikia niuansų supratimo.
„Phi-4“ sukurtas naudojant tik dekoderiui skirtą „Transformer“ architektūrą, kurios kontekstinis ilgis yra 16 000 žetonų, todėl užtikrinamas universalumas didelės įvesties programoms. Jo išankstinis mokymas apėmė maždaug 10 trilijonų žetonų, naudojant sintetinių ir labai kuruojamų organinių duomenų derinį, kad būtų pasiektas geras našumas atliekant tokius etalonus kaip MMLU ir HumanEval.
Savybės ir privalumai
- Kompaktiškas ir prieinamas: efektyviai veikia su vartotojų klasės aparatine įranga.
- Patobulintas samprotavimas: pranoksta savo pirmtaką ir didesnius modelius atliekant STEM užduotis.
- Pritaikoma: palaiko koregavimą naudojant įvairius sintetinius duomenų rinkinius, pritaikytus konkrečioms domeno reikmėms.
- Lengva integracija: pasiekiama Hugging Face su išsamia dokumentacija ir API.
Kodėl atvirasis šaltinis?
Atvirojo šaltinio „Phi-4“ skatina bendradarbiavimą, skaidrumą ir platesnį pritaikymą. Pagrindinės motyvacijos:
- Bendradarbiavimo tobulinimas: Tyrėjai ir kūrėjai gali patobulinti modelio veikimą.
- Švietimo prieiga: Laisvai prieinami įrankiai leidžia mokytis ir eksperimentuoti.
- Universalumas kūrėjams: Phi-4 našumas ir prieinamumas daro jį patraukliu pasirinkimu realaus pasaulio programoms.
Techninės naujovės Phi-4
„Phi-4“ kūrimas buvo grindžiamas trimis ramsčiais:
- Sintetiniai duomenys: Sukurti naudojant kelių agentų ir savaiminio peržiūros metodus, sintetiniai duomenys sudaro „Phi-4“ mokymo proceso esmę, stiprinančią samprotavimo galimybes ir sumažinant priklausomybę nuo natūralių duomenų.
- Patobulinimai po treniruotės: Tokios technologijos kaip atmetimo atranka ir tiesioginis nuostatų optimizavimas (DPO) pagerina išvesties kokybę ir suderinimą su žmogaus pageidavimais.
- Nukenksminti mokymo duomenys: Griežti filtravimo procesai užtikrino, kad duomenys, kurie sutampa su etalonais, pašalinami, o tai pagerino apibendrinimą.
„Phi-4“ taip pat naudoja „Pivotal Token Search“ (PTS), kad nustatytų svarbiausius sprendimų priėmimo taškus savo atsakymuose ir pagerintų jos gebėjimą efektyviai atlikti samprotavimus reikalaujančias užduotis.
Prieiga prie Phi-4
„Phi-4“ talpinamas Hugging Face pagal MIT licenciją. Vartotojai gali:
- Pasiekite modelio kodą ir dokumentaciją.
- Tiksliai sureguliuokite jį konkrečioms užduotims, naudodami pateiktus duomenų rinkinius ir įrankius.
- Pasinaudokite API sklandžiam integravimui į projektus.
Poveikis AI
Sumažindama kliūtis pažangiems AI įrankiams, „Phi-4“ skatina:
- Tyrimų augimas: palengvina eksperimentavimą tokiose srityse kaip STEM ir daugiakalbės užduotys.
- Patobulintas švietimas: suteikia praktinio mokymosi šaltinio studentams ir pedagogams.
- Pramonės programos: įgalina ekonomiškus sprendimus tokioms problemoms kaip klientų aptarnavimas, vertimas ir dokumentų apibendrinimas.
Bendruomenė ir ateitis
„Phi-4“ leidimas buvo gerai įvertintas, o kūrėjai dalijasi tiksliai suderintomis adaptacijomis ir naujoviškomis programomis. Jos gebėjimas tobulėti STEM samprotavimo etalonuose rodo, kad jis gali iš naujo apibrėžti, ką gali pasiekti mažos kalbos modeliai. Tikimasi, kad „Microsoft“ bendradarbiavimas su „Hugging Face“ paskatins daugiau atvirojo kodo iniciatyvų, kurios paskatins dirbtinio intelekto naujoves.
Išvada
Atviras „Phi-4“ šaltinis atspindi „Microsoft“ įsipareigojimą demokratizuoti AI. Padarydama galingą kalbos modelį laisvai prieinamą, bendrovė įgalina pasaulinę bendruomenę kurti naujoves ir bendradarbiauti. Kadangi Phi-4 ir toliau randa įvairių pritaikymų, jis parodo atvirojo kodo AI transformacinį potencialą tobulinant mokslinius tyrimus, švietimą ir pramonę.
Patikrinkite Popierius ir modelis ant apsikabinusio veido. Visi nuopelnai už šį tyrimą tenka šio projekto tyrėjams. Taip pat nepamirškite sekti mūsų Twitter ir prisijunk prie mūsų Telegramos kanalas ir LinkedIn group. Nepamirškite prisijungti prie mūsų 60k+ ML SubReddit.
🚨 NEMOKAMAS BŪTINAS AI internetinis seminaras (2025 M. SAUSIO 15 d.): padidinkite LLM tikslumą naudodami sintetinius duomenis ir įvertinimo informaciją–Prisijunkite prie šio internetinio seminaro, kad gautumėte veiksmingų įžvalgų, kaip padidinti LLM modelio našumą ir tikslumą, kartu išsaugant duomenų privatumą.
Asif Razzaq yra „Marktechpost Media Inc.“ generalinis direktorius. Kaip verslininkas ir inžinierius, Asif yra įsipareigojęs panaudoti dirbtinio intelekto potencialą socialinei gerovei. Naujausias jo siekis yra dirbtinio intelekto medijos platformos „Marktechpost“ paleidimas, kuri išsiskiria išsamia mašininio mokymosi ir gilaus mokymosi naujienomis, kurios yra techniškai pagrįstos ir lengvai suprantamos plačiajai auditorijai. Platforma gali pasigirti daugiau nei 2 milijonais peržiūrų per mėnesį, o tai rodo jos populiarumą tarp auditorijos.
✅ (Rekomenduojama skaityti) „Nebius AI Studio“ plečiasi regėjimo modeliais, naujais kalbos modeliais, įterpimais ir LoRA (reklamuojama)