Dirbtinio intelekto (AI) modeliai per pastaruosius kelerius metus padarė didelę pažangą, tačiau jie ir toliau susiduria su kritiniais iššūkiais, ypač atliekant samprotavimo užduotis. Didelės kalbos modeliai geba kurti nuoseklų tekstą, tačiau kai reikia sudėtingų samprotavimų ar problemų sprendimo, jie dažnai nepasiseka. Šis trūkumas ypač akivaizdus tose srityse, kuriose reikalinga struktūrizuota, laipsniška logika, pavyzdžiui, matematinis samprotavimas ar kodų laužymas. Nepaisant įspūdingų generavimo galimybių, modelių mąstymo procesai paprastai neturi skaidrumo, o tai riboja jų patikimumą. Vartotojai dažnai spėlioja, kaip buvo padaryta išvada, todėl atsiranda pasitikėjimo atotrūkis tarp AI rezultatų ir vartotojų lūkesčių. Norint išspręsti šias problemas, vis labiau reikia modelių, kurie galėtų pateikti visapusišką samprotavimą, aiškiai parodydami žingsnius, kurie lėmė jų išvadas.
DeepSeek-R1-Lite-Preview: naujas požiūris į skaidrų samprotavimą
„DeepSeek“ padarė pažangą šalindama šias samprotavimo spragas, paleisdama DeepSeek-R1-Lite-Previewmodelis, kuris ne tik pagerina našumą, bet ir suteikia skaidrumo sprendimų priėmimo procese. Modelis atitinka „OpenAI“ o1 peržiūros lygio našumą ir dabar jį galima išbandyti naudojant „DeepSeek“ pokalbių sąsają, kuri yra optimizuota išplėstinėms samprotavimo užduotims atlikti. Šiuo leidimu siekiama pašalinti AI pagrįsto problemų sprendimo trūkumus, siūlant išsamius argumentavimo rezultatus. „DeepSeek-R1-Lite-Preview“ demonstruoja savo galimybes per tokius etalonus kaip AIME ir MATH, todėl yra perspektyvi alternatyva kai kuriems pažangiausiems pramonės modeliams.
Techninės detalės
„DeepSeek-R1-Lite-Preview“ žymiai pagerina samprotavimą, įtraukdama mąstymo grandinės (CoT) galimybes. Ši funkcija leidžia AI pateikti savo mąstymo procesą realiu laiku, todėl vartotojai gali sekti loginius žingsnius, kurių imamasi, kad pasiektų sprendimą. Toks skaidrumas yra labai svarbus vartotojams, kuriems reikia išsamios įžvalgos apie tai, kaip dirbtinio intelekto modelis daro išvadas, nesvarbu, ar jie yra studentai, profesionalai ar tyrėjai. Modelio gebėjimas susidoroti su sudėtingais raginimais ir parodyti mąstymo procesą padeda išsiaiškinti AI pagrįstus rezultatus ir įkvepia pasitikėjimą jo tikslumu. „DeepSeek-R1-Lite-Preview“, pasižymintis o1 peržiūros lygio našumu pagal pramonės etalonus, pvz., AIME (Amerikos kviečiamasis matematikos egzaminas) ir MATH, yra stiprus varžovas pažangių AI modelių srityje. Be to, modelis ir jo API turi būti atvirojo kodo, todėl šios galimybės bus prieinamos platesnei bendruomenei eksperimentuoti ir integruoti.
Reikšmė ir rezultatai
„DeepSeek-R1-Lite-Preview“ skaidrūs samprotavimai rodo reikšmingą AI programų pažangą švietimo, problemų sprendimo ir tyrimų srityse. Vienas iš svarbiausių daugelio pažangių kalbos modelių trūkumų yra jų neskaidrumas; jie daro išvadas neatskleisdami savo pagrindinių procesų. Pateikdama skaidrią, nuoseklią minčių grandinę, „DeepSeek“ užtikrina, kad vartotojai galėtų matyti ne tik galutinį atsakymą, bet ir suprasti motyvus, kurie jį paskatino. Tai ypač naudinga taikant švietimo technologijas, kur suprasti „kodėl“ dažnai yra taip pat svarbu, kaip ir „ką“. Atliekant lyginamąjį testavimą, modelis parodė našumo lygius, panašius į OpenAI o1 peržiūrą, ypač atliekant sudėtingas užduotis, tokias kaip AIME ir MATH. Vienas bandomasis raginimas apėmė teisingos skaičių sekos iššifravimą remiantis įkalčiais – užduotimis, kurioms reikia kelių samprotavimų sluoksnių, kad būtų pašalintos neteisingos parinktys ir būtų priimtas sprendimas. DeepSeek-R1-Lite-Preview pateikė teisingą atsakymą (3841), išlaikant skaidrią išvestį, paaiškinantį kiekvieną samprotavimo proceso žingsnį.
Išvada
„DeepSeek“ pristatyta „DeepSeek-R1-Lite-Preview“ žymi reikšmingą AI samprotavimo galimybių pažangą, pašalindama kai kuriuos esminius dabartinių modelių trūkumus. Prilygindama OpenAI o1 etaloniniam našumui ir padidindama sprendimų priėmimo skaidrumą, „DeepSeek“ sugebėjo prasmingai peržengti AI ribas. Realaus laiko mąstymo procesas ir būsimas atvirojo kodo modelis bei API leidimas rodo „DeepSeek“ įsipareigojimą padaryti pažangias AI technologijas prieinamesnes. Sričiai ir toliau tobulėjant, tokie modeliai kaip „DeepSeek-R1-Lite-Preview“ gali suteikti aiškumo, tikslumo ir prieinamumo atliekant sudėtingas samprotavimo užduotis įvairiose srityse. Dabar vartotojai turi galimybę išbandyti samprotavimo modelį, kuris ne tik pateikia atsakymus, bet ir atskleidžia jų motyvus, todėl dirbtinis intelektas tampa suprantamesnis ir patikimesnis.
Patikrinkite Oficialus tviteris ir išbandykite čia. Visi nuopelnai už šį tyrimą tenka šio projekto tyrėjams. Taip pat nepamirškite sekti mūsų Twitter ir prisijunk prie mūsų Telegramos kanalas ir LinkedIn group. Jei jums patinka mūsų darbai, jums patiks ir mūsų darbai naujienlaiškis.. Nepamirškite prisijungti prie mūsų 55k+ ML SubReddit.
(NEMOKAMA AI VIRTUALI KONFERENCIJA) „SmallCon“: nemokama virtuali „GenAI“ konferencija „Meta“, „Mistral“, „Salesforce“, „Harvey AI“ ir kt.. Prisijunkite prie mūsų gruodžio 11 d. šiame nemokamajame virtualiame renginyje ir sužinokite, ko reikia norint sukurti didelius mažus modelius iš AI pirmtakų, tokių kaip Meta, Mistral AI, Salesforce, Harvey AI, Upstage, Nubank, Nvidia, Hugging Face ir kt.
Asif Razzaq yra „Marktechpost Media Inc.“ generalinis direktorius. Kaip verslininkas ir inžinierius, Asif yra įsipareigojęs panaudoti dirbtinio intelekto potencialą socialinei gerovei. Naujausias jo siekis yra dirbtinio intelekto medijos platformos „Marktechpost“ paleidimas, kuri išsiskiria išsamia mašininio mokymosi ir gilaus mokymosi naujienomis, kurios yra techniškai pagrįstos ir lengvai suprantamos plačiajai auditorijai. Platforma gali pasigirti daugiau nei 2 milijonais peržiūrų per mėnesį, o tai rodo jos populiarumą tarp auditorijos.
🐝🐝 Perskaitykite šią „Kili Technology“ AI tyrimo ataskaitą „Didelių kalbos modelio pažeidžiamumo įvertinimas: lyginamoji raudonųjų komandų sudarymo metodų analizė“