„OpenAI“ skelbia „OpenAI o3: išmatuotą pažangą dirbtinio intelekto samprotavime su 87,5 % Arc AGI etalonų balu“

Gruodžio 20 d. „OpenAI“ paskelbė apie „OpenAI o3“, naujausią „o-Model Reasoning“ serijos modelį. Remdamasi savo pirmtakais, o3 demonstruoja matematinio ir mokslinio samprotavimo pažangą, sukeldama diskusijas apie savo galimybes ir apribojimus. Šiame straipsnyje atidžiau apžvelgiamos įžvalgos ir pasekmės, susijusios su OpenAI o3, pateikiama informacija iš oficialių pranešimų, ekspertų analizės ir bendruomenės reakcijos.

Turinys

Pažanga samprotavimo galimybių srityje

OpenAI apibūdina o3 kaip modelį, skirtą patobulinti samprotavimus tose srityse, kuriose reikia struktūrizuoto mąstymo, pavyzdžiui, matematikos ir gamtos mokslų. Modelis buvo išbandytas naudojant specializuotą samprotavimo etaloną ARC AGI, kuris, kaip pranešama, viršijo ankstesnio modelio balą 32% ir pakilo iki 87%. Ši pažanga parodo patobulintą o3 gebėjimą spręsti sudėtingas logines ir matematikos problemas.

šaltinis: https://arcprize.org/blog/oai-o3-pub-breakthrough

Patobulinti modelio gebėjimai kyla dėl architektūros, pritaikytos hierarchinėms samprotavimo užduotims. Nors tai yra žingsnis link platesnio mąstymo gebėjimų, OpenAI pripažįsta, kad o3 toli gražu nepasiekia dirbtinio bendro intelekto (AGI).

Veiklos apžvalga

šaltinis: https://x.com/OpenAI/status/1870186518230511844

Matematika: Pažangių matematinių testų sėkmės rodiklis buvo 96,7%, o tai yra pastebimas pagerėjimas, palyginti su o1 56,7%.
Mokslinis samprotavimas: Rodomas 10 % didesnis tikslumas sprendžiant doktorantūros lygio mokslo klausimus.
Kodo supratimas: įrodytas gebėjimas suprasti ir derinti kodo fragmentus, suteikiant galimą naudą kuriant programinę įrangą.

Architektūros naujovės

OpenAI o3 naudoja hibridinę samprotavimo sistemą, sujungiančią neuroninį-simbolinį mokymąsi su tikimybine logika. Ši architektūra leidžia modeliui:

Suskaidyti problemas: supaprastinkite sudėtingas užklausas į mažesnius, valdomus komponentus.
Sverto kontekstas: naudokite išplėstinę atmintį, kad išlaikytumėte kontekstą ilgos sąveikos metu.
Pakartokite sprendimus: Patikslinkite atsakymus per kelis samprotavimo ciklus.

Dėl šių savybių o3 ypač tinka sprendžiant kelių etapų mąstymo iššūkius, kai tradiciniai transformatoriumi pagrįsti modeliai dažnai šlubuoja.

Realaus pasaulio programos

OpenAI o3 gali būti naudingas kelioms sritims:

Išsilavinimas: Padėkite studentams spręsti sudėtingas matematines ir mokslines problemas.
Sveikatos priežiūra: palaikykite diagnostikos procesus ir optimizuokite gydymo planus, analizuodami duomenis.
Programinės įrangos kūrimas: derinkite ir generuokite kodą, suteikdami praktinę pagalbą kūrėjams.

Platesnė OpenAI vizija

OpenAI išleido vaizdo įrašą, iliustruojantį jos AI samprotavimo viziją. Demonstracijos apima o3, skirtą fizikos, matematikos ir etinių dilemų problemoms spręsti, pabrėžiant jos siekius sukurti modelius, galinčius mąstyti įvairiais scenarijais.

Taip pat nepamirškite sekti mūsų Twitter ir prisijunk prie mūsų Telegramos kanalas ir LinkedIn group. Nepamirškite prisijungti prie mūsų 60k+ ML SubReddit.

🚨 Populiarumas: LG AI tyrimų išleidimas EXAONE 3.5: trys atvirojo kodo dvikalbiai AI lygio modeliai, teikiantys neprilygstamas instrukcijas ir ilgą konteksto supratimą, kad būtų pasaulinė lyderystė kuriant AI tobulumą….

Asif Razzaq yra „Marktechpost Media Inc.“ generalinis direktorius. Kaip verslininkas ir inžinierius, Asif yra įsipareigojęs panaudoti dirbtinio intelekto potencialą socialinei gerovei. Naujausias jo siekis yra dirbtinio intelekto medijos platformos „Marktechpost“ paleidimas, kuri išsiskiria išsamia mašininio mokymosi ir gilaus mokymosi naujienomis, kurios yra techniškai pagrįstos ir lengvai suprantamos plačiajai auditorijai. Platforma gali pasigirti daugiau nei 2 milijonais peržiūrų per mėnesį, o tai rodo jos populiarumą tarp auditorijos.

🧵🧵 (Atsisiųsti) Didelių kalbų modelio pažeidžiamumo ataskaitos įvertinimas (reklamuojamas)

Source link

„OpenAI“ skelbia „OpenAI o3: išmatuotą pažangą dirbtinio intelekto samprotavime su 87,5 % Arc AGI etalonų balu“

Pažanga samprotavimo galimybių srityje

Veiklos apžvalga

Architektūros naujovės

Realaus pasaulio programos

Platesnė OpenAI vizija

Latest News

ProxyWing Residential Proxy: praktinė apžvalga rinkodaros specialistams ir tyrinėtojams

nuo grandiozinių projektų iki naujų patogumų gyventojams

Esminiai kibernetinio saugumo įrankiai, kuriuos 2026 m. turėtų naudoti kiekvienas kūrėjas

„Hermes“ agentas prideda asinchroninių antrinių agentų, todėl deleguotas darbas nebeblokuoja tėvų pokalbių

Pažanga samprotavimo galimybių srityje

Veiklos apžvalga

Architektūros naujovės

Realaus pasaulio programos

Platesnė OpenAI vizija

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.

Latest News

ProxyWing Residential Proxy: praktinė apžvalga rinkodaros specialistams ir tyrinėtojams

nuo grandiozinių projektų iki naujų patogumų gyventojams

Esminiai kibernetinio saugumo įrankiai, kuriuos 2026 m. turėtų naudoti kiekvienas kūrėjas

„Hermes“ agentas prideda asinchroninių antrinių agentų, todėl deleguotas darbas nebeblokuoja tėvų pokalbių