Gruodžio 20 d. „OpenAI“ paskelbė apie „OpenAI o3“, naujausią „o-Model Reasoning“ serijos modelį. Remdamasi savo pirmtakais, o3 demonstruoja matematinio ir mokslinio samprotavimo pažangą, sukeldama diskusijas apie savo galimybes ir apribojimus. Šiame straipsnyje atidžiau apžvelgiamos įžvalgos ir pasekmės, susijusios su OpenAI o3, pateikiama informacija iš oficialių pranešimų, ekspertų analizės ir bendruomenės reakcijos.
Pažanga samprotavimo galimybių srityje
OpenAI apibūdina o3 kaip modelį, skirtą patobulinti samprotavimus tose srityse, kuriose reikia struktūrizuoto mąstymo, pavyzdžiui, matematikos ir gamtos mokslų. Modelis buvo išbandytas naudojant specializuotą samprotavimo etaloną ARC AGI, kuris, kaip pranešama, viršijo ankstesnio modelio balą 32% ir pakilo iki 87%. Ši pažanga parodo patobulintą o3 gebėjimą spręsti sudėtingas logines ir matematikos problemas.

Patobulinti modelio gebėjimai kyla dėl architektūros, pritaikytos hierarchinėms samprotavimo užduotims. Nors tai yra žingsnis link platesnio mąstymo gebėjimų, OpenAI pripažįsta, kad o3 toli gražu nepasiekia dirbtinio bendro intelekto (AGI).
Veiklos apžvalga

- Matematika: Pažangių matematinių testų sėkmės rodiklis buvo 96,7%, o tai yra pastebimas pagerėjimas, palyginti su o1 56,7%.
- Mokslinis samprotavimas: Rodomas 10 % didesnis tikslumas sprendžiant doktorantūros lygio mokslo klausimus.
- Kodo supratimas: įrodytas gebėjimas suprasti ir derinti kodo fragmentus, suteikiant galimą naudą kuriant programinę įrangą.
Architektūros naujovės
OpenAI o3 naudoja hibridinę samprotavimo sistemą, sujungiančią neuroninį-simbolinį mokymąsi su tikimybine logika. Ši architektūra leidžia modeliui:
- Suskaidyti problemas: supaprastinkite sudėtingas užklausas į mažesnius, valdomus komponentus.
- Sverto kontekstas: naudokite išplėstinę atmintį, kad išlaikytumėte kontekstą ilgos sąveikos metu.
- Pakartokite sprendimus: Patikslinkite atsakymus per kelis samprotavimo ciklus.
Dėl šių savybių o3 ypač tinka sprendžiant kelių etapų mąstymo iššūkius, kai tradiciniai transformatoriumi pagrįsti modeliai dažnai šlubuoja.
Realaus pasaulio programos
OpenAI o3 gali būti naudingas kelioms sritims:
- Išsilavinimas: Padėkite studentams spręsti sudėtingas matematines ir mokslines problemas.
- Sveikatos priežiūra: palaikykite diagnostikos procesus ir optimizuokite gydymo planus, analizuodami duomenis.
- Programinės įrangos kūrimas: derinkite ir generuokite kodą, suteikdami praktinę pagalbą kūrėjams.
Platesnė OpenAI vizija
OpenAI išleido vaizdo įrašą, iliustruojantį jos AI samprotavimo viziją. Demonstracijos apima o3, skirtą fizikos, matematikos ir etinių dilemų problemoms spręsti, pabrėžiant jos siekius sukurti modelius, galinčius mąstyti įvairiais scenarijais.
Taip pat nepamirškite sekti mūsų Twitter ir prisijunk prie mūsų Telegramos kanalas ir LinkedIn group. Nepamirškite prisijungti prie mūsų 60k+ ML SubReddit.
🚨 Populiarumas: LG AI tyrimų išleidimas EXAONE 3.5: trys atvirojo kodo dvikalbiai AI lygio modeliai, teikiantys neprilygstamas instrukcijas ir ilgą konteksto supratimą, kad būtų pasaulinė lyderystė kuriant AI tobulumą….

Asif Razzaq yra „Marktechpost Media Inc.“ generalinis direktorius. Kaip verslininkas ir inžinierius, Asif yra įsipareigojęs panaudoti dirbtinio intelekto potencialą socialinei gerovei. Naujausias jo siekis yra dirbtinio intelekto medijos platformos „Marktechpost“ paleidimas, kuri išsiskiria išsamia mašininio mokymosi ir gilaus mokymosi naujienomis, kurios yra techniškai pagrįstos ir lengvai suprantamos plačiajai auditorijai. Platforma gali pasigirti daugiau nei 2 milijonais peržiūrų per mėnesį, o tai rodo jos populiarumą tarp auditorijos.
🧵🧵 (Atsisiųsti) Didelių kalbų modelio pažeidžiamumo ataskaitos įvertinimas (reklamuojamas)