„Tiktok“ tyrėjai pristato „SWE-perf“: pirmasis saugyklos lygio kodo našumo optimizavimas
Įvadas Kadangi didelių kalbų modelių (LLMS) progresuoja programinės įrangos inžinerijos užduotys -…
CMU tyrėjai pristato „Paprika“: tobulinimo metodą, leidžiantį kalbos modeliams sukurti bendrąsias sprendimų priėmimo galimybes, neapsiribojančias tam tikra aplinka
Šiandien sparčiai besivystančioje AI kraštovaizdyje vienas nuolatinis iššūkis yra kalbos modeliams aprūpinti…
Stanfordo tyrėjai sukūrė „Popper“: agentinę AI sistemą, kuri automatizuoja hipotezės patvirtinimą griežtai statistine kontrole, mažinant klaidas ir pagreitindamas mokslinį atradimą 10x
Hipotezės patvirtinimas yra esminis mokslinio atradimo, sprendimų priėmimo ir informacijos gavimo. Ar…
„Microsoft“ tyrėjai pateikia magmą: multimodalinis AI modelis, integruojantis viziją, kalbą ir veiksmus, skirtus pažengusiai robotikai, UI navigacijai ir intelektualiam sprendimų priėmimui
Multimodaliniai AI agentai yra skirti apdoroti ir integruoti įvairius duomenų tipus, tokius…
Prinstono universiteto tyrėjai pristato „Self-Moa“ ir
Dideli kalbų modeliai (LLM), tokie kaip GPT, Dvyniai ir Claude, naudoja didžiulius…
„Microsoft AI“ tyrėjai pristato pažangias mažo bitų kiekio nustatymo metodus, kad būtų galima efektyviai diegti LLM krašto įrenginius be didelių skaičiavimo išlaidų
EDRE įrenginiai, tokie kaip išmanieji telefonai, IoT prietaisai ir įterptos sistemos, apdoroja…
„Google DeepMind“ tyrėjai atrakina dekodavimo pagrįstos regresijos potencialą atliekant lentelių ir tankio įvertinimo užduotis
Regresijos užduotys, apimančios nuolatinių skaitinių verčių prognozavimą, tradiciškai rėmėsi skaitmeninėmis galvutėmis, tokiomis…
Vaterlo universiteto ir CMU tyrėjai pristato kritikos derinimą (CFT): naujas AI metodas, skirtas sustiprinti LLM samprotavimus su struktūrizuotu kritikos mokymuisi
Tradiciniai požiūriai į kalbų modelių mokymą labai priklauso nuo prižiūrimo tobulinimo, kai…
Stanfordo tyrėjai siūlo vieningą regresiją pagrįstą mašininio mokymosi sistemą sekų modeliams su asociatyvia atmintimi
Sekos yra universali abstrakcija, skirta atstovauti ir apdoroti informaciją, todėl sekos modeliavimas…
EPFL tyrėjai išleido 4M: atvirojo kodo mokymo sistemą, skirtą daugiarūšio dirbtinio intelekto pažangai
Daugiarūšio pagrindo modeliai tampa vis svarbesni dirbtinio intelekto srityje, leidžiantys sistemoms apdoroti…

