„Tiktok“ tyrėjai pristato „SWE-perf“: pirmasis saugyklos lygio kodo našumo optimizavimas
Įvadas Kadangi didelių kalbų modelių (LLMS) progresuoja programinės įrangos inžinerijos užduotys -…
CMU tyrėjai pristato „Paprika“: tobulinimo metodą, leidžiantį kalbos modeliams sukurti bendrąsias sprendimų priėmimo galimybes, neapsiribojančias tam tikra aplinka
Šiandien sparčiai besivystančioje AI kraštovaizdyje vienas nuolatinis iššūkis yra kalbos modeliams aprūpinti…
„Openai“ pristato „Swe-Lancer“: etalonas, skirtas įvertinti modelio veikimą realaus pasaulio laisvai samdomų programinės įrangos inžinerijos darbuose
Kylančių iššūkių programinės įrangos inžinerijoje sprendimas prasideda nuo pripažinimo, kad tradiciniai etalonai…
Šis AI dokumentas iš IBM ir MIT pristato Saliamoną: neuro įkvėptą samprotavimo tinklą, skirtą padidinti LLM pritaikomumą puslaidininkių išdėstymo dizaine
Didelių kalbų modelių pritaikymas specializuotoms sritims išlieka sudėtingas, ypač srityse, kurioms reikalingi…
Šis UC Berkeley AI dokumentas pristato efektyvų duomenis, susijusius su ilgais didelių kalbų modelių mąstymo pagrindais.
Didelių kalbos modeliai (LLMS) apdoroja didelius duomenų rinkinius, kad būtų galima generuoti…
„Microsoft Research“ pristato duomenų formulatorių: AI programą, kuri panaudoja LLM, norėdama transformuoti duomenis ir sukurti turtingas vizualizacijas
Dauguma šiuolaikinių vizualizacijos autorių įrankių, tokių kaip „Charticulator“, „Data Illustrator“ ir „Lyra“,…
„Salesforce AI Research“ pristato apdovanojimą, kurį valdo spekuliatyviai dekodavimas (RSD): nauja sistema, pagerinanti išvadų efektyvumą didelių kalbų modeliuose (LLM) iki 4,4 × mažiau flopų.
Pastaraisiais metais dėl greito didelių kalbų modelių (LLMS) mastelio keitimas lėmė nepaprastą…
„Meta AI“ pristato „Cocomix“: išankstinė sistema, integruojanti žetonų prognozę su nuolatinėmis sąvokomis
Dominuojantis požiūris į išankstinį didelių kalbų modelių (LLMS) išankstinį pranešimą priklauso nuo…
„Meta AI“ pristato „Partnr“: tyrimų sistemą, palaikančią sklandų žmogaus roboto bendradarbiavimą atliekant daugialypės aikštelės užduotis
„Human-Robot“ bendradarbiavimas sutelktas į intelektualiųjų sistemų, veikiančių kartu su žmonėmis dinamiškoje aplinkoje,…
„Convergence Labs“ pristato didelę atminties modelį (LM2): atminties orientuotos transformatoriaus architektūra, skirta spręsti ilgus konteksto samprotavimo iššūkius
Transformatorių pagrįsti modeliai turi žymiai pažengusį natūralios kalbos apdorojimą (NLP), puikiai tinkančius…

