„Meta AI“ pristato „Paretoq“: vieningą mašininio mokymosi sistemą, skirtą kiekybiškai įvertinti sub-4 bitą didelių kalbų modeliuose
Toliau augant giluminio mokymosi modeliams, mašinų mokymosi modelių kiekis tampa būtinas, o…
Singapūro technologijos ir dizaino universitetas (SUTD) tiria AI modelių multimodalinių pagrindimų pažangą ir iššūkius, atliekant dėlionės pagrįstus vertinimus ir algoritminę problemų sprendimo analizę
Po didelių kalbų modelių (LLMS) sėkmės dabartiniai tyrimai apima ne tik teksto…
„IBM AI“ išleidžia Granito ir viziją-33.1-2b: Mažo vizijos kalbos modelis su ypač įspūdingu atlikimu atliekant įvairias užduotis
Vaizdinių ir tekstinių duomenų integracija į dirbtinį intelektą kelia sudėtingą iššūkį. Tradiciniai…
Didelio modelio išvadų su kopėčiomis likutis optimizavimas: Tensoro paralelizmo gerinimas per komunikacijos kompiuterį sutapimą
LLM išvados yra labai reikalaujančios ištekliams, reikalaujanti didelės atminties ir skaičiavimo galios.…
Prinstono universiteto tyrėjai pristato „Self-Moa“ ir
Dideli kalbų modeliai (LLM), tokie kaip GPT, Dvyniai ir Claude, naudoja didžiulius…
Su grandine susijusių minčių (kailis): AI sistema, skirta pagerinti LLM samprotavimus
Didelių kalbos modeliai (LLM) sukėlė revoliuciją dirbtiniu intelektu, parodydami nepaprastas teksto generavimo…
„Microsoft AI“ tyrėjai pristato pažangias mažo bitų kiekio nustatymo metodus, kad būtų galima efektyviai diegti LLM krašto įrenginius be didelių skaičiavimo išlaidų
EDRE įrenginiai, tokie kaip išmanieji telefonai, IoT prietaisai ir įterptos sistemos, apdoroja…
S1: Paprastas, tačiau galingas LLMS bandymo laiko mastelio keitimo metodas
Kalbų modeliai (LMS) labai pažengė per padidėjusią skaičiavimo galią treniruotės metu, pirmiausia…
Mobiliojo ad hoc tinklo saugumo tobulinimas: hibridinis giluminio mokymosi modelis, skirtas potvynių atakų aptikimui
Ad hoc tinklai yra decentralizuoti, savaime suprantami tinklai, kuriuose mazgai bendrauja be…
Susipažinkite su „Satori“: nauja AI sistema, leidžianti tobulinti LLM samprotavimus per gilų mąstymą be stipraus mokytojo modelio
Didelės kalbos modeliai (LLM) parodė pastebimas matematinio problemų sprendimo, loginių išvadų ir…