Allen institutas AI (AI2) išleido OLMo 2: naują atvirojo kodo 7B ir 13B kalbų modelių šeimą, išmokytą naudoti iki 5T žetonų
Kuriant kalbos modeliavimą pagrindinis dėmesys skiriamas dirbtinio intelekto sistemų kūrimui, kurios gali…
Tyrėjai iš MBZUAI ir CMU pristato „Bi-Mamba“: keičiamo dydžio ir efektyvią 1 bitų „Mamba“ architektūrą, sukurtą kelių dydžių didelių kalbų modeliams (780 M, 1,3 B ir 2,7 B parametrai)
Mašininio mokymosi raida padarė didelę pažangą kalbos modeliuose, kurie yra esminiai tokiems…
Pleias pristato bendrą korpusą: didžiausią daugiakalbį duomenų rinkinį, skirtą kalbų modeliams parengti
Pastaraisiais metais didelių kalbos modelių kūrimas žymiai patobulino natūralios kalbos apdorojimą (NLP).…
Kodėl AI kalbos modeliai vis dar yra pažeidžiami: pagrindinės įžvalgos iš Kili Technology ataskaitos apie didelių kalbų modelių pažeidžiamumą
„Kili Technology“ neseniai išleido išsamią informaciją ataskaita, kurioje pabrėžiami dideli AI kalbos…
MDAgentai: dinamiška kelių agentų sistema, skirta patobulintam medicininių sprendimų priėmimui naudojant didelių kalbų modelius
Fondo modeliai yra perspektyvūs medicinoje, ypač atliekant sudėtingas užduotis, tokias kaip medicininių…
„LLMWare“ pristato „Model Depot“: platų mažų kalbų modelių (SLM) kolekciją „Intel“ kompiuteriams
LLMWare.ai, mažų kalbų modelių (SLM) diegimo ir tobulinimo pradininkas, šiandien paskelbė, kad…
SPARE: Atstovavimo inžinerija be mokymų, skirta valdyti žinių konfliktus dideliuose kalbų modeliuose
Dideli kalbų modeliai (LLM) pademonstravo įspūdingus gebėjimus tvarkyti daug žinioms reikalingas užduotis,…
„Google DeepMind“ pristato „Omni×R“: išsamią vertinimo sistemą, skirtą įvairiarūšių kalbų modelių teksto, garso, vaizdo ir vaizdo įvesties samprotavimo galimybėms.
Daugiarūšių kalbų modeliai (OLM) yra sparčiai besivystanti AI sritis, leidžianti suprasti ir…
Katanemo atvirųjų šaltinių architektūrinė funkcija: didelių kalbų modelių (LLM) rinkinys, žadantis itin greitą greitį atliekant funkcijų iškvietimo užduotis agentų darbo eigoms
Viena didžiausių kliūčių, su kuriomis susiduria organizacijos, yra didelių kalbų modelių (LLM)…
Stochastinė greitoji konstrukcija, skirta veiksmingam kontekstiniam mokymuisi dideliuose kalbų modeliuose
Dideli kalbų modeliai (LLM) pademonstravo įspūdingas mokymosi kontekste (ICL) galimybes – tai…

