CMU tyrėjai pristato „Paprika“: tobulinimo metodą, leidžiantį kalbos modeliams sukurti bendrąsias sprendimų priėmimo galimybes, neapsiribojančias tam tikra aplinka
Šiandien sparčiai besivystančioje AI kraštovaizdyje vienas nuolatinis iššūkis yra kalbos modeliams aprūpinti…
Šis AI popierius pristato „Maetok“: užmaskuotą automatinį kodavimo pagrindu sukurtą tokenizatorių, skirtų efektyviems difuzijos modeliams
Difuzijos modeliai sukuria vaizdus palaipsniui tobulinant triukšmą į struktūrizuotus vaizdus. Tačiau skaičiavimo…
Stanfordo tyrėjai siūlo vieningą regresiją pagrįstą mašininio mokymosi sistemą sekų modeliams su asociatyvia atmintimi
Sekos yra universali abstrakcija, skirta atstovauti ir apdoroti informaciją, todėl sekos modeliavimas…
Tyrėjai iš MBZUAI ir CMU pristato „Bi-Mamba“: keičiamo dydžio ir efektyvią 1 bitų „Mamba“ architektūrą, sukurtą kelių dydžių didelių kalbų modeliams (780 M, 1,3 B ir 2,7 B parametrai)
Mašininio mokymosi raida padarė didelę pažangą kalbos modeliuose, kurie yra esminiai tokiems…
Pleias pristato bendrą korpusą: didžiausią daugiakalbį duomenų rinkinį, skirtą kalbų modeliams parengti
Pastaraisiais metais didelių kalbos modelių kūrimas žymiai patobulino natūralios kalbos apdorojimą (NLP).…
Atviri kolektyviniai leidimai Magnum/v4 serijos modeliams nuo 9B iki 123B parametrų
Sparčiai besivystančiame AI pasaulyje iššūkiai, susiję su mastelio keitimu, našumu ir prieinamumu,…

