Allen institutas AI (AI2) išleido OLMo 2: naują atvirojo kodo 7B ir 13B kalbų modelių šeimą, išmokytą naudoti iki 5T žetonų
Kuriant kalbos modeliavimą pagrindinis dėmesys skiriamas dirbtinio intelekto sistemų kūrimui, kurios gali…
Tyrėjai iš MBZUAI ir CMU pristato „Bi-Mamba“: keičiamo dydžio ir efektyvią 1 bitų „Mamba“ architektūrą, sukurtą kelių dydžių didelių kalbų modeliams (780 M, 1,3 B ir 2,7 B parametrai)
Mašininio mokymosi raida padarė didelę pažangą kalbos modeliuose, kurie yra esminiai tokiems…

