„FutureHouse“ tyrėjai siūlo „Aviary“: plečiamą atvirojo kodo gimnaziją kalbos agentams
Dirbtinis intelektas (AI) padarė didelę pažangą kurdamas kalbos modelius, galinčius išspręsti sudėtingas…
„OpenAI“ tyrėjai siūlo „svarstomą suderinimą“: mokymo metodą, kuris moko LLM prieš pateikiant atsakymą aiškiai motyvuoti pagal saugos specifikacijas
Plačiai paplitęs didelio masto kalbos modelių (LLM) naudojimas saugai svarbiose srityse iškėlė…
Tyrėjai iš MBZUAI ir CMU pristato „Bi-Mamba“: keičiamo dydžio ir efektyvią 1 bitų „Mamba“ architektūrą, sukurtą kelių dydžių didelių kalbų modeliams (780 M, 1,3 B ir 2,7 B parametrai)
Mašininio mokymosi raida padarė didelę pažangą kalbos modeliuose, kurie yra esminiai tokiems…
Johno Hopkinso tyrėjai pristato „Genex“: AI modelį, kuris įsivaizduoja savo kelią per 3D pasaulius
Planavimas ir sprendimų priėmimas sudėtingoje, iš dalies stebimoje aplinkoje yra didelis iššūkis…
Tyrėjai iš Snowflake ir CMU pristato SuffixDecoding: naują metodą be modelio, kaip pagreitinti didelės kalbos modelio (LLM) išvadas naudojant spekuliacinį dekodavimą
Didelės kalbos modeliai (LLM) greitai tapo pagrindine šiuolaikinių vartotojų ir įmonių programų…
„Google DeepMind“ tyrėjai siūlo RT-Affordance: hierarchinį metodą, kuris naudoja affordances kaip tarpinį politikos atstovą
Pastaraisiais metais buvo padaryta didelė pažanga didelių iš anksto parengtų robotų politikos…

