Tyrėjai iš MBZUAI ir CMU pristato „Bi-Mamba“: keičiamo dydžio ir efektyvią 1 bitų „Mamba“ architektūrą, sukurtą kelių dydžių didelių kalbų modeliams (780 M, 1,3 B ir 2,7 B parametrai)
Mašininio mokymosi raida padarė didelę pažangą kalbos modeliuose, kurie yra esminiai tokiems…
„Google“ naujinimai „Gemini-exp-1121“: AI tobulinimas kodavimo, matematikos ir vizualinio supratimo srityse
Dirbtinio intelekto (DI) sritis ir toliau vystosi, o konkurencija tarp didelių kalbų…
Išleistas „SmolTalk“: duomenų rinkinio receptas, užtikrinantis geriausią „SmolLM2“ našumą klasėje
Naujausi natūralios kalbos apdorojimo (NLP) pažanga pristatė naujus modelius ir mokymo duomenų…
„DeepSeek“ pristato „DeepSeek-R1-Lite-Preview“ su visais motyvavimo išėjimais, atitinkančiais „OpenAI o1“
Dirbtinio intelekto (AI) modeliai per pastaruosius kelerius metus padarė didelę pažangą, tačiau…
Johno Hopkinso tyrėjai pristato „Genex“: AI modelį, kuris įsivaizduoja savo kelią per 3D pasaulius
Planavimas ir sprendimų priėmimas sudėtingoje, iš dalies stebimoje aplinkoje yra didelis iššūkis…
Pleias pristato bendrą korpusą: didžiausią daugiakalbį duomenų rinkinį, skirtą kalbų modeliams parengti
Pastaraisiais metais didelių kalbos modelių kūrimas žymiai patobulino natūralios kalbos apdorojimą (NLP).…
Susipažinkite su „Memoripy“: „Python“ biblioteka, kuri AI programoms suteikia realių atminties galimybių
Dirbtinio intelekto sistemos dažnai stengiasi išlaikyti prasmingą kontekstą ilgos sąveikos metu. Šis…
Kodėl AI kalbos modeliai vis dar yra pažeidžiami: pagrindinės įžvalgos iš Kili Technology ataskaitos apie didelių kalbų modelių pažeidžiamumą
„Kili Technology“ neseniai išleido išsamią informaciją ataskaita, kurioje pabrėžiami dideli AI kalbos…
„Nexa AI“ išleido „OmniVision-968M“: mažiausią pasaulyje vizijos kalbos modelį su 9 kartus sumažintu žetonų kiekiu kraštiniams įrenginiams
Edge AI jau seniai susidūrė su efektyvumo ir efektyvumo pusiausvyros iššūkiu. „Vision…
Šis mašininio mokymosi dokumentas transformuoja įkūnytą AI efektyvumą: nauji mastelio dėsniai, skirti optimizuoti modelio ir duomenų rinkinio proporcijas atliekant klonavimo ir pasaulio modeliavimo užduotis.
Įkūnytas dirbtinis intelektas (AI) apima agentų, veikiančių fizinėje arba imituojamoje aplinkoje, kūrimą,…

