Tyrėjai iš Snowflake ir CMU pristato SuffixDecoding: naują metodą be modelio, kaip pagreitinti didelės kalbos modelio (LLM) išvadas naudojant spekuliacinį dekodavimą
Didelės kalbos modeliai (LLM) greitai tapo pagrindine šiuolaikinių vartotojų ir įmonių programų…
Susipažinkite su „Aioli“: vieninga kalbos modelio duomenų maišymo optimizavimo sistema
Pastaraisiais metais didelių kalbų modelių mokymas susidūrė su esminiu iššūkiu: nustatyti optimalų…
Apkabinęs veidą išleidžia sakinių transformatorius 3.3.0: didelis šuolis siekiant NLP efektyvumo
Natūralios kalbos apdorojimas (NLP) per pastaruosius kelerius metus sparčiai vystėsi, o transformatoriai…
„Salesforce AI Research“ pristato „Moirai-MoE“: MoE laiko serijos pagrindo modelį, kuris autonomiškai pasiekia žetonų lygio modelio specializaciją
Laiko eilučių prognozavimas jau seniai buvo neatsiejama finansų, sveikatos priežiūros, meteorologijos ir…
ADOPT: universalus adaptyvaus gradiento metodas patikimai konvergencijai be hiperparametrų derinimo
Adomas plačiai naudojamas giluminiame mokyme kaip adaptyvus optimizavimo algoritmas, tačiau jis kovoja…
„Google DeepMind“ tyrėjai siūlo RT-Affordance: hierarchinį metodą, kuris naudoja affordances kaip tarpinį politikos atstovą
Pastaraisiais metais buvo padaryta didelė pažanga didelių iš anksto parengtų robotų politikos…
Naujas „Google DeepMind“ tyrimas atskleidžia naujo tipo pažeidžiamumą, dėl kurio gali nutekėti naudotojo raginimai Vidaus reikalų ministerijos modelyje
Vidaus reikalų ministerijos modelių maršruto mechanizmas kelia didelį privatumo iššūkį. Optimizuokite LLM…
„Meta AI“ pristato „AdaCache“: nemokamą metodą vaizdo difuzijos transformatoriams (DiTs) pagreitinti
Vaizdo įrašų generavimas greitai tapo pagrindiniu dirbtinio intelekto tyrimų centru, ypač kuriant…
„Tencent“ išleido „Hunyuan-Large“ (Hunyuan-MoE-A52B) modelį: naują atvirojo kodo transformatoriumi pagrįstą MoE modelį, kuriame iš viso yra 389 milijardai parametrų ir 52 milijardai aktyvių parametrų
Dideli kalbos modeliai (LLM) tapo daugelio dirbtinio intelekto sistemų pagrindu, o tai…
MDAgentai: dinamiška kelių agentų sistema, skirta patobulintam medicininių sprendimų priėmimui naudojant didelių kalbų modelius
Fondo modeliai yra perspektyvūs medicinoje, ypač atliekant sudėtingas užduotis, tokias kaip medicininių…

