IBM išleido „Granite 4.0 3B Vision“: naują „Vision“ kalbos modelį, skirtą įmonės klasės dokumentų duomenų išgavimui
IBM paskelbė apie išleidimą Granitas 4.0 3B Visionvizijos kalbos modelis (VLM), sukurtas…
„Meta AI“ išleido SAM garsą: pažangiausią vieningą modelį, kuris naudoja intuityvius ir daugiarūšius garso atskyrimo raginimus
„Meta“ išleido „SAM Audio“ – greitą garso atskyrimo modelį, kuris nukreiptas į…
A2A suderinamo atsitiktinio skaičiaus agento kūrimas: žingsnis po žingsnio vadovas, kaip įgyvendinti žemo lygio vykdytojų modelį su „Python“
„Agent-Agent“ (A2A) protokolas yra naujas „Google“ standartas, leidžiantis AI agentams, nepriklausomai nuo…
„Convergence Labs“ pristato didelę atminties modelį (LM2): atminties orientuotos transformatoriaus architektūra, skirta spręsti ilgus konteksto samprotavimo iššūkius
Transformatorių pagrįsti modeliai turi žymiai pažengusį natūralios kalbos apdorojimą (NLP), puikiai tinkančius…
„BedEdance“ pristato UI-TARS: vietinio GUI agento modelį, kuris integruoja suvokimą, veiksmą, samprotavimus ir atmintį į keičiamą ir adaptyviąją sistemą
GUI Agentai siekia atlikti realias užduotis skaitmeninėje aplinkoje, suprasdami ir sąveikaudami su…
„Voyage AI“ pristato „voyage-code-3“: naują naujos kartos įterpimo modelį, optimizuotą kodų paieškai
Kodo įterpimo modelių tyrimai parodė reikšmingą proveržį, kai buvo pristatytas kelionės kodas-3,…
NVIDIA AI pristato „Fugatto“: 2,5 milijardo parametrų garso modelį, kuris generuoja muziką, balsą ir garsą iš teksto ir garso įvesties
Muzikos ir garsų kūrimas, redagavimas ir transformavimas kelia tiek techninių, tiek kūrybinių…
aiOla išleido Whisper-NER: atvirojo kodo AI modelį, skirtą bendrai kalbos transkripcijai ir objektų atpažinimui
Kalbos atpažinimo technologija padarė didelę pažangą, o dirbtinio intelekto pažanga pagerino pasiekiamumą…
Johno Hopkinso tyrėjai pristato „Genex“: AI modelį, kuris įsivaizduoja savo kelią per 3D pasaulius
Planavimas ir sprendimų priėmimas sudėtingoje, iš dalies stebimoje aplinkoje yra didelis iššūkis…
„Nexa AI“ išleido „OmniVision-968M“: mažiausią pasaulyje vizijos kalbos modelį su 9 kartus sumažintu žetonų kiekiu kraštiniams įrenginiams
Edge AI jau seniai susidūrė su efektyvumo ir efektyvumo pusiausvyros iššūkiu. „Vision…

