CMU tyrėjai pristato „Paprika“: tobulinimo metodą, leidžiantį kalbos modeliams sukurti bendrąsias sprendimų priėmimo galimybes, neapsiribojančias tam tikra aplinka
Šiandien sparčiai besivystančioje AI kraštovaizdyje vienas nuolatinis iššūkis yra kalbos modeliams aprūpinti…
„Kyutai“ išleidžia „Hibiki“: 2,7B realiojo laiko kalbos kalbėjimo ir kalbos į tekstą vertimas su beveik žmogaus kokybės ir balso perdavimu
Realiojo laiko kalbos vertimas yra sudėtingas iššūkis, reikalaujantis sklandaus kalbos atpažinimo, mašininio…
„IBM AI“ išleidžia Granito ir viziją-33.1-2b: Mažo vizijos kalbos modelis su ypač įspūdingu atlikimu atliekant įvairias užduotis
Vaizdinių ir tekstinių duomenų integracija į dirbtinį intelektą kelia sudėtingą iššūkį. Tradiciniai…
Evola: 80B parametrų multimodalinis baltymų kalbos modelis, skirtas baltymų funkcijoms dekoduoti per natūralios kalbos dialogą
Baltymai, esminės molekulinės mašinos, išsivystė per milijardus metų, atlieka svarbias gyvybei palaikančias…
„Microsoft AI“ ką tik išleido „Phi-4“: mažas kalbos modelis, kurį galima įsigyti apsikabinusiame veide pagal MIT licenciją
„Microsoft“ turi išleido Phi-4, kompaktišką ir efektyvų mažos kalbos modelį Hugging Face…
„FutureHouse“ tyrėjai siūlo „Aviary“: plečiamą atvirojo kodo gimnaziją kalbos agentams
Dirbtinis intelektas (AI) padarė didelę pažangą kurdamas kalbos modelius, galinčius išspręsti sudėtingas…
ProTrek: trijų modalų baltymų kalbos modelis, skirtas patobulinti sekos, struktūros ir funkcijų analizę
Baltymai, esminis molekulinis gyvybės mechanizmas, atlieka pagrindinį vaidmenį daugelyje biologinių procesų. Jų…
Šiame AI dokumente pristatomas SRDF: savaime besitobulinantis duomenų smagratis, skirtas aukštos kokybės vaizdo ir kalbos navigacijos duomenų rinkiniams
Vizos ir kalbos navigacija (VLN) sujungia vizualinį suvokimą su natūralios kalbos supratimu,…
„Alibaba Speech Lab“ išleido „ClearerVoice-Studio“: atvirojo kodo balso apdorojimo sistemą, palaikančią kalbos patobulinimą, atskyrimą ir tikslinių garsiakalbių ištraukimą
Aiškus bendravimas šiandieninėje garso aplinkoje gali būti stebėtinai sudėtingas. Fono triukšmas, persidengiantys…
„Meta AI“ tiesiog atviro kodo „Llama 3.3“: naujas 70B daugiakalbis didelės kalbos modelis (LLM)
Ką tik išleistas Meta AI Lama 3.3atvirojo kodo kalbos modelis, sukurtas siekiant…