„Zyphra“ pristato „Zonos“ beta versiją: labai išraiškingas TTS modelis su aukšto ištikimybės balso klonavimu
Teksto ir kalbėjimo (TTS) technologija pastaraisiais metais padarė didelę pažangą, tačiau išlieka…
„Kyutai“ išleidžia „Hibiki“: 2,7B realiojo laiko kalbos kalbėjimo ir kalbos į tekstą vertimas su beveik žmogaus kokybės ir balso perdavimu
Realiojo laiko kalbos vertimas yra sudėtingas iššūkis, reikalaujantis sklandaus kalbos atpažinimo, mašininio…
„Alibaba Speech Lab“ išleido „ClearerVoice-Studio“: atvirojo kodo balso apdorojimo sistemą, palaikančią kalbos patobulinimą, atskyrimą ir tikslinių garsiakalbių ištraukimą
Aiškus bendravimas šiandieninėje garso aplinkoje gali būti stebėtinai sudėtingas. Fono triukšmas, persidengiantys…

