„Google AI“ pristato „ZeroBAS“: neuroninį metodą, leidžiantį sintetinti binauralinį garsą iš monofoninių garso įrašų ir padėties informacijos, nemokant jokių dvejetainių duomenų
Žmonės turi nepaprastą gebėjimą lokalizuoti garso šaltinius ir interpretuoti savo aplinką naudodami…
NVIDIA AI pristato „Fugatto“: 2,5 milijardo parametrų garso modelį, kuris generuoja muziką, balsą ir garsą iš teksto ir garso įvesties
Muzikos ir garsų kūrimas, redagavimas ir transformavimas kelia tiek techninių, tiek kūrybinių…
„Google DeepMind“ pristato „Omni×R“: išsamią vertinimo sistemą, skirtą įvairiarūšių kalbų modelių teksto, garso, vaizdo ir vaizdo įvesties samprotavimo galimybėms.
Daugiarūšių kalbų modeliai (OLM) yra sparčiai besivystanti AI sritis, leidžianti suprasti ir…