Rekomendacijų sistemos yra būtinos norint sujungti vartotojus su atitinkamu turiniu, produktais ar paslaugomis. Tankūs paieškos metodai buvo pagrindinis šios srities pagrindas, naudojant sekos modeliavimą elementų ir vartotojų atvaizdams apskaičiuoti. Tačiau šie metodai reikalauja didelių skaičiavimo išteklių ir saugyklos, nes juos reikia įterpti kiekvienam elementui. Duomenų rinkiniams didėjant, šie reikalavimai tampa vis labiau apsunkinantys, todėl ribojamas jų mastelio keitimas. Generatyvusis paieška, atsirandanti alternatyva, sumažina saugojimo poreikius, numatant prekių indeksus naudojant generatyvius modelius. Nepaisant savo potencialo, jis susiduria su našumo problemomis, ypač tvarkydamas šalto paleidimo elementus – naujus elementus su ribota vartotojo sąveika. Vieningos sistemos, apjungiančios šių metodų pranašumus, nebuvimas išryškina spragą sprendžiant kompromisus tarp skaičiavimo, saugojimo ir rekomendacijų kokybės.
Viskonsino universiteto (Madison) mokslininkai, ELLIS padalinio, LIT AI laboratorijos, mašininio mokymosi instituto, JKU Linz, Austrija, ir Meta AI pristatė LIGER (LeveragIng dense retrieval for GENerative Retrieval) – hibridinį paieškos modelį, kuris derina skaičiavimo efektyvumą. generatyvinis paieška su tankaus paieškos tikslumu. LIGER patobulina kandidatų rinkinį, sugeneruotą generatyvaus paieškos būdu, taikant tankius paieškos metodus, taip užtikrinant efektyvumo ir tikslumo pusiausvyrą. Modelis naudoja elementų reprezentacijas, gautas iš semantinių ID ir teksto atributų, derindamas abiejų paradigmų stipriąsias puses. Taip LIGER sumažina saugojimo ir skaičiavimo išlaidas, tuo pačiu pašalindama našumo spragas, ypač tais atvejais, kai naudojami šalto paleidimo elementai.
Techninė informacija ir privalumai
LIGER kartu su generuojamuoju dekoderiu naudoja dvikryptį transformatoriaus kodavimo įrenginį. Tankus paieškos komponentas integruoja elementų teksto reprezentacijas, semantinius ID ir padėties įterpimus, optimizuotus naudojant kosinuso panašumo praradimą. Generuojamasis komponentas naudoja pluošto paiešką, kad pagal naudotojo sąveikos istoriją numatyti paskesnių elementų semantinius ID. Šis derinys leidžia LIGER išlaikyti generatyvaus paieškos efektyvumą, kartu pašalinant jo trūkumus naudojant šalto paleidimo elementus. Modelio hibridinės išvados procesas, kuris pirmiausia atkuria kandidatų rinkinį generatyviniu būdu, o vėliau jį patobulina taikydamas tankų atgavimą, efektyviai sumažina skaičiavimo poreikius, išlaikant rekomendacijų kokybę. Be to, įtraukdamas tekstinius vaizdus, LIGER gerai apibendrina nematomus elementus, pašalindamas pagrindinį ankstesnių generatyvinių modelių apribojimą.
Rezultatai ir įžvalgos
LIGER vertinimai etaloniniuose duomenų rinkiniuose, įskaitant „Amazon Beauty“, „Sports“, „Toys“ ir „Steam“, rodo nuoseklius patobulinimus, palyginti su naujausiais modeliais, tokiais kaip TIGER ir UniSRec. Pavyzdžiui, LIGER „Amazon Beauty“ duomenų rinkinyje šalto paleidimo elementams Recall@10 įvertino 0,1008, palyginti su TIGER 0,0. Steam duomenų rinkinyje LIGER Recall@10 šalto paleidimo elementams pasiekė 0,0147 ir vėl pralenkė TIGER 0,0. Šie atradimai rodo LIGER gebėjimą efektyviai sujungti generatyvų ir tankų paieškos metodus. Be to, didėjant generatyviniais metodais nuskaitomų kandidatų skaičiui, LIGER sumažina efektyvumo atotrūkį su tankia paieška. Dėl šio pritaikomumo ir efektyvumo jis tinka įvairiems rekomendacijų scenarijams.
Išvada
LIGER siūlo apgalvotą tankaus ir generatyvaus paieškos integravimą, sprendžiant efektyvumo, mastelio ir šalto paleidimo elementų tvarkymo iššūkius. Jo hibridinė architektūra subalansuoja skaičiavimo efektyvumą ir aukštos kokybės rekomendacijas, todėl tai yra perspektyvus sprendimas šiuolaikinėms rekomendacijų sistemoms. Pašalindama esamų metodų spragas, LIGER sudaro pagrindą tolesniam hibridinio paieškos modelių tyrinėjimui, skatinant rekomendacijų sistemų naujoves.
Patikrinkite Popierius. Visi nuopelnai už šį tyrimą tenka šio projekto tyrėjams. Taip pat nepamirškite sekti mūsų Twitter ir prisijunk prie mūsų Telegramos kanalas ir LinkedIn group. Nepamirškite prisijungti prie mūsų 60k+ ML SubReddit.
🚨 NEMOKAMAS BŪTINAS AI internetinis seminaras (2025 M. SAUSIO 15 d.): padidinkite LLM tikslumą naudodami sintetinius duomenis ir įvertinimo informaciją–Prisijunkite prie šio internetinio seminaro, kad gautumėte veiksmingų įžvalgų, kaip padidinti LLM modelio našumą ir tikslumą, kartu išsaugant duomenų privatumą.
Asif Razzaq yra „Marktechpost Media Inc.“ generalinis direktorius. Kaip verslininkas ir inžinierius, Asif yra įsipareigojęs panaudoti dirbtinio intelekto potencialą socialinei gerovei. Naujausias jo siekis yra dirbtinio intelekto medijos platformos „Marktechpost“ paleidimas, kuri išsiskiria išsamia mašininio mokymosi ir gilaus mokymosi naujienomis, kurios yra techniškai pagrįstos ir lengvai suprantamos plačiajai auditorijai. Platforma gali pasigirti daugiau nei 2 milijonais peržiūrų per mėnesį, o tai rodo jos populiarumą tarp auditorijos.
🧵🧵 (Atsisiųsti) Didelių kalbų modelio pažeidžiamumo ataskaitos įvertinimas (reklamuojamas)