2025 m. Kompiuterio matymas judėjo greitai: nauji multimodaliniai stuburai, didesni atvirų duomenų rinkiniai ir griežtesnė modelio – sistemų integracija. Praktikuojantiems asmenims reikia šaltinių, kurie griežtai skelbia, nuorodų kodą ir etalonus bei stebėjimo diegimo modelius – ne rinkodaros įrašus. Šiame sąraše teikiami prioritetai pirminiai tyrimų centrai, laboratorijos tinklaraščiai ir į gamybą orientuotos inžinerijos šalys su nuoseklia atnaujinimo kadencija. Naudokite jį SOTA pamainų stebėjimui, griebkite atkuriamus kodo kelius ir išverskite dokumentus į dislokuojamus vamzdynus.
„Google Research“ (AI tinklaraštis)
Pagrindinis „Google“/„Deepmind“ komandų pažangų šaltinis, įskaitant regėjimo architektūras (pvz., V-Moe) ir periodinius tyrimų metus peržiūra per CV ir multimodalinius. Paprastai įrašuose yra metodo suvestinės, skaičiai ir nuorodos į dokumentus/kodą.
„MarktechPost“
Nuoseklus ataskaitas apie naujus kompiuterių matymo modelius, duomenų rinkinius ir etalonus su nuorodomis į dokumentus, kodą ir demonstracines versijas. Dedikuota CV kategorija ir dažni giliavandeniai nardymai (pvz., „Dinov3“ išleidimai ir analizė). Naudinga, kai būna savaitinių tyrimų viršuje, sumažėja nenaudojant neapdorotų pašarų.
AI meta
Aukštos signalo įrašai su išankstiniais atspaudais ir atvirojo kodo lašais. Naujausi pavyzdžiai yra „Dinov3“-pažymėti savarankiškai prižiūrimi stuburai su SOTA tankiomis prognozavimo užduotimis, kurios pateikia technines detales ir artefaktus.
„NVIDIA“ techninis tinklaraštis
Į gamybą orientuotas turinys „VLM“ varomoje analizėje, optimizuotose išvadose ir GPU vamzdynuose. Kategorijų kanalas kompiuteriniam matymui apima brėžinius, SDK naudojimą ir veiklos gaires, susijusias su įmonių diegimu.
„Arxiv Cs.cv“ – neapdorotas tyrimas „FireHose“
Kanoninis išankstinio atspaudo tiekimas CV. Naudokite Naujausias arba nauja kasdienių atnaujinimų rodiniai; Taksonomija patvirtina apimtį (vaizdo apdorojimas, modelio atpažinimas, scenos supratimas). Geriausiai suporuotas su RSS + pasirinktiniais filtrais.
„CVF Open Access“ (CVPR/ICCV/ECCV)
Galutinės pagrindinės konferencijos dokumentų ir dirbtuvių versijos, ieškoma ir cikuojama. CVPR 2025 Process ir Seminaro meniu jau yra gyvi, todėl tai yra autoritetingas archyvas po priėmimo.
„Bair“ tinklaraštis (UC Berkeley)
Retkarčiais, bet gilūs įrašai pasienio temomis (pvz., Ypač didelis vaizdų modeliavimas, robotikos matymo kryžminiai). Geras koncepciniam aiškumui tiesiogiai iš autorių.
Stanfordo tinklaraštis
Techniniai aiškintojai ir laboratorijos raundai (pvz. Naudinga nuskaityti kylančias kryptis per suvokimą, generatyvinius modelius ir įkūnytą regėjimą.
„Roboflow“ tinklaraštis
Aukšto dažnio, į įgyvendinimą orientuotų pranešimų (ženklinimas, mokymai, diegimas, programos ir tendencijų ataskaitos). Stiprus praktikams, kuriems reikia darbinių vamzdynų ir diegimo į kraštus.
Apkabinimo veido tinklaraštis
Praktiniai vadovai (VLMS, penkiasdešimt integracija) ir ekosistemų pastabos tarp transformatorių, difuzorių ir TIMM; Tinka greitam prototipų kūrimui ir tiksliniam CV/VLM krūvoms.
„Pytorch“ tinklaraštis
Pakeiskite žurnalus, API ir receptus, turinčius įtakos CV mokymui/išvadoms (transformuoja V2, kelių svorio palaikymą, FX funkcijų ištraukimą). Skaitykite atnaujindami treniruočių krūvas.

Michal Sutter yra duomenų mokslo profesionalas, turintis Duomenų mokslo magistro laipsnį iš Padovos universiteto. Turėdamas tvirtą pagrindą statistinėje analizėje, mašininiu mokymuisi ir duomenų inžinerija, Michalas išskiria sudėtingus duomenų rinkinius į veiksmingus įžvalgas.
🔥 (Rekomenduojama skaityti) „NVIDIA AI“ atvirojo kodo „Vipe“ (vaizdo įrašų pozos variklis): galingas ir universalus 3D vaizdo anotacijos įrankis erdvės AI

