LoGeR – Rikostruzzjoni 3D minn vidjows twal estremament (DeepMind, UC Berkeley) | Mewayz Blog Skip to main content
Hacker News

LoGeR – Rikostruzzjoni 3D minn vidjows twal estremament (DeepMind, UC Berkeley)

Kummenti

12 min read Via loger-project.github.io

Mewayz Team

Editorial Team

Hacker News

Bidu ta' Sigħat ta' Vidjo f'Dinja Koerenti 3D

Immaġina li taqbad vidjo ta' avveniment sħiħ—ċerimonja ta' żwieġ, proġett ta' kostruzzjoni, jew mixja fin-natura minn ġo foresta. Tispiċċa b'sigħat ta' filmati, iżda hija sekwenza ċatta u lineari. X'jiġri jekk inti tista' tittrasforma dak il-vidjo twil u diffiċli f'mudell 3D wieħed u navigabbli tax-xena kollha? Dan huwa l-għan ambizzjuż ta 'LoGeR, kollaborazzjoni ta' riċerka innovattiva bejn DeepMind u UC Berkeley. Din it-teknoloġija ma tgħaqqadx biss ritratti flimkien; jibni mill-ġdid b'mod intelliġenti dinja 3D persistenti minn flussi tal-vidjow li huma twal kemm fit-tul kif ukoll fit-triq fiżika, u jindirizza waħda mill-aktar sfidi sinifikanti fil-viżjoni bil-kompjuter.

L-Isfida Ewlenija: Konsistenza Fuq Skali Vasti

Metodi tradizzjonali ta' rikostruzzjoni 3D jisbqu b'filmati qosra jew kollezzjoni ta' ritratti meħuda minn angoli differenti fl-istess mument. Madankollu, huma jissieltu immens b'videos "twil". Id-diffikultajiet huma doppji. L-ewwel,tul temporali: hekk kif vidjo jinfirex fuq minuti jew sigħat, id-dawl jinbidel, l-oġġetti jiċċaqilqu, u n-nies jiġu u jmorru. It-tieni,skala spazjali: il-kamera tista' tgħaddi minn żona kbira, bħal mixi minn park u ġo bini, u toħloq ambjent massiv u kumpless għall-mappa. Is-sistemi eżistenti ħafna drabi jonqsu milli jżommu mappa globali konsistenti, u dan iwassal għal rikostruzzjonijiet magħquda jew "floaters"—artifatti ghostly li ma jappartjenu għall-ebda wiċċ. LoGeR jindirizza dan billi jiffoka fuq il-bini ta' rappreżentazzjoni unifikata li tibqa' koerenti f'dawn l-iskali vasti ta' ħin u spazju.

Kif LoGeR Jikseb Rikostruzzjoni Koerenti

LoGeR, li tfisser Long Generative Reconstruction, tintroduċi approċċ ġdid iċċentrat fuq strateġija ta' "inizjalizzazzjoni taż-żerriegħa". Minflok ma tipprova tibni x-xena 3D kollha f'daqqa minn nixxiegħa tal-vidjo kaotika, is-sistema l-ewwel tidentifika segment żgħir u maniġġabbli tal-vidjo li huwa aktar faċli biex tinbena mill-ġdid b'kunfidenza għolja. Din il-garża 3D ta 'kwalità għolja sservi bħala ankra stabbli jew "żerriegħa". Il-mudell imbagħad jikber b'mod inkrementali din ir-rappreżentazzjoni 3D, qafas b'qafas, jinkorpora bir-reqqa informazzjoni viżiva ġdida filwaqt li jirreferi lura għaż-żerriegħa stabbilita biex tiġi żgurata konsistenza globali. Dan il-metodu jippermetti b'mod effettiv lill-mudell jevita n-nases komuni ta 'skala, u joħloq mudell 3D aktar preċiż u affidabbli mill-input estremament twil. Hija bidla milli tipprova tara l-istampa kollha f'daqqa biex tibniha minn qalba ta' fiduċja.

"L-approċċ tagħna jippermetti r-rikostruzzjoni ta 'xena 3D konsistenti globalment minn vidjo twil, li huwa ambjent ta' sfida għal metodi eżistenti li ħafna drabi jipproduċu ġeometrija skonnettjata." - Awturi tar-Riċerka LoGeR

Applikazzjonijiet Prattiċi għan-Negozji u l-Ħallieq

L-applikazzjonijiet potenzjali għal teknoloġija bħal LoGeR huma vasti. Għall-periti u l-iżviluppaturi tal-proprjetà immobbli, tista 'tittrasforma l-istħarriġ tas-sit, li tippermetti walkthrough tal-vidjo sempliċi biex tiġġenera mudell 3D dettaljat ta' proprjetà. Fid-divertiment, il-produtturi tal-films jistgħu joħolqu settijiet diġitali minn filmati estensivi tal-iscouting tal-lokalità. Għal-loġistika u l-ġestjoni tal-maħżen, jista 'jippermetti l-immappjar dinamiku 3D ta' faċilitajiet massivi. Din il-ħila li toħloq tewmin diġitali koeżiv minn vidjow mhux strutturat hija għodda qawwija. F'Mewayz, naraw sinerġija naturali ma 'din it-teknoloġija. L-OS tan-negozju modulari tagħna huwa mibni biex jintegra u jistruttura flussi ta' data kumplessi. Immaġina modulu ta' ġestjoni tal-proġett fejn vidjo ta' spezzjoni tas-sit jiġi pproċessat awtomatikament minn għodda bħal LoGeR, u l-mudell 3D li jirriżulta huwa marbut istantanjament mal-listi tal-kompiti, l-inventarju u l-iskedi ta' żmien fi ħdan il-pjattaforma Mewayz, li jipprovdi veduta tassew immersiva u b'ħafna dejta tal-progress tal-proġett.

Ħarsa 'l Quddiem: Il-Futur ta' Fehim Spazjotemporali

LoGeR jirrappreżenta qabża sinifikanti lejn sistemi AI li jistgħu jifhmu d-dinja tagħna mhux biss bħala serje ta' snapshots, iżda bħala spazju 4D kontinwu u li qed jevolvi (3D + ħin). Iterazzjonijiet futuri jistgħu jsegwu l-oġġetti u n-nies bla xkiel matul is-sigħat, u jifhmu mhux biss fejn huma l-affarijiet, iżda kif jinbidlu u jinteraġixxu fuq perjodi twal. Dan il-fehim spazjotemporali huwa l-fruntiera li jmiss. Għal pjattaformi bħal Mewayz, li għandhom l-għan li jkunu s-sistema operattiva ċentrali għal negozju, l-integrazzjoni ta’ kapaċitajiet ta’ data spazjali avvanzati bħal dawn tista’ tirrevoluzzjona kif il-kumpaniji jippjanaw, jimmonitorjaw u janalizzaw l-operazzjonijiet fiżiċi. Tqarrebna eqreb lejn futur fejn id-dinja diġitali u dik fiżika huma magħquda bla xkiel għal teħid ta' deċiżjonijiet aktar intelliġenti.

Filwaqt li għadu proġett ta' riċerka, LoGeR jindika futur fejn il-ħolqien ta' kopja diġitali komprensiva ta' kwalunkwe ambjent huwa sempliċi daqs ir-reġistrazzjoni ta' vidjo. L-implikazzjonijiet għad-dokumentazzjoni, l-analiżi, u l-interazzjoni virtwali huma profondi, u jbiddlu reġistrazzjonijiet twal f'dinjiet dejjiema u esplorabbli.

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

Mistoqsijiet Frekwenti

Bidu ta' Sigħat ta' Vidjo f'Dinja Koerenti 3D

Immaġina li taqbad vidjo ta' avveniment sħiħ—ċerimonja ta' żwieġ, proġett ta' kostruzzjoni, jew mixja fin-natura minn ġo foresta. Tispiċċa b'sigħat ta' filmati, iżda hija sekwenza ċatta u lineari. X'jiġri jekk inti tista' tittrasforma dak il-vidjo twil u diffiċli f'mudell 3D wieħed u navigabbli tax-xena kollha? Dan huwa l-għan ambizzjuż ta 'LoGeR, kollaborazzjoni ta' riċerka innovattiva bejn DeepMind u UC Berkeley. Din it-teknoloġija ma tgħaqqadx biss ritratti flimkien; jibni mill-ġdid b'mod intelliġenti dinja 3D persistenti minn flussi tal-vidjow li huma twal kemm fit-tul kif ukoll fit-triq fiżika, u jindirizza waħda mill-aktar sfidi sinifikanti fil-viżjoni bil-kompjuter.

L-Isfida Ewlenija: Konsistenza Fuq Skali Vasti

Metodi tradizzjonali ta' rikostruzzjoni 3D jisbqu b'filmati qosra jew kollezzjoni ta' ritratti meħuda minn angoli differenti fl-istess mument. Madankollu, huma jissieltu immens b'videos "twil". Id-diffikultajiet huma doppji. L-ewwel, it-tul temporali: hekk kif vidjo jinfirex fuq minuti jew sigħat, id-dawl jinbidel, l-oġġetti jimxu, u n-nies jiġu u jmorru. It-tieni, l-iskala spazjali: il-kamera tista 'taqsam żona kbira, bħal mixi minn park u ġo bini, u toħloq ambjent massiv u kumpless għall-mappa. Is-sistemi eżistenti ħafna drabi jonqsu milli jżommu mappa globali konsistenti, u dan iwassal għal rikostruzzjonijiet magħquda jew "floaters"—artifatti ghostly li ma jappartjenu għall-ebda wiċċ. LoGeR jindirizza dan billi jiffoka fuq il-bini ta' rappreżentazzjoni unifikata li tibqa' koerenti f'dawn l-iskali vasti ta' ħin u spazju.

Kif LoGeR Jikseb Rikostruzzjoni Koerenti

LoGeR, li tfisser Long Generative Reconstruction, tintroduċi approċċ ġdid iċċentrat fuq strateġija ta' "inizjalizzazzjoni taż-żerriegħa". Minflok ma tipprova tibni x-xena 3D kollha f'daqqa minn nixxiegħa tal-vidjo kaotika, is-sistema l-ewwel tidentifika segment żgħir u maniġġabbli tal-vidjo li huwa aktar faċli biex tinbena mill-ġdid b'kunfidenza għolja. Din il-garża 3D ta 'kwalità għolja sservi bħala ankra stabbli jew "żerriegħa". Il-mudell imbagħad jikber b'mod inkrementali din ir-rappreżentazzjoni 3D, qafas b'qafas, jinkorpora bir-reqqa informazzjoni viżiva ġdida filwaqt li jirreferi lura għaż-żerriegħa stabbilita biex tiġi żgurata konsistenza globali. Dan il-metodu jippermetti b'mod effettiv lill-mudell jevita n-nases komuni ta 'skala, u joħloq mudell 3D aktar preċiż u affidabbli mill-input estremament twil. Hija bidla milli tipprova tara l-istampa kollha f'daqqa biex tibniha minn qalba ta' fiduċja.

Applikazzjonijiet Prattiċi għan-Negozji u l-Ħallieq

L-applikazzjonijiet potenzjali għal teknoloġija bħal LoGeR huma vasti. Għall-periti u l-iżviluppaturi tal-proprjetà immobbli, tista 'tittrasforma l-istħarriġ tas-sit, li tippermetti walkthrough tal-vidjo sempliċi biex tiġġenera mudell 3D dettaljat ta' proprjetà. Fid-divertiment, il-produtturi tal-films jistgħu joħolqu settijiet diġitali minn filmati estensivi tal-iscouting tal-lokalità. Għal-loġistika u l-ġestjoni tal-maħżen, jista 'jippermetti l-immappjar dinamiku 3D ta' faċilitajiet massivi. Din il-ħila li toħloq tewmin diġitali koeżiv minn vidjow mhux strutturat hija għodda qawwija. F'Mewayz, naraw sinerġija naturali ma 'din it-teknoloġija. L-OS tan-negozju modulari tagħna huwa mibni biex jintegra u jistruttura flussi ta' data kumplessi. Immaġina modulu ta' ġestjoni tal-proġett fejn vidjo ta' spezzjoni tas-sit jiġi pproċessat awtomatikament minn għodda bħal LoGeR, u l-mudell 3D li jirriżulta huwa marbut istantanjament mal-listi tal-kompiti, l-inventarju u l-iskedi ta' żmien fi ħdan il-pjattaforma Mewayz, li jipprovdi veduta tassew immersiva u b'ħafna dejta tal-progress tal-proġett.

Ħarsa 'l Quddiem: Il-Futur ta' Fehim Spazjotemporali

LoGeR jirrappreżenta qabża sinifikanti lejn sistemi AI li jistgħu jifhmu d-dinja tagħna mhux biss bħala serje ta' snapshots, iżda bħala spazju 4D kontinwu u li qed jevolvi (3D + ħin). Iterazzjonijiet futuri jistgħu jsegwu l-oġġetti u n-nies bla xkiel matul is-sigħat, u jifhmu mhux biss fejn huma l-affarijiet, iżda kif jinbidlu u jinteraġixxu fuq perjodi twal. Dan il-fehim spazjotemporali huwa l-fruntiera li jmiss. Għal pjattaformi bħal Mewayz, li għandhom l-għan li jkunu s-sistema operattiva ċentrali għal negozju, l-integrazzjoni ta’ kapaċitajiet ta’ data spazjali avvanzati bħal dawn tista’ tirrevoluzzjona kif il-kumpaniji jippjanaw, jimmonitorjaw u janalizzaw l-operazzjonijiet fiżiċi. Tqarrebna eqreb lejn futur fejn id-dinja diġitali u dik fiżika huma magħquda bla xkiel għal teħid ta' deċiżjonijiet aktar intelliġenti.

Issimplifika n-negozju tiegħek ma' Mewayz

Mewayz iġib 208 modulu tan-negozju f'pjattaforma waħda — CRM, fatturazzjoni, ġestjoni tal-proġett, u aktar. Ingħaqad ma' 138,000+ utent li ssimplifikaw il-fluss tax-xogħol tagħhom.

Ibda Ħieles Illum →