LoGeR – 3D реконструкција од екстремно долги видеа (DeepMind, UC Berkeley) | Mewayz Blog Skip to main content
Hacker News

LoGeR – 3D реконструкција од екстремно долги видеа (DeepMind, UC Berkeley)

Коментари

1 min read Via loger-project.github.io

Mewayz Team

Editorial Team

Hacker News
<член>

Претворање на часовите на видео во кохерентен 3D свет

Замислете да снимате видео од цел настан — свадбена церемонија, градежен проект или прошетка низ шума во природа. Завршувате со часови снимки, но тоа е рамна, линеарна низа. Што кога би можеле да го трансформирате долгото, тешко видео во единствен, пловен 3D модел на целата сцена? Ова е амбициозната цел на LoGeR, револуционерна истражувачка соработка помеѓу DeepMind и UC Berkeley. Оваа технологија не само што ги спојува фотографиите; тој интелигентно реконструира постојан 3D свет од видео стримови кои се долги и по времетраење и по физичка патека, справувајќи се со еден од најзначајните предизвици во компјутерската визија.

Основниот предизвик: доследност во огромни размери

Традиционалните методи на 3D реконструкција се одлични со кратки видео клипови или збирка фотографии направени од различни агли во ист момент. Сепак, тие неизмерно се борат со „долгите“ видеа. Тешкотиите се двојни. Прво, временска должина: додека видеото се протега преку минути или часови, осветлувањето се менува, предметите се движат и луѓето доаѓаат и си одат. Второ, просторна скала: камерата може да помине низ голема површина, како одење низ парк и во зграда, создавајќи масивна и сложена средина за мапирање. Постоечките системи честопати не успеваат да одржат конзистентна глобална мапа, што доведува до неповрзани реконструкции или „пловечки“ - духовити артефакти кои не припаѓаат на ниту една површина. LoGeR го решава ова со фокусирање на градење унифицирана репрезентација која останува кохерентна низ овие огромни размери на време и простор.

Како LoGeR постигнува кохерентна реконструкција

LoGeR, што значи Долга генеративна реконструкција, воведува нов пристап фокусиран на стратегија за „иницијализација на семето“. Наместо да се обидува да ја изгради целата 3Д сцена одеднаш од хаотичен видео-стрим, системот прво идентификува мал, податлив сегмент од видеото што е полесно да се реконструира со голема самодоверба. Овој висококвалитетен 3D лепенка служи како стабилно сидро или „семе“. Моделот потоа постепено ја зголемува оваа 3Д претстава, рамка по рамка, внимателно вградувајќи нови визуелни информации додека се повикува на воспоставеното семе за да обезбеди глобална конзистентност. Овој метод ефикасно му овозможува на моделот да ги избегне вообичаените замки на обемот, создавајќи попрецизен и посигурен 3D модел од исклучително долгиот влез. Тоа е промена од обидот да се види целата слика одеднаш до градење од доверливо јадро.

„Нашиот пристап овозможува реконструкција на глобално конзистентна 3D сцена од долго видео, што е предизвикувачко поставување за постоечките методи кои често произведуваат исклучена геометрија. - Истражувачки автори на LoGeR

Практични апликации за бизниси и создавачи

Потенцијалните апликации за технологија како LoGeR се огромни. За архитектите и програмерите на недвижности, тој би можел да ги трансформира анкетите на локацијата, овозможувајќи едноставно видео преглед да генерира детален 3Д модел на имот. Во забавата, филмаџиите би можеле да создадат дигитални сетови од опсежни снимки за извидување локација. За логистика и управување со складиштето, може да овозможи динамично 3Д мапирање на масивни објекти. Оваа способност да се создаде кохезивен дигитален близнак од неструктурирано видео е моќна алатка. Во Mewayz, гледаме природна синергија со оваа технологија. Нашиот модуларен деловен оперативен систем е изграден да интегрира и структурира сложени текови на податоци. Замислете модул за управување со проекти каде видеото за проверка на локацијата автоматски се обработува со алатка како LoGeR, а добиениот 3D модел веднаш се поврзува со списоци со задачи, инвентар и временски рокови во рамките на платформата Mewayz, обезбедувајќи навистина извонреден и богат со податоци приказ на напредокот на проектот.

Гледајќи напред: иднината на просторно-временското разбирање

LoGeR претставува значителен скок кон системи за вештачка интелигенција кои можат да го разберат нашиот свет не само како серија снимки, туку како континуиран, 4D простор кој се развива (3D + време). Идните повторувања би можеле беспрекорно да ги следат објектите и луѓето низ часови, разбирајќи не само каде се работите, туку и како тие се менуваат и комуницираат во долги периоди. Ова просторно-временско разбирање е следната граница. За платформи како Mewayz, кои имаат за цел да бидат централен оперативен систем за бизнис, интегрирањето на таквите напредни способности за просторни податоци може да го револуционизира начинот на кој компаниите планираат, следат и анализираат физички операции. Тоа нè доближува до иднината каде што дигиталниот и физичкиот свет се беспрекорно испреплетени за попаметно донесување одлуки.

Додека е сè уште истражувачки проект, LoGeR укажува на иднината каде што создавањето сеопфатна дигитална копија од која било средина е едноставно како снимање видео. Импликациите за документацијата, анализата и виртуелната интеракција се длабоки, претворајќи ги долгите снимки во трајни светови што може да се истражуваат.

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

Често поставувани прашања

Претворање на часовите на видео во кохерентен 3D свет

Замислете да снимате видео од цел настан — свадбена церемонија, градежен проект или прошетка низ шума во природа. Завршувате со часови снимки, но тоа е рамна, линеарна низа. Што кога би можеле да го трансформирате долгото, тешко видео во единствен, пловен 3D модел на целата сцена? Ова е амбициозната цел на LoGeR, револуционерна истражувачка соработка помеѓу DeepMind и UC Berkeley. Оваа технологија не само што ги спојува фотографиите; тој интелигентно реконструира постојан 3D свет од видео стримови кои се долги и по времетраење и по физичка патека, справувајќи се со еден од најзначајните предизвици во компјутерската визија.

Основниот предизвик: доследност над огромни размери

Традиционалните методи на 3D реконструкција се одлични со кратки видео клипови или збирка фотографии направени од различни агли во ист момент. Сепак, тие неизмерно се борат со „долгите“ видеа. Тешкотиите се двојни. Прво, временска должина: додека видеото се протега на минути или часови, осветлувањето се менува, предметите се движат и луѓето доаѓаат и си одат. Второ, просторна скала: камерата може да помине низ голема површина, како одење низ парк и во зграда, создавајќи масивна и сложена средина за мапирање. Постоечките системи честопати не успеваат да одржат конзистентна глобална мапа, што доведува до неповрзани реконструкции или „пловечки“ - духовити артефакти кои не припаѓаат на ниту една површина. LoGeR го решава ова со фокусирање на градење унифицирана репрезентација која останува кохерентна низ овие огромни размери на време и простор.

Како LoGeR постигнува кохерентна реконструкција

LoGeR, што значи Долга генеративна реконструкција, воведува нов пристап фокусиран на стратегија за „иницијализација на семето“. Наместо да се обидува да ја изгради целата 3Д сцена одеднаш од хаотичен видео-стрим, системот прво идентификува мал, податлив сегмент од видеото што е полесно да се реконструира со голема самодоверба. Овој висококвалитетен 3D лепенка служи како стабилно сидро или „семе“. Моделот потоа постепено ја зголемува оваа 3Д претстава, рамка по рамка, внимателно вградувајќи нови визуелни информации додека се повикува на воспоставеното семе за да обезбеди глобална конзистентност. Овој метод ефикасно му овозможува на моделот да ги избегне вообичаените замки на обемот, создавајќи попрецизен и посигурен 3D модел од исклучително долгиот влез. Тоа е промена од обидот да се види целата слика одеднаш до градење од доверливо јадро.

Практични апликации за бизниси и создавачи

Потенцијалните апликации за технологија како LoGeR се огромни. За архитектите и програмерите на недвижности, тој би можел да ги трансформира анкетите на локацијата, овозможувајќи едноставно видео преглед да генерира детален 3Д модел на имот. Во забавата, филмаџиите би можеле да создадат дигитални сетови од опсежни снимки за извидување локација. За логистика и управување со складиштето, може да овозможи динамично 3Д мапирање на масивни објекти. Оваа способност да се создаде кохезивен дигитален близнак од неструктурирано видео е моќна алатка. Во Mewayz, гледаме природна синергија со оваа технологија. Нашиот модуларен деловен оперативен систем е изграден да интегрира и структурира сложени текови на податоци. Замислете модул за управување со проекти каде видеото за проверка на локацијата автоматски се обработува со алатка како LoGeR, а добиениот 3D модел веднаш се поврзува со списоци со задачи, инвентар и временски рокови во рамките на платформата Mewayz, обезбедувајќи навистина извонреден и богат со податоци приказ на напредокот на проектот.

Гледајќи напред: иднината на просторно-временското разбирање

LoGeR претставува значителен скок кон системи за вештачка интелигенција кои можат да го разберат нашиот свет не само како серија снимки, туку како континуиран, 4D простор кој се развива (3D + време). Идните повторувања би можеле беспрекорно да ги следат објектите и луѓето низ часови, разбирајќи не само каде се работите, туку и како тие се менуваат и комуницираат во долги периоди. Ова просторно-временско разбирање е следната граница. За платформи како Mewayz, кои имаат за цел да бидат централен оперативен систем за бизнис, интегрирањето на таквите напредни способности за просторни податоци може да го револуционизира начинот на кој компаниите планираат, следат и анализираат физички операции. Тоа нè доближува до иднината каде што дигиталниот и физичкиот свет се беспрекорно испреплетени за попаметно донесување одлуки.

Рализирајте го вашиот бизнис со Mewayz

Mewayz носи 208 деловни модули во една платформа - CRM, фактурирање, управување со проекти и многу повеќе. Придружете се на над 138.000 корисници кои го поедноставија нивниот работен тек.

Бесплатно денес