Structure from motion

Versione del 14 apr 2016 alle 18:25 di Eumolpo (discussione | contributi) (ortografia)

Structure from motion o SfM (in italiano: Struttura dal movimento) è una tecnica di range imaging della computer vision e della percezione visiva, con cui il processo di stima di strutture tridimensionali da sequenze di immagini bidimensional che può essere accoppiato con segnali di movimento locali. Nella visione biologica la SfM fa riferimento al fenomeno per cui gli esseri umani ( e altre creature viventi) posso ricostruire strutture 3D da un campo in movimento in proiezione 2D (retinale) di un oggetto o una scena in movimento.

Modello di superficie digitale di un sito di costruzione di una Intersezione a livelli sfalsati di un'autostrada

Ottenere informazione 3D da immagini 2D

Gli esseri umani ricevono molte informazioni sulla struttura tridimensionale nel loro ambiente muovendosi attraverso. Quando l'osservatore si muove e gli oggetti intorno a lui si muovono, l'informazione è ottenuta da immagini nel tempo[1]. Trovare strutture dal movimento presenti problemi simili a trovare strutture dalla visione stereoscopica. In entrambi i casi, la corrispondenza tra immagini e la ricostruzione di ogetti 3D ha bisogno di essere trovata.

Per trovare corrispondenza tra immagini, le caratteristiche (feature) come i punti d'angolo (lati con gradienti in direzioni multiple) sono tracciate da un immagine alla prossima. Una delle più rilevatori di caratteristiche usati è il SIFT (Scale-invariant feature transform). Usa come caratteristiche il massimo di una piramide di differenza di gaussiane (DOG) Il primo passo nella SIFT è di trovare una direzione di gradiente dominante. Per renderla invariante alla rotazione, il descrittore è ruotato per adattarne l'orientamento[2] . Un altro rilevatore di caratteristiche molto comune è il SURF (Speeded Up Robust Features). Nel SURF, la DOG è sostituita da un rilevatore hessiano di blob basato su matrici[3]. Inoltre, invece di valutare il gradiente degli istogrammi, SURF calcola le somme dei componenti del gradiente e le somme dei loro valori assoluti[4]. Le caratteristiche rilevate da tutte le immagini saranno poi incrociate. Uno degli algoritmi di matching (per incrociare i dati) che traccia le caratteristiche da un'immagine all'altra è il tracciatore Lukas-Kanade[5].

SfM per l'analisi di struttura del patrimonio culturale

Note

  1. ^ Linda G. Shapiro, George C. Stockman, Computer Vision, Prentice Hall, 2001, ISBN 0-13-030796-3.
  2. ^ D. G. Lowe, Distinctive image features from scale-invariant keypoints, in International Journal of Computer Vision, 2004.
  3. ^ H. Bay, T. Tuytelaars, and L. Van Gool, Surf: Speeded up robust features, in 9th European Conference on Computer Vision, 2006.
  4. ^ K. Häming and G. Peters, The structure-from-motion reconstruction pipeline – a survey with focus on short image sequences, in Kybernetika, 2010.
  5. ^ B. D. Lucas and T. Kanade, An iterative image registration technique with an application to stereo vision, in IJCAI81.

Voci correlate

Bibliografia

  • Richard Hartley and Andrew Zisserman, Multiple View Geometry in Computer Vision, Cambridge University Press, 2003, ISBN 0-521-54051-8.
  • Olivier Faugeras and Quang-Tuan Luong and Theodore Papadopoulo, The Geometry of Multiple Images, MIT Press, 2001, ISBN 0-262-06220-8.
  • Yi Ma, S. Shankar Sastry, Jana Kosecka, Stefano Soatto, Jana Kosecka, An Invitation to 3-D Vision: From Images to Geometric Models, Interdisciplinary Applied Mathematics Series, #26, Springer-Verlag New York, LLC, novembre 2003, ISBN 0-387-00893-4.

Collegamenti esterni

Software Structure from Motion

Soluzioni Open source

C++

Matlab

Python

Altri software