Structure from motion: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
m added Category:Elaborazione digitale delle immagini; removed {{uncategorized}} usando HotCat, fix
Pil56-bot (discussione | contributi)
m smistamento lavoro sporco e fix vari
Riga 1:
[[File:DSM_construction_siteDSM construction site.jpg|thumb|right| Modello di superficie digitale di un sito di costruzione di una [[Intersezione a livelli sfalsati]] di un'autostrada ]]
'''Structure from motion''' o '''SfM''' (in italiano: ''Struttura dal movimento'') è una tecnica di [[range imaging]] della [[computer vision]] e della [[Vista (senso)|percezione visiva]], con cui il processo di stima di strutture tridimensionali da sequenze di immagini bidimensional che può essere accoppiato con segnali di movimento locali.
Nella visione biologica la SfM fa riferimento al fenomeno per cui gli esseri umani ( e altre creature viventi) posso ricostruire strutture 3D da un campo in movimento in proiezione 2D (retinale) di un oggetto o una scena in movimento.
Riga 5:
== Ottenere informazione 3D da immagini 2D ==
Gli esseri umani ricevono molte informazioni sulla struttura tridimensionale nel loro ambiente muovendosi attraverso.
Quando l'osservatore si muove e gli oggetti intorno a lui si muovono, l'informazione è ottenuta da immagini nel tempo<ref>{{cite bookcita libro| title titolo= Computer Vision | author autore= Linda G. Shapiro, George C. Stockman | publisher editore= Prentice Hall | year anno= 2001 | isbn = 0-13-030796-3 }}</ref>.
Trovare strutture dal movimento presenti problemi simili a trovare strutture dalla visione stereoscopica. In entrambi i casi, la corrispondenza tra immagini e la ricostruzione di ogetti 3D ha bisogno di essere trovata.
 
Per trovare corrispondenza tra immagini, le caratteristiche (feature) come i punti d'angolo (lati con gradienti in direzioni multiple) sono tracciate da un immagine alla prossima.
Una delle più rilevatori di caratteristiche usati è il [[Scale-invariant feature transform|SIFT]] (Scale-invariant feature transform). Usa come caratteristiche il massimo di una piramide di [[differenza di gaussiane]] ([[DOG]])
Il primo passo nella SIFT è di trovare una direzione di gradiente dominante. Per renderla invariante alla rotazione, il [[descrittore]] è ruotato per adattarne l'orientamento<ref>{{Cite journalCita pubblicazione| journal rivista= International Journal of Computer Vision | title titolo= Distinctive image features from scale-invariant keypoints | author autore= D. G. Lowe | year anno= 2004 }}</ref> .
Un altro rilevatore di caratteristiche molto comune è il [[SURF]] ([[Speeded Up Robust Features]]). Nel SURF, la DOG è sostituita da un rilevatore hessiano di [[blob]] basato su matrici<ref>{{Cite journalCita pubblicazione| journal rivista= 9th European Conference on Computer Vision | title titolo= Surf: Speeded up robust features | author autore= H. Bay, T. Tuytelaars, and L. Van Gool | year anno= 2006 }}</ref>.
Inoltre, invece di valutare il gradiente degli istogrammi, SURF calcola le somme dei componenti del gradiente e le somme dei loro valori assoluti<ref>{{Cite journalCita pubblicazione| journal rivista= Kybernetika | title titolo= The structure-from-motion reconstruction pipeline – a survey with focus on short image sequences | author autore= K. Häming and G. Peters| year anno= 2010 | url = http://dml.cz/dmlcz/141400 }}</ref>.
Le caratteristiche rilevate da tutte le immagini saranno poi incrociate.
Uno degli algoritmi di matching (per incrociare i dati) che traccia le caratteristiche da un'immagine all'altra è il [[tracciatore Lukas-Kanade]]<ref>{{Cite journalCita pubblicazione| journal rivista= IJCAI81 | title titolo= An iterative image registration technique with an application to stereo vision | author autore= B. D. Lucas and T. Kanade }}</ref>.
 
== SfM per l'analisi di struttura del patrimonio culturale ==
Riga 31:
== Bibliografia ==
 
* {{cita libro|autore=Richard Hartley and Andrew Zisserman |titolo=Multiple View Geometry in Computer Vision |editore=Cambridge University Press|anno=2003 |isbn=0-521-54051-8}}
* {{cite book |
author=Richard Hartley and Andrew Zisserman |
title=Multiple View Geometry in Computer Vision |
publisher=Cambridge University Press|
year=2003 |
isbn=0-521-54051-8}}
 
* {{cita libro|autore=Olivier Faugeras and Quang-Tuan Luong and Theodore Papadopoulo |titolo=The Geometry of Multiple Images |editore=MIT Press|anno=2001 |isbn=0-262-06220-8}}
* {{cite book |
*{{cita libro|titolo=An Invitation to 3-D Vision: From Images to Geometric Models |autore=Yi Ma, S. Shankar Sastry, Jana Kosecka, Stefano Soatto, Jana Kosecka |editore=Springer-Verlag New York, LLC |data=novembre 2003|isbn=0-387-00893-4|trasmissione=Interdisciplinary Applied Mathematics Series, #26}}
author=Olivier Faugeras and Quang-Tuan Luong and Theodore Papadopoulo |
title=The Geometry of Multiple Images |
publisher=MIT Press|
year=2001 |
isbn=0-262-06220-8}}
*{{cite book |
title=An Invitation to 3-D Vision: From Images to Geometric Models |
author=Yi Ma, S. Shankar Sastry, Jana Kosecka, Stefano Soatto, Jana Kosecka |
publisher=Springer-Verlag New York, LLC |date=November 2003|
isbn=0-387-00893-4|
series=Interdisciplinary Applied Mathematics Series, #26
}}
 
== Collegamenti esterni ==
 
*[http://exporttocanoma.blogspot.it/2012/11/sfm-structure-from-motion-prima-parte.html Structure from motion in exporttocanoma.blogspot.it]
 
Riga 94 ⟶ 77:
*[http://catena.googlecode.com Catena] Python Abstract Workflow Framework with SfM components.
*[http://ptak.felk.cvut.cz/sfmservice/websfm.pl?menu=cmpmvs CMPMVS] Multi-View Reconstruction Software
 
 
[[Categoria:Elaborazione digitale delle immagini]]