Scale-invariant feature transform: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica |
m Bot: sintassi dei link e modifiche minori |
||
Riga 3:
<!--{{FeatureDetectionCompVisNavbox}}-->
'''Scale-invariant feature transform''' (o '''SIFT''') è un [[algoritmo]] utilizzato in [[computer vision]] che permette di rilevare e descrivere caratteristiche, o feature, locali in immagini. L'algoritmo è stato pubblicato da [
| autore = Lowe, David G.
| anno = 1999
Riga 22:
Per ogni oggetto in un'immagine, punti interessanti possono essere estratti per fornire una descrizione delle caratteristiche dell'oggetto. Questa descrizione, ricavata da un'immagine selezionata per l'apprendimento, può essere poi usata per identificare l'oggetto quando si prova ad individuarlo in una immagine di test che contiene molti altri oggetti. Per un riconoscimento affidabile, è importante che le caratteristiche estratte dall'immagine di apprendimento siano rilevabili anche con cambiamenti di scala, rumore e illuminazione. Tali punti di solito sono posizionati in regioni ad alto contrasto dell'immagine, come contorni di oggetti.
Un'altra importante caratteristica di queste feature è che le loro posizioni relative nella scena originale non dovrebbero cambiare tra due immagini affini. Per esempio, se come feature vengono presi gli angoli di una porta, esse dovrebbero funzionare indipendentemente dalla posizione della porta; se però vengono presi in considerazione anche punti del contorno, il riconoscimento fallirebbe se la porta fosse chiusa o aperta. In modo simile, le feature situate in oggetti articolati o flessibili tipicamente non funzionano se avvenisse un qualsiasi cambiamento della loro geometria interna tra due immagini nell'insieme elaborato. In pratica, comunque, SIFT rileva e usa un numero molto più grande di feature dalle immagini, il che riduce il contributo degli errori causati da queste variazioni locali sull'errore medio di tutte le feature.
Il metodo di Lowe<ref>Brevetto US 6,711,293, "Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image", brevetto del metodo di Lowe per l'algoritmo SIFT</ref> può identificare in modo robusto oggetti anche nella confusione o parzialmente nascosti, perché il descrittore di feature SIFT è invariante per scala, orientazione e distorsione affine e parzialmente invariante a cambi di illuminazione<ref name="lowe">Lowe, D. G., “Object recognition from local scale-invariant features”, International Conference on Computer Vision, Corfu, Greece, September 1999.</ref>. Questa sezione riassume il metodo di object recognition di Lowe e introduce alcune tecniche alternative disponibili per il riconoscimenti di oggetti in condizioni di confusione o parziale occlusione.
=== Il metodo di Lowe ===
|