Object recognition: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
mNessun oggetto della modifica
mNessun oggetto della modifica
Riga 48:
=== Ricerca e indicizzazione ===
 
L'indicizzazione è il problema di immagazzinare i punti chiave [[Scale-invariant feature transform|SIFT]] e di individuarli in una nuova immagine. Lowe ha usato una modifica dell'algoritmo [[k-d tree]] chiamato metodo del '''Best-bin-first search''' <ref>Beis, J., and Lowe, D.G “Shape indexing using approximate nearest-neighbour search in high-dimensional spaces”, Conference on Computer Vision and Pattern Recognition,Puerto Rico, 1997, pp. 1000–1006.</ref>che può indivuduare il [[nearest neighbor]]s con elevata probabilità utilizzando solo limitate risorse di elaborazione. L'algoritmo BBF utilizza un ordinamento di ricerca modificato per il [[k-d tree]] in modo che i bins nella proprietà spazio siano ricercati in funzione della loro minima distanza dalla posizione richiesta. Questo ordine di ricerca richiede l'uso di una [[heap]] basata sulla [[coda di priorità]] per l'efficiente determinazione dell'ordine di ricerca. TheL'appaiamento bestal candidatemiglior matchcandidato forper eachogni keypoint isviene foundtrovato byidentificando identifyingil itssuoi vicini più prossimi [[nearest neighbor]] in thenel database ofdei keypoints fromproveniente trainingdalle imagesimmagini di addestramento. TheI [[nearest neighbor]]s aresono defineddefiniti ascome i the keypoints withcon minimumla minima [[Euclidean distance]] fromda theun givendato descriptorvettore vectordescrittivo. TheLa probabilityprobabilità thatche aun matchappaiamento issia correctcorretto canpuò beessere determineddeterminata bytramite takingil therapporto ratiodelle ofdistanze distancecon fromi thedue closest neighbor to the distance of thevicini secondpiù closestprossimi.
 
Lowe<ref name="lowe04" /> rejectedrigetta alltutti matchesgli accoppiamenti in whichcui theil distancerapporto ratiodi isdistanza greaterè thansuperiore a 0.8, whichil eliminatesche elimina 90% ofdei thefalsi falseaccoppiamenti matchespur whilecompromettendo discardingmeno less thandel 5% of thedegli correctappaiamenti matchescorretti. ToPer furthermigliorare improveulteriormente thel'efficienza efficiencydell'algoritmo ofdi thericerca best-bin-first algorithmviene searcheffettuato wasun cutcutoff offdopo afteri checkingprimi the200 first 200candidati [[nearest neighbor]] candidates. ForPer aun database ofdi 100,000 keypoints, thistutto providesciò aportta ad una velocizzazione sulla speedupricerca overdel exactcorretto [[nearest neighbor]] searchdi bycirca aboutdue 2ordini ordersdi ofgrandezza magnitudecompromettendo yetmeno results in less than adel 5% loss in thesul numbernumero ofdei correctcorretti matchesaccoppiamenti.
 
=== ClusterIdentificazione identificationdei bycluster tramite Hough transform voting ===
[[Hough Transform]] is used to cluster reliable model hypotheses to search for keys that agree upon a particular model [[pose]]. [[Hough transform]] identifies clusters of features with a consistent interpretation by using each feature to vote for all object [[pose]]s that are consistent with the feature. When clusters of features are found to vote for the same pose of an object, the probability of the interpretation being correct is much higher than for any single feature. An entry in a [[hash table]] is created predicting the model ___location, orientation, and scale from the match hypothesis.The [[hash table]] is searched to identify all clusters of at least 3 entries in a bin, and the bins are sorted into decreasing order of size.