Clustering: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m →Altri progetti: Eliminato il parametro "Wikibooks (italiano)" nel template "Interprogetto" |
m Ho corretto lo spelling di "k-medoids" e aggiunto un link alla pagina Wikipedia di riferimento. |
||
(Una versione intermedia di un altro utente non mostrate) | |||
Riga 24:
Gli algoritmi di clustering di questa famiglia creano una [[Partizione (teoria degli insiemi)|partizione]] delle osservazioni minimizzando una certa funzione di costo:
:<math>\sum_{j=1}^k E( C_j ),</math>
dove <math>k</math> è il numero dei cluster, <math>C_j</math> è il <math>j</math>-esimo cluster e <math>E\colon C \rightarrow \R^{+}</math> è la funzione di costo associata al singolo cluster. L'algoritmo più famoso appartenente a questa famiglia è il [[k-means]], proposto da MacQueen nel [[1967]]. Un altro algoritmo abbastanza conosciuto appartenente a questa classe è il [[K-medoids|Partitioning Around
=== Clustering gerarchico ===
Riga 53:
* ''Dunn Index''
:L'indice di Dunn mira a identificare cluster densi e ben separati. È definito come il rapporto tra la minima distanza inter-cluster e la massima distanza intra-cluster. Per ogni partizione del cluster, l'indice di Dunn può essere calcolato con la seguente formula:<ref>{{Cita pubblicazione|cognome= Dunn |nome=J.|titolo=Well separated clusters and optimal fuzzy partitions|rivista=Journal of Cybernetics|anno=1974| volume = 4|pp=
::<math>
|