Clustering: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
Riga 20:
Queste due suddivisioni sono del tutto trasversali, e molti algoritmi nati come "esclusivi" sono stati in seguito adattati nel caso "non-esclusivo" e viceversa.
=== Clustering
Gli algoritmi di clustering di questa famiglia creano una [[Partizione (teoria degli insiemi)|partizione]] delle osservazioni minimizzando una certa funzione di costo:<br />
<math>\sum_{j=1}^k E( C_j )</math> <br /> dove <math>k</math> è il numero dei clusters, <math>C_j</math> è il <math>j-esimo</math> cluster e <math>E:C \rightarrow R^{+}</math> è la funzione di costo associata al singolo cluster. L'algoritmo più famoso appartenente a questa famiglia è il ''k-means'', proposto da MacQueen nel [[1967]]. Un altro algoritmo abbastanza conosciuto appartenente a questa classe è il '[[Partitioning Around Medioid]] (PAM)'.
|