Data mining: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Recupero di 1 fonte/i e segnalazione di 0 link interrotto/i.) #IABot (v2.0.8
Nessun oggetto della modifica
Etichetta: Link a pagina di disambiguazione
Riga 46:
* Support Vector Machines (SVM): classificazione, pattern recognition (es. RSVM).
* Association/pattern discovery: regole di associazione e dipendenze, partner sequenziali (es. CN2).
 
===Pre-elaborazione (Pre-Processing)===
Prima di poter utilizzare gli [[Algoritmo|algoritmi]] di data mining, è necessario assemblare un set di dati di destinazione. Poiché il data mining può solo scoprire modelli effettivamente presenti nei dati, il set di dati di destinazione deve essere abbastanza grande da contenere questi modelli pur rimanendo abbastanza conciso da essere estratto entro un limite di tempo accettabile.<ref>{{cite book|title=Data Science from Scratch. First Principles with Python|url=https://python.engineering/data-science-from-scratch-first-principles-with-python/|publisher=O'Reilly|date=2019|ISBN=9781492041139|}}</ref> Una fonte comune per i dati è un data mart o un data warehouse. La pre-elaborazione è essenziale per analizzare i set di dati multivariati prima del data mining. Il set di obiettivi viene quindi pulito. La pulizia dei dati rimuove le osservazioni contenenti rumore e quelle con dati mancanti.
 
=== Esempi ===
Riga 88 ⟶ 91:
 
L'esempio classico spesso usato nei corsi universitari è quello di una catena non meglio specificata di supermercati (probabilmente statunitense) che avrebbe scoperto, analizzando gli scontrini, qualcosa altrimenti difficilmente immaginabile: le persone che acquistavano pannolini spesso compravano più birra degli altri, per cui mettendo la birra più costosa non lontano dai pannolini, poteva incrementarne le vendite. Infatti, quelle persone che avevano figli piccoli passavano più serate in casa a guardare TV bevendo birra, non potendo uscire con gli amici. È doveroso tuttavia precisare che non è chiaro quale sia la catena di supermercati in questione, e l'esempio, seppur ottimo per scopi didattici e largamente utilizzato anche in ambito giornalistico, potrebbe essere stato inventato così come potrebbe essere vero.
 
==Legge sul copyright==
===Situazione in Europa===
In base alle leggi europee sul [[copyright]] e sui [[database]], l'estrazione di opere protette da copyright (ad esempio tramite il web mining) senza l'autorizzazione del titolare del copyright non è legale. Laddove un database è costituito da dati puri in Europa, può darsi che non vi sia alcun diritto d'autore, ma possono esistere diritti di database in modo che il data mining diventi soggetto ai diritti dei proprietari di proprietà intellettuale protetti dalla Direttiva sui database. Su raccomandazione della revisione di [[Hargreaves]], ciò ha portato il governo del Regno Unito a modificare la sua legge sul copyright nel 2014 per consentire l'estrazione di contenuti come limitazione ed eccezione.<ref>[http://www.out-law.com/en/articles/2014/june/researchers-given-data-mining-right-under-new-uk-copyright-laws/ UK Researchers Given Data Mining Right Under New UK Copyright Laws.] {{webarchive |url=https://web.archive.org/web/20140609020315/http://www.out-law.com/en/articles/2014/june/researchers-given-data-mining-right-under-new-uk-copyright-laws/ |date=June 9, 2014 }} ''Out-Law.com.'' Retrieved 14 November 2014</ref> Il [[Regno Unito]] è stato il secondo paese al mondo a farlo dopo il [[Giappone]], che ha introdotto un'eccezione nel 2009 per il data mining. Tuttavia, a causa della restrizione della direttiva sulla società dell'informazione (2001), l'eccezione del Regno Unito consente l'estrazione di contenuti solo per scopi non commerciali. La legge sul copyright del Regno Unito inoltre non consente che questa disposizione sia sovrascritta dai termini e condizioni contrattuali.
 
La [[Commissione europea]] ha facilitato la discussione delle parti interessate sull'estrazione di testo e dati nel 2013, sotto il titolo di Licenze per l'Europa<ref>{{cite web|title=Licences for Europe – Structured Stakeholder Dialogue 2013|url=http://ec.europa.eu/licences-for-europe-dialogue/en/content/about-site|website=European Commission|access-date=14 November 2014}}</ref>. L'attenzione alla soluzione di questo problema legale, come la concessione di licenze piuttosto che limitazioni ed eccezioni, ha portato rappresentanti di università, ricercatori, biblioteche, gruppi della società civile ed editori ad accesso aperto a lasciare il dialogo con le parti interessate nel maggio 2013.<ref>{{cite web|title=Text and Data Mining:Its importance and the need for change in Europe|url=http://libereurope.eu/news/text-and-data-mining-its-importance-and-the-need-for-change-in-europe/|website=Association of European Research Libraries|access-date=14 November 2014}}</ref>
 
 
== Note ==