Big data analytics: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Riga 32:
{{cita pubblicazione|url=http://iopscience.iop.org/article/10.1088/1742-6596/626/1/012005/pdf|autore1=Mario Rasetti|autore2=Emanuela Merelli|titolo=The Topological Field Theory of Data: a program towards a novel strategy for data mining through data language|editore=IOP Publishing Ltd|rivista=Journal of Physics: Conference Series|volume=626|città=Torino|anno=2015|doi=10.1088/1742-6596/626/1/012005|accesso=2017-06-25}}</ref>
 
L'autore Jonathan Koomey ha raccomandato una serie di buone pratiche per comprendere i dati quantitativi. Questi includono:
Per le variabili in esame, gli analisti in genere ottengono per esse statistiche descrittive, come media (media), mediana e deviazione standard. Possono anche analizzare la distribuzione delle variabili chiave per vedere come i singoli valori si raggruppano attorno alla media.
 
*Verificare la presenza di anomalie nei dati grezzi prima di eseguire un'analisi;
<ref>{{cite book|title=Python Data Science Handbook|author=Jake VanderPlas|url=https://python.engineering/python-data-science-handbook/|ISBN=978-1491912058|date=2016|publisher=O'Reilly Media}}</ref>
*Eseguire nuovamente calcoli importanti, come la verifica di colonne di dati basate su formule;
*Confermare che i totali principali sono la somma dei subtotali;
*Controlla le relazioni tra i numeri che dovrebbero essere correlati in modo prevedibile, come i rapporti nel tempo;
*Normalizzare i numeri per facilitare i confronti, come analizzare gli importi per persona o relativi al PIL o come valore dell'indice relativo a un anno base;
*Suddividi i problemi in parti componenti analizzando i fattori che hanno portato ai risultati, come l'analisi DuPont del rendimento del capitale.
 
Per le variabili in esame, gli analisti in genere ottengono per esse statistiche descrittive, come media (media), mediana e deviazione standard. Possono anche analizzare la distribuzione delle variabili chiave per vedere come i singoli valori si raggruppano attorno alla media.<ref>{{cite book|title=Python Data Science Handbook|author=Jake VanderPlas|url=https://python.engineering/python-data-science-handbook/|ISBN=978-1491912058|date=2016|publisher=O'Reilly Media}}</ref>
 
== Note ==