Big data analytics: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m Bot: numeri di pagina nei template citazione |
Funzionalità collegamenti suggeriti: 2 collegamenti inseriti. |
||
Riga 15:
Si tratta di un processo di Business Intelligence adattato ai Big Data. Sono, quindi, necessari strumenti automatici che possano aiutare i [[manager]] ed i responsabili dell'azienda a prendere le decisioni giuste per massimizzare i profitti ed evitare gli sprechi dovuti a scelte sbagliate, soprattutto negli ultimi anni in cui la [[Grande recessione|crisi economica]] lascia ancora meno margini per gli errori.
La presenza di dati non strutturati, rende necessario un diverso approccio nell’analisi che differisce dai tradizionali sistemi di gestione delle basi di dati. In questo contesto bisogna disporre di architetture software predisposte alla gestione di grossi volumi di dati, capaci di elaborazioni parallele su sistemi [[computer cluster|cluster]]. [[Tecnologie emergenti]] come [[Hadoop]], [[MapReduce]] e [[NoSQL]] databases.
I principali obiettivi della Big Data analytics<ref>{{Cita pubblicazione|nome=Elisabetta|cognome=Raguseo|data=2018-2|titolo=Big data technologies: An empirical investigation on their adoption, benefits and risks for companies|rivista=International Journal of Information Management|volume=38|numero=1|pp=187-195|lingua=en|accesso=23 ottobre 2019|doi=10.1016/j.ijinfomgt.2017.07.008|url=https://linkinghub.elsevier.com/retrieve/pii/S0268401217300063}}</ref> sono:
Riga 26:
=== Differenze con la business intelligence ===
La crescente maturità del concetto dei Big Data mette in evidenza le differenze con la [[Business Intelligence]], in materia di dati e del loro utilizzo:
* la ''Business Intelligence'' utilizza la [[statistica descrittiva]] con dati ad alta densità di informazione per misurare cose, rilevare tendenze, ecc., utilizza cioè [[dataset]] limitati, dati puliti e modelli semplici per scoprire cosa è successo e perché è successo;<ref name="emc">{{cita pubblicazione|titolo=I Big Data vi parlano. Li state ascoltando?|anno=2012|editore=[[EMC Corporation]]|url=http://italy.emc.com/microsites/cio/articles/big-data-pwf/pwf.pdf|accesso=17 luglio 2017}}</ref>
* i ''Big Data'' utilizzano la [[statistica inferenziale]] e concetti di identificazione di [[Sistema non lineare|sistemi non lineari]]<ref name="billings">{{cita libro|titolo=Nonlinear system identification: NARMAX methods in the time, frequency, and spatio-temporal domains|autore=Stephen A. Billings|lingua=EN|città=New York|data=23 settembre 2013|editore=Wiley|isbn=978-1119943594}}</ref> per dedurre leggi ([[Analisi della regressione|regressioni]], relazioni non lineari ed effetti [[Causalità naturale|causali]]) da grandi insiemi di dati<ref>{{cita web|url=http://www.andsi.fr/tag/dsi-big-data|autore=Pierre Delort|titolo=Big data Paris 2013|lingua=FR|accesso=25 giugno 2017}}</ref>, e per rivelare rapporti e dipendenze ed effettuare previsioni di risultati e comportamenti<ref name="billings" /><ref>
{{cita web|url=http://lecercle.lesechos.fr/entrepreneur/tendances-innovation/221169222/big-data-low-density-data-faible-densite-information-com|autore=Pierre Delort|titolo=Big Data car Low-Density Data? La faible densité en information comme facteur discriminant|lingua=FR|accesso=25 giugno 2017}}</ref>, in altre parole utilizzano dataset eterogenei (non [[Correlazione (statistica)|correlati]] tra loro), dati raw e modelli predittivi complessi.<ref name="emc"/><ref>
|