Apache Hadoop: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
RolloBot (discussione | contributi)
m Bot: Correzione di uno o più errori comuni
Vitalij zad (discussione | contributi)
Suddivido in categorie le varie applicazioni
Riga 31:
=== Applicazioni usate nei cluster Hadoop ===
Tra le applicazioni usate più spesso in un cluster Hadoop, troviamo:
 
'''Motori di esecuzione'''
* [[Apache Spark]], il motore di elaborazione che, nella maggior parte dei casi, è nettamente più veloce di MapReduce;
* [[Pig (programma)]], una piattaforma di alto livello per creare programmi MapReduce
* [[Sqoop]], strumento da linea di comando che permette di importare dati da basi dati relazionali verso HDFS e vice versa;
'''Strumenti per l'immagazinamento dei dati'''
* [[Apache Hive]], che viene usato per interrogare il contenuto di HDFS usando un linguaggio molto simile all'SQL che si chiama Hive Query Language;
* [https://impala.apache.org/ Apache Impala], molto simile a Hive, ma più veloce. Usa Impala Query Language;
* [[HBase]], una base dati distribuita,
* [[Sqoop]], strumento da linea di comando che permette di importare dati da basi dati relazionali verso HDFS e vice versa;
'''Console web'''
* [https://ambari.apache.org/ Apache Ambari], che aiuta ad amministrare un cluster Hadoop con maggiore semplicità;
* [http://gethue.com/ Hue], una interfaccia grafica che permette di avere un punto di ingresso unico a tutti gli strumenti web per Hadoop;
'''Altri strumenti'''
* [[HBase]], una base dati distribuita,
* [[Apache ZooKeeper]], un servizio di configurazione e sincronizzazione distribuito,
* [[Apache Flume]] è, un servizio distribuito affidabile e disponibile per la raccolta, l'aggregazione e il trasporto un grande quantitativo di dati di log in maniera efficiente.
 
== Distribuzioni di Hadoop ==