Versione delle 10:06, 18 apr 2018 modifica RolloBot (discussione \| contributi) Bot 95 868 modifiche m Bot: Correzione di uno o più errori comuni ← Differenza precedente		Versione delle 21:30, 18 apr 2018 modifica annulla Vitalij zad (discussione \| contributi) 1 030 modifiche Suddivido in categorie le varie applicazioni Differenza successiva →
Riga 31: === Applicazioni usate nei cluster Hadoop === Tra le applicazioni usate più spesso in un cluster Hadoop, troviamo: '''Motori di esecuzione''' * [[Apache Spark]], il motore di elaborazione che, nella maggior parte dei casi, è nettamente più veloce di MapReduce; * [[Pig (programma)]], una piattaforma di alto livello per creare programmi MapReduce * [[Sqoop]], strumento da linea di comando che permette di importare dati da basi dati relazionali verso HDFS e vice versa;▼ '''Strumenti per l'immagazinamento dei dati''' * [[Apache Hive]], che viene usato per interrogare il contenuto di HDFS usando un linguaggio molto simile all'SQL che si chiama Hive Query Language; * [https://impala.apache.org/ Apache Impala], molto simile a Hive, ma più veloce. Usa Impala Query Language; * [[HBase]], una base dati distribuita,▼ ▲* [[Sqoop]], strumento da linea di comando che permette di importare dati da basi dati relazionali verso HDFS e vice versa; '''Console web''' * [https://ambari.apache.org/ Apache Ambari], che aiuta ad amministrare un cluster Hadoop con maggiore semplicità; * [http://gethue.com/ Hue], una interfaccia grafica che permette di avere un punto di ingresso unico a tutti gli strumenti web per Hadoop; '''Altri strumenti''' ▲* [[HBase]], una base dati distribuita, * [[Apache ZooKeeper]], un servizio di configurazione e sincronizzazione distribuito, * [[Apache Flume]] è, un servizio distribuito affidabile e disponibile per la raccolta, l'aggregazione e il trasporto un grande quantitativo di dati di log in maniera efficiente. == Distribuzioni di Hadoop ==

Apache Hadoop: differenze tra le versioni