Apache Hadoop: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Vitalij zad (discussione | contributi)
Aggiungo le applicazioni più usate e le distribuzioni più diffuse
Vitalij zad (discussione | contributi)
Aggiungo altri componenti di Hadoop
Riga 23:
 
Hadoop supporta anche:
* [[Amazon S3]] file system;
* [[CloudStoreFile Transfer Protocol|FTP]] file system;
* [[FileHypertext Transfer Protocol|FTPHTTP]] e [[HTTPS]] file system; in sola lettura.
*[[Hypertext Transfer Protocol|HTTP]] e [[HTTPS]] file system in sola lettura.
 
Hadoop può lavorare direttamente con qualsiasi file system distribuito che possa essere montato da un [[sistema operativo]] sottostante semplicemente usando un URL del tipo 'file://'.
Line 33 ⟶ 32:
Tra le applicazioni usate più spesso in un cluster Hadoop, troviamo:
* [[Apache Spark]], il motore di elaborazione che, nella maggior parte dei casi, è nettamente più veloce di MapReduce;
* [https://sqoop.apache.org/ Apache [Sqoop]], strumento da linea di comando che permette di importare dati da basi dati relazionali verso HDFS e vice versa;
* [https://hive.apache.org/ [Apache Hive]], che viene usato per interrogare il contenuto di HDFS usando un linguaggio molto simile all'SQL che si chiama Hive Query Language;
* [https://impala.apache.org/ Apache Impala], molto simile a Hive, ma più veloce. Usa Impala Query Language;
* [https://ambari.apache.org/ Apache Ambari], che aiuta ad amministrare un cluster Hadoop con maggiore semplicità;
* [http://gethue.com/ Hue], una interfaccia grafica che permette di avere un punto di ingresso unico a tutti gli strumenti web per Hadoop;
* [[HBase]], una base dati distribuita,
* [[Apache ZooKeeper]], un servizio di configurazione e sincronizzazione distribuito.
 
== Distribuzioni di Hadoop ==