Apache Hadoop: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Vitalij zad (discussione | contributi)
m Aggiungo riferimenti
Vitalij zad (discussione | contributi)
Incipit struttura e Alluxio
Riga 14:
In origine fu sviluppato per supportare la distribuzione per il progetto del [[motore di ricerca]] [[Nutch]]<ref>[https://www.geeksforgeeks.org/hadoop-history-or-evolution/ Hadoop History or Evolution]</ref>.
 
== ArchitetturaStruttura ==
Hadoop, inteso in senso stretto, è composto da HDFS, MapReduce e YARN. Per ecosistema Hadoop si intendono tutti gli strumenti realizzati appositamente per integrarsi con questi, quali ad esempio Sqoop, Hive, Flume.
Il principale componente è Hadoop Common, che fornisce accesso al [[file system]] supportato da Hadoop. L'Hadoop Common package contiene i file jar e gli script necessari per avviare Hadoop.
Il package fornisce inoltre il codice sorgente, la documentazione e una sezione contributi che include i progetti della comunità Hadoop.
 
=== File System ===
Line 28 ⟶ 27:
 
Hadoop può lavorare direttamente con qualsiasi file system distribuito che possa essere montato da un [[sistema operativo]] sottostante semplicemente usando un URL del tipo 'file://'.
 
Un componente che permette di integrare Hadoop con un grande quantitativo di filesystem, distribuiti e non, è [https://www.alluxio.io/ Alluxio].
 
=== Applicazioni e librerie usate nei cluster Hadoop ===