Apache Hadoop: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m Aggiungo riferimenti |
Incipit struttura e Alluxio |
||
Riga 14:
In origine fu sviluppato per supportare la distribuzione per il progetto del [[motore di ricerca]] [[Nutch]]<ref>[https://www.geeksforgeeks.org/hadoop-history-or-evolution/ Hadoop History or Evolution]</ref>.
==
Hadoop, inteso in senso stretto, è composto da HDFS, MapReduce e YARN. Per ecosistema Hadoop si intendono tutti gli strumenti realizzati appositamente per integrarsi con questi, quali ad esempio Sqoop, Hive, Flume.
=== File System ===
Line 28 ⟶ 27:
Hadoop può lavorare direttamente con qualsiasi file system distribuito che possa essere montato da un [[sistema operativo]] sottostante semplicemente usando un URL del tipo 'file://'.
Un componente che permette di integrare Hadoop con un grande quantitativo di filesystem, distribuiti e non, è [https://www.alluxio.io/ Alluxio].
=== Applicazioni e librerie usate nei cluster Hadoop ===
|