Apache Hadoop: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
Nessun oggetto della modifica
Riga 82:
== Differenza tra Hadoop 1 e Hadoop 2 ==
La più grande differenza tra Hadoop 1 e Hadoop 2 è l'aggiunta di YARN (Yet Another Resource Negotiator), che ha sostituito il motore MapReduce nella prima versione di Hadoop. YARN si sforza di allocare le risorse a varie applicazioni in modo efficace. Esegue due demoni, che si occupano di due diverse attività: il gestore delle risorse, che esegue il monitoraggio dei lavori e l'allocazione delle risorse alle applicazioni, il master dell'applicazione, che monitora l'avanzamento dell'esecuzione.<ref>{{cite book|url=https://big-data.digital/taming-big-data-with-apache-spark-and-python/|title=Taming Big Data with Apache Spark and Python|author=Frank Kane|ISBN=978-1787287945|publisher=Packt|year=2017}}</ref>
 
== Differenza tra Hadoop 2 e Hadoop 3 ==
Ci sono importanti funzionalità fornite da Hadoop 3. Ad esempio, mentre c'è un singolo namenode in Hadoop 2, Hadoop 3 consente di avere più name node, che risolve il problema del singolo punto di errore.
 
In Hadoop 3, ci sono contenitori che funzionano in linea di principio di Docker, il che riduce il tempo speso per lo sviluppo delle applicazioni.
Uno dei maggiori cambiamenti è che Hadoop 3 riduce il sovraccarico di archiviazione con la codifica di cancellazione.
 
Inoltre, Hadoop 3 consente l'utilizzo dell'hardware GPU all'interno del cluster, il che rappresenta un vantaggio sostanziale per l'esecuzione di algoritmi di deep learning su un cluster Hadoop.<ref>{{cite book|url=https://books.google.it/books?id=W5VWrrCOuQ8C&pg=PA92&dq=Hadoop&hl=ru&sa=X&ved=2ahUKEwiK7uiunO3yAhVJxoUKHTVtCb0Q6AF6BAgDEAI#v=onepage&q&f=false|title=Hadoop Operations|author=Eric Sammer|publisher=O'Reilly}}</ref>
 
== Note ==