Hadoop


Hadoop je open source program z rodiny Apache, napsaný v jazyce Java, který umožňuje distribuované zpracování rozsáhlých datových sad přes clustery počítačů pomocí jednoduchých programovacích modelů. Aplikace Hadoop je navržena pro škálování od jednoho serveru po tisíce strojů, z nichž každý nabízí lokální výpočet a úložiště.

Architektura Hadoop

Hadoop zahrnuje následující čtyři moduly:

  • Hadoop Common: Jsou knihovny a nástroje Java požadované jinými moduly Hadoop. Tyto knihovny poskytují abstrakce na úrovni souborového systému a operačního systému a obsahují potřebné soubory a skripty jazyka Java, které jsou nutné pro spuštění aplikace Hadoop.

  • Hadoop YARN: Je část aplikace Hadoop zodpovědná za plánování úloh a řízení clusterových zdrojů.

  • Hadoop Distributed File System (HDFS™): Distribuovaný souborový systém, který poskytuje vysokou rychlost v přístupu k datům aplikace.

  • Hadoop MapReduce: Jedná se o systém založený na YARN pro paralelní zpracování velkých datových sad.

 

Hadoop Architecture

 

 

 

 

KONTAKTUJTE NÁS