Spark na cluster chytře
Apache Spark je open-source distribuovaný univerzální framework určený k provádění výpočtů na úrovni clusteru. Největší výhodou je právě možnost paralelizace na vysoké úrovni a dostupnosti v tzv. módu „High Availability“ (HA), neboli vysoká dostupnost. Díky těmto vlastnostem je Apache Spark naprosto ideální pro nasazení v prostředí pro zpracování velkého množství dat [...]
Talend: řešení pro integraci dat a automatizaci procesů
Talend je uživatelsky velmi přívětivé řešení nezávislé na Platformě určené pro integraci dat a automatizaci procesů. Nabízíme úvodní rozhovor s naším architektem řešení a ředitelem Solutia Martinem Štufi. Jaký je váš primární případ použití? Toto řešení používáme pro integraci dat, zejména v našich velkých datových projektech. V [...]