Vyšel Apache Hadoop 3

Koncem roku 2017 vyšla dlouho očekávaná nová verze Apache Hadoop 3.0.0, frameworku pro zpracování velkého množství strukturovaných i nestrukturovaných dat. Co přináší nového a proč se už nemůžeme dočkat, až s ní budeme pracovat, krátce přibližuje náš specialista na big data řešení Johnson Darkwah.

22. ledna 2018

Autor: Gauss Algorithmic Rubrika: Blog

Proč je vydání nové verze důležité?

Apache Hadoop 3.0.0 je naprostá novinka, která se do komerční distribuce dostane pravděpodobně v polovině roku 2018. Hadoop je technologie, která zásadně ovlivnila to, jak se v současnosti pracuje s velkými daty. Nyní vyšla nová verze se zásadními aktualizacemi, proto vzbuzuje tolik zájmu.


Co důležitého s sebou nová verze přináší?

Podle mě je nejvýznamnější novou funkcí HDFS Erasure Coding, která sníží využití prostoru na discích přibližně o 50 %. To znamená jedinou, ale velmi podstatnou věc – snížení nákladů na uložení dat.


Takže jde především o zrychlení a nižší náklady?

Hadoop se v posledních letech instaloval především jako on-premise přímo v datacentru zákazníka. Obecně bylo třeba Hadoop aktualizovat a posunout dál. Ukládání dat do cloudu je už poměrně levná záležitost, tudíž snaha snížit vstupní a provozní náklady Hadoopu představuje logický krok.


Jaké další novinky přinese nová verze?

Pro nás jsou zajímavé změny v YARN, konkrétně podpora Docker kontejnerů, od které si slibujeme především rychlejší vývoj na Hadoopu.


Co znamená vydání nové verze pro zákazníky?

Rychlejší, levnější a bezpečnější ukládání dat a jejich zpracování na všech úrovních. Zákazníci by měli vědět, že v Gauss Algorithmic vývoj Hadoopu pečlivě sledujeme a jakmile uznáme, že je systém vyspělý, zařadíme ho do svého portfolia a začneme nabízet jako součást našeho datalake. Hadoop je pro nás taková srdcovka – využíváme ji ve většině našich řešeních a verzi 3 nabídneme českým a slovenským zákazníkům jako první.


Jakou roli zde hraje společnost Cloudera?

Přestože je Hadoop open-source technologie, Cloudera jako taková zásadně řídí směr jejího vývoje. V Cloudeře navíc pracuje Doug Cutting, který je jedním ze zakladatelů Hadoop a člen představenstva Apache Hadoop Foundation. Gauss Algorithmic je také oficiální partner Cloudery pro střední a východní Evropu, díky čemuž jsme schopni dodávat robustní řešení ve velmi krátkém čase.


Více detailních informací o nové verzi je možné se dočíst na blogu Cloudery nebo přímo na stránkách Apache Hadoop.

 

Zajímají vás big data řešení, Hadoop, naše spolupráce s Clouderou nebo cokoli dalšího?

Kontaktujte nás – Gauss Algorithmic

Sdílejte s přáteli
Anglicky