;

EMC Greenplum HD: agresivnější slůně

10. 5. 2011
Doba čtení: 4 minuty

Sdílet

Společnost EMC v pondělí na konferenci EMC World v Las Vegas představila řešení EMC Greenplum HD integrující špičkové databázové technologie a platformu Apache Hadoop pro analýzu a ukládání velkých objemů dat.

Co je to Apache Hadoop? Open source technologie inspirovaná technickým řešením Google MapReduce a Google File System. Softwarová plaforma podporující datově náročně distrubované aplikace s efektivní analýzou a ukládáním velkých objemů dat.


Hadoop je podle zástupců EMC v současné době relevantní pro naprostou většinu podnikových uživatelů, nikoliv jen pro největší a nejrozvinutější internetové společnosti. Většina dosavadních řešení využívajících filozofie MapReduce a frameworku Hadoop byla zatím příliš "akademická", zaměřená na hardcore softwarové inženýrství a nikoliv pro běžné nasazení u podnikových uživatelů. EMC chce s využití databázových technologií Greenplum (akvizice proběhla v minulém roce) vytvořit řešení, které bude kombinovat tradiční přístupy k BI s možnostmi analýzy a ukládání velkých objemů dat (řádově petabajty) pomocí Hadoop.

Agresivnější slůně

EMC Greepnplum HD je podle výrobce "Apache Hadoop připravený pro podnikové nasazení". EMC kolem Hadoop vytvořilo kompletní strategii zahrnující distribuci, integraci a podporu open source frameworku Apache Hadoop coby podnikového nástroje pro analýzu velkých objemů dat. Součástí strategie je uvedení specializovaných vysoce výkonných Hadoop zařízení pro analýzu strukturovaných i nestrukturovaných dat. EMC bude na uvedení nástrojů a řešení pro práci s Hadoop kooperovat s celou řadou partnerů. Vlastní produkty které nabídne EMC zahrnují dvě distribuce Hadoop (plně open source) a jedno integrované řešení.

EMC GreenplumHD Data Computing Appliance

Úzce integrované řešení zahrnující vedle distribuce Apache Hadoop také Greenplum Database. Jako hardware budou použity běžné komoditní servery s klasickými disky SATA v konfiguracích JBOD (jednou z hlavních výhod Hadoop je právě schopnost pracovat na cenově nenáročném železe úložišť), speciální jsou ale systémová rozhraní umožňující propojení velkého množství serverů. Data jsou uložena v HDFS (Hadoop distributed file system), přičemž lze paralelně číst a zapisovat soubory z Greenplum databáze do HDFS pro snadné a rychlé sdílení dat. Analýza dat napříč platformami je možná díky Greenplum SQL a pokročilým analytickým funkcím HDFS. Podle výrobce se tak jedná o jedinou dostupnou kompletní platofrmu pro analýzu velkých objemů dat.

EMC Greenplum HD Enterprise Edition

Jedná se o implementaci Apache Hadoop s plnou kompatibilitou rozhraní, díky čemuž je zachována přenositelnost a napojitelnost aplikací, a zároveň byly doplněny pokročilé funkce požadované podnikovými uživateli:

bitcoin školení listopad 24

•    Funkce pro správu dat jako jsou snímky a replikace rozsáhlých částí
•    Jednoduché nahrávání dat a přístup k nim prostřednictvím systému NFS (native network file system).
•   Kompletní správa včetně tvorby jednoduchých clusterů, automatické detekce a upozornění na selhání, správy více lokalit a updatů.

EMC navíc slibuje dvou- až pětinásobně vyšší výkon ve srovnání se standardními balíčky/distribucemi Apache Hadoop.

EMC Greenplum HD Community Edition

Komunitní edice je plně open source certifikovaná a podporovaná verze stacku Apache Hadoop zahrnující HDFS, MapReduce, Zookeeper, Hive a HBase. EMC Greenplum navíc nabízí odolnost proti chybám pro Name Node a Job Tracker.

EMC zároveň oznámilo vytvoření ekosystému s dvanácti partnery, kteří nabídnou business intelligence, přenos dat a další technologické doplňky, jedná se o společnosti Concurrent, CSC, Datameer, Informatica, Jaspersoft, Karmasphere, Microstrategy, Pentaho, SAS, SnapLogic, Talend, a VMware. Divize EMC Global Services zároveň nabídne novou řadu služeb, školení a technické podpory  pro datové sklady a podnikovou analýzu včetně Enterprise Business Analytics Assesment Service, aby zákazníkum pomohla revidovat a porozumět roli dat a informací napříč podnikem, procesy a technologiemi. EMC zároveň nabídne pomoc při migraci a konsolidaci dat z databází Oracle, Teradata a dalších na Greenplum Data Computing Appliance.

Všechna řešení a produkty z rodiny EMC Greenplum HD budou na trhu dostupná během třetího čtvrtetí letošního roku.