Business Application Research Center

BARC-Newsletter

Hadoop Distributionen

Marktübersicht - Fünf Hadoop-Distributionen im Vergleich

Hadoop Distributionen

Marktübersicht - Fünf Hadoop-Distributionen im Vergleich

Mehr Daten, die es zu verwalten gilt, sowie schnellere und fortgeschrittene Analysen auf nicht nur mehr strukturierten Daten, sind Gegenstand der Big-Data-Idee. Stark verknüpft mit Big Data ist Hadoop, eine Sammlung von technischen Komponenten für die Auswertung, Verwaltung und den Zugriff auf strukturierte und unstrukturierte Daten.

Viele Unternehmen haben mittlerweile den Mehrwert von Hadoop erkannt und beeinflussen dessen weitere Entwicklung als Plattform in Enterprise-Umgebungen. Dabei geht es um Performance, Stabilität, Security, Analysefähigkeit, Nutzbarkeit (bspw. in Form eines ausreichenden SQL-Zugriffs), Wartbarkeit oder Administrierbarkeit, die in der ursprünglichen Apache Hadoop Distribution eher schwach ausgeprägt sind. Zudem ist die Frage des verlässlichen Supports und der Haftung zu klären – ein „General Availability (GA)“ Vermerk für Open-Source-Hadoop-Projekte heißt nichts anderes als „fehlerfrei kompiliert“. Ein Grund für Anbieter eigene Distributionen anzubieten, die die genannten Schwachstellen durch eigene Bausteine oder Erweiterungen erweitern und dadurch einen eigenen „added Value“ bieten.

Die Marktübersicht „Hadoop-Distributionen“ bietet dem Leser einen aktuellen Überblick der fünf Hadoop-Distributionen Cloudera, Hortonworks, IBM, MapR und Pivotal. Diese Distributionen wurden deshalb für die Betrachtung ausgewählt, da sie sowohl direkt vertrieben werden als auch Ausgangsdistributionen für weitere Softwareanbieter sind (so hat Oracle beispielsweise eine Partnerschaft mit Cloudera geschlossen, um diese Distribution im Oracle Soft- und Hardwarestack anzubieten; Microsoft setzt hingegen auf Hortonworks, welches der Konzern leicht angepasst im Microsoft-Cloud-Angebot „Azure“ oder im Software-Paket „HDInsights“ seinen Kunden zur Verfügung stellt).

Die Marktübersicht bietet Unternehmen, die vor der Auswahl einer geeigneten Hadoop-Distribution stehen wertvolle Informationen zu den Distributionen sowie zur Herangehensweise an das Software-Auswahlprojekt.

Die Studie liefert hierzu konzentriert die relevanten Grundlagen, wie die Hadoop-Technologie aktuelle Herausforderungen des Datenmanagements bedienen kann. Es werden Anwendungsfälle dargestellt sowie Vorbehalte und Risiken erläutert. Die wesentlichen Komponenten des Hadoop-Technologie-Pakets werden vorgestellt und die Mehrwerte aufgezeigt, mit denen kommerzielle Hadoop-Anbieter aufwarten können. Eine Marktübersicht ist ebenso vorhanden wie ein Kriterienkatalog anhand derer die fünf Hadoop-Distributionen beschrieben und bewertet werden.

Machen Sie sich das kompakt dargestellte Wissen der BARC-Analysten zu Nutze und profitieren Sie von den übersichtlichen und unabhängigen Bewertungen.

Bei Erwerb der Marktübersicht „Hadoop-Distributionen" erhalten Sie Online-Zugriff auf das ca. 28-seitige Dokument.

Leseprobe und Bestellung

-> Leseprobe anfordern
-> Bestellung siehe Kasten oben rechts

Name
Marktübersicht - Hadoop-Distributoren Weitere Informationen
Name
BIG DATA Survey Europe Weitere Informationen
Big Data Use Cases Weitere Informationen
Datenmanagement im Wandel - Data Warehousing und Datenintegration im Zeitalter von Self-Service und Big Data Weitere Informationen
Modernes Datenmanagement für die Analytik Weitere Informationen
Survey - Big Data Analytics Weitere Informationen
Hadoop als Wegbereiter für Analytics Weitere Informationen