Hadoop und Data Lakes (deutsch)
Use Cases, Nutzen und Grenzen
Nach wie vor ist die Diskussion um Hadoop und Data Lakes top aktuell. Das Hadoop-Ökosystem gilt als technologischer Wegbereiter, der es Unternehmen ermöglicht, die Früchte der Big-Data-Revolution ernten zu können. Der Data Lake gilt als weitergefasstes Datenmanagementkonzept und als Voraussetzung für ein datengetriebenes Unternehmen. Das zentrale Versprechen lautet: fast beliebig große Datenmengen aus unterschiedlichsten Systemen, mit beliebiger Struktur schnell, effizient und kostengünstig verwalten, nutzen und auswerten zu können. Eine Quelle für alle Formen analytischer Aufgabenstellungen; eine Art technologisches Rückgrat der Digitalisierung und „Big-Datafizierung“ der Wirtschaft.
Sowohl die Technologie Hadoop als auch das Konzept Data Lake sind erst seit kurzer Zeit im Enterprise-Kontext im Einsatz. Entsprechend fällt es Unternehmen häufig schwer, zwischen medialer Überhöhung und tatsächlich realisierbaren Mehrwert zu unterscheiden. Es liegen bislang erst wenige Erfahrungen vor, wie und wo es wirklich Sinn macht, welche Stolpersteine und Hürden bei der Implementierung lauern und welche potenziellen Vorteile sich in der Praxis tatsächlich ergeben.
Wichtige Antworten liefert die vorliegende BARC-Anwenderbefragung, die den Status quo von Hadoop und Data Lakes im Allgemeinen und Erfahrungen aus Hadoop Use Cases im Speziellen weltweit untersucht hat.
Kernfragen waren dabei:
- Welche Verbreitung haben Hadoop und Data Lakes bereits gefunden und wie sehen die Pläne der Unternehmen aus?
- Wie setzen Unternehmen Hadoop ein bzw. planen sie es einzusetzen?
- Wie wird ein Data Lake heute in Unternehmen genutzt?
- Auf welche Probleme stoßen die Unternehmen dabei?
- Welchen Nutzen erzielen Unternehmen durch Hadoop und was wurde bereits umgesetzt?
- Wie gestaltet sich die technologische Umsetzung?
Die deutschsprachige Studie steht nach Login (oben) oder Registrierung im BARC-Kundenbereich zum kostenfreien Download bereit.
Die Studie wurde unabhängig durch BARC erstellt. Sie kann dank eines Sponsoring von Cloudera, SAS und Teradata kostenfrei veröffentlicht werden.
Autoren: Timm Grosser, Jacqueline Bloemen, Melanie Mack, Jevgeni Vitsenko
Name | |
---|---|
Hadoop and Data Lakes (englisch) |
|
Hadoop und Data Lakes (deutsch) |
|
Infografik: Hadoop und Data Lakes |