Business Application Research Center

Experten für Business Intelligence, Analytics, Big Data, CRM und ECM

BARC-Newsletter

DataRobot – oder wie der Analyst zum Data Scientist wird

RssRss

23.01.2018

DataRobot – oder wie der Analyst zum Data Scientist wird
Wenn Ressourcen für Data Science schwer zu finden oder nicht zu bezahlen sind, dann soll Software Abhilfe schaffen und fortgeschrittene Analytik für Analysten und andere Fachanwender verfügbar machen.
In Zeiten von "AI first" heißt die Antwort oft Machine Learning und Artificial Intelligence. Dies ist auch der Ansatz von DataRobot. Durch Machine Learning soll die Aufbereitung der Features weitgehend automatisiert werden. Besonderes Augenmerk liegt auf der automatischen Berechnung einer großen Anzahl an Advanced-Analytics-Algorithmen im Autopilot-Modus. Dies geschieht im Hintergrund und der Anwender erhält übersichtlich sortiert und gut dokumentiert die Information über die zuverlässigsten Vorhersagemodelle. BARC nennt diesen Ansatz "Guided Advanced Analytics".
 
Zusätzlich zum gesetzten Ziel, Vorhersagen durch Machine Learning für mehr Anwender verfügbar zu machen, will DataRobot mit dem Ansatz für mehr Anwenderfreundlichkeit und Automation auch die Produktivität der Data Scientists erhöhen. Neben der Automation von Data Science soll die einfache Einbettung der Modelle den Nutzen von Data Science durch die unmittelbare Entscheidungsunterstützung oder -automation in operativen Prozessen sicherstellen.
 
 

DataRobot Facts

  • Gegründet 2012 in Boston, MA
  • $124 Funding
  • 180+ Data Scientists

DataRobot Highlights

  • Einbettung der Modelle in operative Applikationen über verschiedene Methoden
  • Data Profiling:
    Visuelle Darstellung der Verteilung der Datenfelder
    Automatische Vorschläge für Anpassungen, Korrekturen und Verbesserungen auf Basis der Feldinhalte
  • "Autopilot" und "Manual Mode" verfügbar für jeweilige Anwendergruppe
    Autopilot wählt die besten Algorithmen aus, dabei testen die Algorithmen im Hintergrund und alle Modelle werden mit allen kalkulierten Parametern gemäß ihrer Aussagekraft gereiht
  • R, Python und andere bereits in Installation inkludiert
  • Verfügbar On-Premises oder in der Cloud (SaaS)
  • Textmining verfügbar

DataRobot Limits

  • Data Preparation limitiert: Alle Daten in einem Datenset (Datei, ODBC, HDFS)
  • Präsenz im DACH-Raum noch im Aufbau

 

Fazit

DataRobot liefert eine einfach zu verwendende Lösung, mit deren Hilfe mit wenig Aufwand und Vorwissen auch große Datensätze auf versteckte Zusammenhänge und Muster geprüft werden können. Umfangreiche Unterstützung und Automation im Hintergrund (Guidance) erleichtern den Zugang für Analysten und steigern die Produktivität der Data Scientists. Trotz aller Unterstützung bedarf es statistisch versierter Anwender, um die bereitgestellten Ergebnisse interpretieren und validieren zu können, denn Muster weist fast jeder Datensatz auf. Die Bewertung, ob diese bedeutungsvoll sind, verlangt nach statistischem und geschäftlichem Know-how, sowie Verständnis für die wissenschaftliche Methode. Für die Aufbereitung der Datensets für die Analyse sind Werkzeuge für Data Preparation empfehlenswert.