Predictive Analytics: Was können Vorhersagemodelle heute wirklich leisten?

Vorhersagen sind eine der letzten mythenumwobenen Disziplinen der heutigen Zeit. Seit jeher faszinieren uns Menschen, die scheinbar über übernatürlichen Sinne verfügen. Menschen, wie der Science-Fiction Autor und bekennende Futurologe Stanislaw Lem, der in seinen Buch Summa Technologiae, das 1964 veröffentlich wurde, Technologien wie Virtuelle Realität, Nanotechnologie und Künstliche Intelligenz voraussagte.

Doch hat das, was Lem 1964 auf Papier bannte, hat nur sehr wenig mit einer übernatürlichen Gabe zu tun. Vielmehr ist die Antwort auf die Frage, wie er vor mehr als 50 Jahren Technologie vorhersagen konnte, die heute erst existieren, in seinem beruflichen Hintergrund zu suchen. Lem hat Medizin studiert und suchte stets Parallelen zwischen der biologischen und der technologischen Evolution. Er wandte das Evolutionsprinzip auf die Geschichte und Gegenwart der technologischen Entwicklung an, um Aussagen über die Zukunft treffen zu können.

Predictive Analytics: Was können Vorhersagemodelle heute wirklich leisten?
Predictive Analytics: Was können Vorhersagemodelle heute wirklich leisten? – pixabay.com ©nvodicka (Creative Commons CC0)

Der Ansatz von Lem, Vergangenes und Gegenwart als Ausgangspunkt für Zukunft zu wählen, hat bis heute Bestand. Jedoch haben sich die Verfahren und die Rechenpower in den letzten 50 Jahren so rasant entwickelt, das heute Vorhersagen möglich sind, die selbst Lem so nicht hat kommen sehen. Machine Learning und Predictive Analytics finden längst eine globale Verbreitung und sind ein beherrschender Wachstumstreiber im E-Commerce. Wer von euch dieses Jahr die dmexco besucht hat, der wird dieser These nichts entgegenzusetzen haben.

Mir persönlich drängten sich daher im Laufe der dmexco gleich mehrere Fragen nachhaltig auf. Was können Vorhersagemodelle heute wirklich leisten, welchen Beitrag stiftet das Ergebnis zur Wertschöpfung und in welcher Relation steht diese wiederum zu Aufwand und Kosten?

Um zu verstehen, was Vorhersagemodelle leisten können, ist ein rudimentäres Verständnis der datenanalytischen Verfahren, die heutzutage zum Einsatz kommen, unausweichlich. Näher gebracht hat mir diese Prof. Dr. Gernot Heisenberg von der Technischen Hochschule Köln, laut dem es vier primäre Verfahren gibt:

Das wohl bekannteste und am meisten genutzte ist die Klassifikation. Dabei werden neue Datenpunkte anhand von Attributen einer Gruppe zugeordnet, bei der ein möglichst großer Match zwischen den Attributen besteht – quasi die moderne Form des Schubladendenkens. Attribute spielen zwar auch beim Clustering, dem zweiten Verfahren, eine wichtige Rolle, jedoch wird hierbei durch Abstandsberechnungen versucht Ähnlichkeiten zu finden. Als drittes Verfahren kommt die Assoziationsanalyse ins Spiel, welche Abhängigkeiten in Form von Regeln zwischen Datenpunkten herstellt. Dadurch wird es beispielsweise möglich, dem Kunden nach dem Kauf einer Zahnbürste direkt die Zahnpaste mit anzubieten. Das letzte Verfahren ist eine Zeitreise zurück in den Statistikunterricht. Die Regressionsanalyse versucht eine zu erklärende Variable aus verschiedenen Prädikaten zu bekommen. Dadurch wird etwa numerisches Forecasting möglich.

Lässt man die datenanalytischen Verfahren vor dem inneren Auge vorbeiziehen, wird schnell deutlich, dass Predictive Analytics keine generische, gar voll-automatisierte Zauberformen für die Steigerung von Ertrag, Umsatz und Customer Experience sein kann. Die Verfahren bilden vielmehr die Grundlage, um Informationen aus großen Datenmengen gewinnen zu können. Dabei steht der Einsatz eines Verfahrens, wie auch die Kombination mehrerer Verfahren, immer in direkter Abhängigkeit zur Fragestelle und den verfügbaren Daten. Klassifikation, Clustering, Assoziation und Regression sind die notwendige Basis um die Investitionen, die Unternehmen zurzeit in die CRM- und DSP-Technologien tätigen, sinnvoll heben zu können. Die Predictive Versprechen der meisten Anbieter auf der dmexco klingen zwar allesamt nach schnellem Wachstum und nie dagewesenen Uplifts, die Realität ist jedoch, dass echte Insides harte Arbeit sind.

Laut Prof. Dr. Gernot Heisenberg, und diese Einschätzung teilen die Data Experten bei Publicis, liegt der Hauptteil der Arbeit nicht etwa in der Einführung einer Plattform, in der Modellierung oder dem Anlernen des Systems, sondern in der Datenvorverarbeitung. Denn Daten sind fast nie von hoher Qualität, sondern sind zumeist lückenhaft, fehlerhaft und müssen zudem standardisiert werden um damit arbeiten zu können. Erst wenn diese Arbeit, welche gut und gerne 80% des Investitionsvolumens ausmachen kann, gewissenhaft getan ist, geht es daran, den Daten die richtigen Fragen zu stellen. Und genau hier scheitern viele ambitionierte Projekte, die die erste Hürde noch mit Erfolg genommen haben. Denn nur integrierte Teams mit Daten-Strategen/Analysten ermöglichen es, wirklich datengetrieben zu arbeiten und die richtigen Fragen zu stellen. Bei Zalando ist deshalb beispielsweise in jedem Team ein eigener Analyst zugegen, der die notwendige Übersetzungsarbeit leistet. Ein weiterer häufig gemachter Fehler ist zudem, dass nur die Frage übersetzt wird. Entscheidend ist jedoch, dass auch die Antwort in eine konsumierbare Form gebracht wird.

Unternehmen, die das Potential von Machine Learning und Predictive Analytics für ihr Geschäft verstehen, die die Tragweite überblicken und eine agile Herangehensweise für den Schritt in eine datengetriebene Zukunft wählen, steht künftig ein mächtiger Fundus an Marketingansätzen zur Verfügung um sich signifikant vom Wettbewerb abzusetzen. Zu nennen sind da etwa Customer Lifetime Value, Customer Segmentation, Customer Journey Prediction, Predictive Maintenance und Quality Assurance. Aber auch nach innen gerichtete Analyseverfahren wie Process Mining, eröffnen neue Möglichkeiten zur Kosteneinsparung bis hin zur Entwicklung neuer Geschäftsmodelle und das nicht nur für Dax-Konzerne, sondern auch für den Mittelstand. Schlussendlich gilt, was für alle komplexen IT-Projekte gilt: scale it agile.

Maik Herrmann | Executive Director Innovation


Damit Sie immer wissen, welche Produkte gerade topaktuell sind, finden Sie bei uns die Listen der Amazon Bestseller aus verschiedenen Kategorien. Einige Listen auf unserer Website werden stündlich aktualisiert, andere täglich. Hier geht es zu den Amazon Bestseller auf onlinemarktplatz.de

eco - Verband der Internetwirtschaft e.V.