Kundenverhalten - KI-Lab Region Stuttgart

Geschäftlicher Kontext

Unter Kundenabwanderung versteht man die Entscheidung eines Kunden, den Erwerb einer bestimmten Dienstleistung eines Unternehmens einzustellen. Damit stellt sie das Gegenstück zu einer langfristigen Kundenbindung dar. Um die Kundenbindung zu fördern, müssen Unternehmen Analysen einsetzen, die bereits frühzeitig erkennen, ob sich ein Kunde vom Unternehmen lösen möchte. Dies ermöglicht die Einleitung von Marketing- und Vertriebsmaßnahmen noch vor dem realen Kundenverlust. Der Service beantwortet in diesem Zusammenhang konkret diese beiden Fragestellungen: Mit welcher Wahrscheinlichkeit kann auf Basis historischer Daten vorhergesagt werden, ob ein Kunde zu einem anderen Anbieter abwandert? Welche Faktoren führen zu einer Abwanderung des Kunden?

Daten und Datenverständnis

Zur Visualisierung und Umsetzung des Services wird der Datensatz eines fiktiven Telekommunikationsunternehmen genutzt (Kaggle: https://www.kaggle.com/blastchar/telco-customer-churn). Dieser besteht aus 7.043 Zeilen. Jede Zeile beschreibt einen Kunden mit 21 Spalten. Dabei definiert jede Spalte unterschiedliche Merkmale (Attribute) der Kunden. Auf Basis der Daten soll klassifiziert werden, ob ein Kunde das Unternehmen verlässt oder nicht. Dafür enthalten die historischen Daten die Zielvariable „Churn“, die Auskunft darüber gibt, ob ein Kunde abgewandert ist.

Datenvorbereitung

Im Rahmen der Datenvorbereitung werden Fehler bereinigt, die während der Datenerzeugung aufgetreten sind. Außerdem werden fehlende Werte und Ausreißer bearbeitet. Nicht relevante Merkmale werden aus dem Datensatz bereinigt (Dimensionsreduktion).

Datenmodellierung

Nach der Datenvorbereitung wird ein geeigneter Machine Learning-Algorithmus modelliert. Der vorliegende Service ist durch ein binäres Klassifikationsproblem gekennzeichnet (Kunde wandert ab/Kunde wandert nicht ab). Ein klassisches Lösungsverfahren für diese Art der Problemstellung liegt in der sogenannten logistischen Regression. Dabei wird geschätzt, mit welcher Wahrscheinlichkeit die Kunden (mit ihren Merkmalen) einer der binären Zielklassen angehören.

Evaluation

Die Evaluation des Modells erfolgt unter Beobachtung verschiedener Gütemaße, zum Beispiel der Genauigkeit (Accuracy) oder der Sensitivität. Nach der Evaluation werden Veränderungen im Modell vorgenommen und somit die Ergebnisse der Gütemaße und das Modell optimiert. Dazu zählt auch eine Angleichung der Menge an Datensätzen in den beiden Zielklassen (Undersampling, Oversampling).

Services und Bereitstellung

Für die Verwendung des Services kann ein Datensatz einer einzelnen Person importiert werden. Durch den Algorithmus wird eine Vorhersage bezüglich einer möglichen Abwanderung des Kunden ausgegeben. Entsprechend lassen sich die Marketing- und Vertriebsaktivitäten auf Kunden mit hoher Abwanderungsrate konzentrieren.

Zum Download des Jupyter Notebooks

Zum Download des Datensatzes