Fahrzeugbedarf - KI-Lab Region Stuttgart

Geschäftlicher Kontext

Das Unternehmen Uber Technologies Inc. Ist ein amerikanisches Unternehmen, welches 2009 in San Francisco gegründet wurde. Mit ca. 91 Millionen Nutzern und 3,9 Millionen Fahrern weltweit, ist das Unternehmen in insgesamt 63 Ländern vertreten. Sie sind nicht nur an Gütertransporten, Personenbeförderungen und Essenslieferungen beteiligt, sie beschäftigen sich zudem mit der Entwicklung on autonomen Fahrzeugen, um eine Verbesserung von urbanen Gegeneden zu generieren. Bei dem hauptsächlichen Geschäftsmodell fungieren Personen, welche sich in der App als Fahrer registrieren als Uber-Partner. Sie können Uber-Nutzern Fahrtdienste anbieten, wodurch täglich und weltweit ca. 14 Millionen Fahrten durchgeführt werden.

Daten und Datenverständnis

Zur Visualisierung und Umsetzung des Service wird ein von Kaggle bereitgestellter Datensatz vom Raum New York City zu Hilfe genommen (Kaggle: https://www.kaggle.com/fivethirtyeight/uber-pickups-in-new-york-city) . Er besteht aus unterschiedlichen Eigenschaften, zum Beispiel Ortschaften in New York, Datum der Fahrt oder Anzahl der Fahrten. Mit Hilfe dieser Daten soll versucht werden, eine Abhängigkeit zwischen den Attributen zu ermitteln und vorherzusagen, wie viele Uber-Fahrzeuge in der New Yorker Innenstadt benötigt werden. Die Zielvariable des Datensatzes ist die Anzahl an Fahrzeugen, die im Einsatz sind.

Datenvorbereitung

Im Rahmen der Datenvorbereitung werden unter anderem Fehler bereinigt, die aus einem unterschiedlichen Datenverständnis resultieren. Außerdem wurden in diesem Schritt fehlende Werte und Ausreißer bearbeitet und notwendige Dimensionsreduktionen vorgenommen.

Datenmodellierung

Nach der Datenvorbereitung wurde der geeignete Machine Learning Algorithmus modelliert. Bei diesem Use Case wird das Lösungsverfahren der multiplen linearen Regression angewendet. Mit Hilfe dieser wird eine Beziehung zwischen zwei oder mehreren Merkmalen modelliert basierend auf einer linearen Gleichung, die an die beobachteten Daten angepasst wird.

Evaluation

Die Evaluierung stellt sicher, dass die Ansprüche an das entwickelte Model erfüllt und die Unternehmensziele erreicht werden können. Zwar wurde die Präzision des Models als hoch ausgegeben, jedoch scheinen diese Werte ein Indiz für ,,Overfitting‘‘ zu sein. Das bedeutet, dass der Algorithmus den Datensatz ,,auswendig‘‘ lernt, ohne das zugrundeliegende Muster zu erkennen. Um diesem Problem entgegenzuwirken, sollten weniger Parameter verwendet werden.

Services und Bereitstellung

Die gewonnen Daten ermöglichen es dem Uber-Unternehmen, eine effizientere und effektivere Planung der einzusetzenden Fahrzeuge einzuführen. Die räumlichen Gebiete bzw. Zonen können je nach ermittelter Abhängigkeit angemessen ausgelastet und mit Fahrzeugen versorgt werden.

Zum Download des Jupyter Notebooks

Zum Download des Datensatzes