Andreas Buzer

25 Jun: Vorhersage von Ausfällen von Brandschutzsystemen basierend auf Sensordaten

Ein wichtiger Punkt bei Brandschutzssystemen ist, dass sie zu jeder Zeit funtionieren. Dafür wird hier in diesem Use Case geschaut, ob Sensordaten für eine KI-basierte Vorhersage von Ausfällen einer solchen Anlage/Systems verwendet werden können. Dies würde helfen, um reaktive und präventive Wartungsintervalle einzuführen. Für diese Vorhersage wurde ein Datensatz der NASA zu Turbo-Fan-Engines genommen, da es nur eine geringe Anzahl von Echtdaten im Bereich Industrial Internet of Things gibt. Dieser besteht aus folgenden Dateien: PM_train, PM_test und PM_truth. Ziel ist es, mittels Sensordaten den Ausfallzeitpunkt der Bauteile vorherzusagen. Verschiedene Schritte zur Datenvorbereitung werden umgesetzt. Als Datenmodell wird das Long Short-Term Memory (LSTM)-Modell verwendet. Das Finale Datenmodell erreicht eine Genauigkeit von 94% und einen Recall von 87,5%. Es werden also fast alle Ausfallzeitpunkte der Bauteile durch das Modell erkannt.

25 Jun: Vorhersage für den Erfolg oder Misserfolges eines Startups

Der Erfolg eines Startups ist besonders für Investoren ein wichtiger Punkt. Problematisch ist hierbei nur das man den Erfolg des Startups nicht garantieren kann. Dazu wird in diesem Use Case ein Datensatz von Crunchbase als Open-Source-Datenbank in Form von 11 zusammenhängenden CSV-Dateien bereitgestellt. Der Datensatz enthält Details zu verschiedenen Aspekten von Startups wie Gründungsjahr, erhaltene Finanzierung, aktueller Betriebsstatus und viele andere ähnliche Aspekte. Verschiedene Schritte zur Datenvorbereitung werden umgesetzt. Es werden vier unterschiedliche Modelle verwendet, welche aus SVC, RandomForest, ExtraTrees und der GradientBoosting-Klassifikatoren bestehen. Das finale Datenmodell erreicht einen voting score von 0,77 und einen stacking score von 0,78. Somit kann durch diesen Service für Investoren und StartUps vorhergesagt werden, ob die Unternehmen erfolgreich sind oder scheitern.

25 Jun: Vorhersage für das Interesse an Auto Versicherungen

Ein bedeutendes Ziel für jedes Unternehmen ist die Umsatzsteigerung, Kostensenkung und Verbesserung der Kundenzufriedenheit. Problematisch ist dabei oft die Identifikation potenzieller Interessenten für spezifische Produkte wie KFZ-Versicherungen. Dieses Machine Learning Modell nutzt Kundendaten und Algorithmen, um die Wahrscheinlichkeit des Interesses präzise zu berechnen.

25 Jun: Versicherungs Betrugserkennung

Versicherungs Unternehmen werden häufig zu Zielen von Betrügern, weshalb es sehr wichtig ist solche Betrugsversuche frühzeitig zu erkennen. Die Zeilen des Datensatzes stellen jeweils einen Kunden und Seine Vorfall dar. Die Spalten beschreiben die Merkmale der Kunden und die des Vorfalls für welchen sie ihre Versicherung in anspruch nehmen. Daten wie diese, werden von den Versicherungsunternehmen zunehmend automatisiert verarbeitet, ausgewertet und für weitere Versicherungsprozesse genutzt. Ziel ist es für bestehende Versicherungsprodukte das aktuelle Risiko zu berechnen und darauf aufbauend die Prämie und die mögliche Schadenshöhe zu ermitteln. Anhand dieses Datensatz soll mit „Machine-Learning“ ermittelt werden ob sich bei dem jeweiligen Fall um Betrug oder einen legitiemen Anspruch handelt. Logistische Regression, Entscheidungsbäume, Random Forest und Support Vector Machines werden hierbei genutzt um eine Vorhersage zu Fällen zu treffen. Das Finale Modell erreicht eine Genauigkeit von 95 % und einen Recall von 75 %. Die Mehrheit der Betrugsversuche wird mit diesem Modell erkannt.