Ein wichtiger Punkt bei Brandschutzssystemen ist, dass sie zu jeder Zeit funtionieren. Dafür wird hier in diesem Use Case geschaut, ob Sensordaten für eine KI-basierte Vorhersage von Ausfällen einer solchen Anlage/Systems verwendet werden können. Dies würde helfen, um reaktive und präventive Wartungsintervalle einzuführen. Für diese Vorhersage wurde ein Datensatz der NASA zu Turbo-Fan-Engines genommen, da es nur eine geringe Anzahl von Echtdaten im Bereich Industrial Internet of Things gibt. Dieser besteht aus folgenden Dateien: PM_train, PM_test und PM_truth. Ziel ist es, mittels Sensordaten den Ausfallzeitpunkt der Bauteile vorherzusagen. Verschiedene Schritte zur Datenvorbereitung werden umgesetzt. Als Datenmodell wird das Long Short-Term Memory (LSTM)-Modell verwendet. Das Finale Datenmodell erreicht eine Genauigkeit von 94% und einen Recall von 87,5%. Es werden also fast alle Ausfallzeitpunkte der Bauteile durch das Modell erkannt.
Andreas Buzer
In diesem Notebook analysieren wir den Umsatz von Einzelhandelsgeschäften anhand eines Multiple Linear Regression Modells. Die Problemstellung besteht darin, die Schlüsselfaktoren für den Umsatz der Geschäfte zu identifizieren und vorherzusagen.
In diesem Praxisbeispiel können Sie mithilfe des Machine Learning Models einen Dienst entwickeln, der Retouren automatisch identifiziert und etikettiert, um sie effizient wieder aufzufüllen und weiterzuverkaufen.
Mit der Vorhersage des Risikos einer koronaren Herzkrankheit können frühzeitig Maßnahmen für den Patienten ergriffen werden, um die spätere Erkrankung im besten Fall zu vermeiden.
Der Erfolg eines Startups ist besonders für Investoren ein wichtiger Punkt. Problematisch ist hierbei nur das man den Erfolg des Startups nicht garantieren kann. Dazu wird in diesem Use Case ein Datensatz von Crunchbase als Open-Source-Datenbank in Form von 11 zusammenhängenden CSV-Dateien bereitgestellt. Der Datensatz enthält Details zu verschiedenen Aspekten von Startups wie Gründungsjahr, erhaltene Finanzierung, aktueller Betriebsstatus und viele andere ähnliche Aspekte. Verschiedene Schritte zur Datenvorbereitung werden umgesetzt. Es werden vier unterschiedliche Modelle verwendet, welche aus SVC, RandomForest, ExtraTrees und der GradientBoosting-Klassifikatoren bestehen. Das finale Datenmodell erreicht einen voting score von 0,77 und einen stacking score von 0,78. Somit kann durch diesen Service für Investoren und StartUps vorhergesagt werden, ob die Unternehmen erfolgreich sind oder scheitern.
Prediction cancellation of hotel bookings CRISP-DM ist ein standardisierter Prozess für Data-Mining-Projekte, der sechs Hauptphasen umfasst: Geschäftsverständnis, Datenverständnis, Datenvorbereitung, Modellbildung,…
Die New York Life Insurance Company, ein globales Versicherungsunternehmen, erwägt eine Erweiterung des Geschäftsmodells, um zukünftig nicht nur körperliche, sondern auch psychische Erkrankungen zu versichern.
Ein bedeutendes Ziel für jedes Unternehmen ist die Umsatzsteigerung, Kostensenkung und Verbesserung der Kundenzufriedenheit. Problematisch ist dabei oft die Identifikation potenzieller Interessenten für spezifische Produkte wie KFZ-Versicherungen. Dieses Machine Learning Modell nutzt Kundendaten und Algorithmen, um die Wahrscheinlichkeit des Interesses präzise zu berechnen.
Versicherungs Unternehmen werden häufig zu Zielen von Betrügern, weshalb es sehr wichtig ist solche Betrugsversuche frühzeitig zu erkennen. Die Zeilen des Datensatzes stellen jeweils einen Kunden und Seine Vorfall dar. Die Spalten beschreiben die Merkmale der Kunden und die des Vorfalls für welchen sie ihre Versicherung in anspruch nehmen. Daten wie diese, werden von den Versicherungsunternehmen zunehmend automatisiert verarbeitet, ausgewertet und für weitere Versicherungsprozesse genutzt. Ziel ist es für bestehende Versicherungsprodukte das aktuelle Risiko zu berechnen und darauf aufbauend die Prämie und die mögliche Schadenshöhe zu ermitteln. Anhand dieses Datensatz soll mit „Machine-Learning“ ermittelt werden ob sich bei dem jeweiligen Fall um Betrug oder einen legitiemen Anspruch handelt. Logistische Regression, Entscheidungsbäume, Random Forest und Support Vector Machines werden hierbei genutzt um eine Vorhersage zu Fällen zu treffen. Das Finale Modell erreicht eine Genauigkeit von 95 % und einen Recall von 75 %. Die Mehrheit der Betrugsversuche wird mit diesem Modell erkannt.