Der Kunde
Das Kerngeschäft der FESTMA liegt in der Vertäuung von Schiffen in Bremen und Bremerhaven. Neben dem Festmachen bietet die FESTMA noch weitere Dienstleistungen an, wie die Installation einer Gangway oder Bereitstellung von Telefon- und Wasserversorgung. Die Personalplanung für eine Schicht ist abhängig von der anfallenden Arbeit, die an mehrere Faktoren gebunden ist, wie z. B. die Anzahl der Schiffe, die fest- und losgemacht werden müssen, weitere Dienstleistungen, die angefordert werden, die Wetterlage, die aktuelle Saison. Die Personalplanung wird momentan durch erfahrene Kollegen vorgenommen. Die Fragestellung der FESTMA ist, ob es anhand ihrer historischen Daten möglich ist, die Personalplanung mithilfe von Machine Learning Verfahren zu unterstützen.
Inhomogene Daten
Die Herausforderung bestand in erster Linie darin, dass zwar Daten aus fast einem Jahrzehnt zur Verfügung standen, diese jedoch häufig unstrukturierte Felder oder nicht homogene Einträge enthalten haben. Zudem haben sich aus der Grundfragestellung der Personalplanung weitere Fragen, u.a. nach der Dauer eines Schiffsaufenthaltes, ergeben.
Umsetzung in drei Phasen
- Die bereitgestellten Daten wurden extrahiert und anschließend bereinigt, indem Tupel mit fehlenden oder fehlerhaften Werten entfernt und neue Daten hinzugefügt wurden.
- Die Daten wurden visualisiert, um u.a. Ausreißer und Korrelationen sichtbar zu machen und ggf. weitere Bereinigungen vorzunehmen. Folglich wurden die passenden Features zum Trainieren der Machine Learning Algorithmen identifiziert. Zusätzlich wurden weitere externe Daten hinzugezogen.
- Verschiedene Algorithmen wurden mit den ausgesuchten Features trainiert und die Performance verglichen. Aus den Erkenntnissen wurden weitere Features abgeleitet und zusätzliche Algorithmen gegeneinander getestet. Für die am besten funktionierenden Algorithmen wurden in mehreren Iterationen die Parameter angepasst, um die Ergebnisse weiter zu verbessern.
Das Ergebnis
Für die Vorhersage der benötigten Mitarbeiter für eine Schicht konnte mit den Daten eine Genauigkeit von 88,5% und für die Liegedauer von Schiffen eine von 44,78% erreicht werden. Es wurde gezeigt, dass eine Vorhersage möglich ist, für diese aber zusätzliche externe Daten benötigt werden, um eine zufriedenstellende Genauigkeit zu erreichen.
Die eingesetzten Methoden und Technologien (Auswahl)
- Python
- ScikitLearn
- Jupyter Notebook
- Gephi
Ihre Ansprechpartner zu diesem Thema
