Eine Lagerhalle mit Bluetooth und autonomen Systemen

Referenz

KI-gestützte Vervollständigung von Sendungsdaten

Fehlende Sendungsdaten verkomplizieren den Logistikprozess. Für FMS implementierten wir einen Algorithmus, der die fehlenden Felder im Transportmanagementsystem vervollständigt. Disponent:innen werden so durch fachlich stimmige Vorschläge unterstützt.

Kunde

Fr. Meyer's Sohn (GmbH & Co.) KG

Branche

Logistik

Lösungen

KI-gestützte Lösung für Recherche von Sendungsdaten

Der Kunde

Fr. Meyer's Sohn – oder kurz FMS – ist ein globales Speditions- und Logistikunternehmen in Familienbesitz, das sowohl See-, Luft-, als auch Landtransporte organisiert und somit für seine Kund:innen die gesamte Transportkette abdeckt.

Fehlende Informationen in E-Mails

Ein wesentlicher Teil der Arbeit von FMS besteht darin, Kundenaufträge im Transportmanagementsystem (TMS) zu erfassen, um Sendungen anzulegen. Fehlende Informationen werden hierbei von Disponent:innen durch ihr intrinsisches Wissen vervollständigt.

Zielsetzung des Projektes war eine Lösung, die mittels statistischer Methoden und maschinellen Lernens fehlende Informationen aus E-Mails von Kund:innen möglichst genau schätzt (imputation) und eine Schnittstelle zum automatischen Erfassen von Sendungsdaten in E-Mails ermöglicht.

Besondere Herausforderungen entstanden durch das unregelmäßige Fehlen von Daten und durch heterogene Datentypen, für die einzelne Modelle trainiert werden mussten. Und darin, die Felder der Maske fachlich sinnvoll zu befüllen.

Analyse und Implementiation

Das Projekt setzten wir in zwei Phasen um:

  1. In der ersten Phase analysierten wir eine Teilmenge der vorhandenen Daten und erhoben bestehende Geschäftsregeln. Neben Standardaufgaben wie der Datenbereinigung legten wir hier ein besonderes Augenmerk auf das Association Rule Mining, um verdeckte Regel zu identifizieren. Wir wählten MissForest als geeignetes Modell zum Vervollständigen aus. Wir implementiert und evaluierten es anhand einer Testfunktion mit zufällig fehlenden Werten. Des Weiteren konzpierten wir eine Pipeline zur Datenvorbereitung und setzten diese mit Hilfe von maßgeschneiderten Transformern - also einzelnen Datenvorbereitungsschritten - um.
     
  2. In der zweiten Phase des Projektes ging es intensiv um die Auswertung und Verbesserung der Ergebnisse. Dazu implementierten wir ein weiteres Modell sowie eine Benchmark zum Vergleichen. Die Modelle passten wir auf den vollständigen Datensatz an und überarbeiteten die Implementation der Pipeline, um die Kompatibilität mit bestehenden Transformern aus sklearn zu gewährleisten. Das Deployment der Modelle wurde beispielhaft mit Hilfe des Frameworks flask als API aufgezeigt.

Vervollständigung fehlender Pflichtfelder

Eine unvollständige Sendung kann nun als JSON mit einem POST-Request an die API geschickt werden und wird mit allen Pflichtfeldern vervollständigt als JSON zurückgegeben. Für die Imputation stehen zwei Modelle zur Verfügung, welche nun in der Praxis erprobt werden, um Sachbearbeiter:innen zukünftig durch fachlich stimmige Vorschläge zu unterstützen.

Die eingesetzten Technologien (Auswahl)

  • Vorgehen nach CRISP-DM
  • JupyterLab (Python 3)
  • scikit-learn, flask, pandas, numpy

Ihr Ansprechpartner für dieses Projekt

Tim Soller

Tim Soller

Künstliche Intelligenz

0421 20750 370 E-Mail senden