Bürger-Einwendungen bei Bauvorhaben automatisch verarbeiten

Der Kunde

Der Kunde ist ein bundes­weit agie­ren­des Eisen­bahn­ver­kehrs- und Infra­s­truk­tur­un­ter­neh­men, das neben dem Perso­nen- und Güter­ver­kehr eben­falls im Schie­nen­netz­aus­bau tätig ist. Im Zuge des Netz­aus­baus spielt während der Planungs­phase die wach­sende Bürger­be­tei­li­gung eine wich­tige Rolle. Einwände gegen ein Bauvor­ha­ben können aus den verschie­dens­ten Grün­den vorge­bracht werden, wobei verschie­dene Exper­ten zur Bear­bei­tung und rechts­si­che­ren Beant­wor­tung hinzu­ge­zo­gen werden müssen. Um Zustän­dig­kei­ten für Einwände zu ermit­teln, müssen diese klas­si­fi­ziert und einzelne Argu­mente sepa­rat betrach­tet werden. Die Frage­stel­lung ist, ob es anhand histo­ri­scher Einwände und Beant­wor­tun­gen möglich ist, Einwände zu klas­si­fi­zie­ren und Text­bau­steine zuzu­wei­sen.

Einheitliche Klassifizierung

Die Heraus­for­de­rung bestand darin, dass es mehrere Baupro­jekte und in diesen keine einheit­li­che Klas­si­fi­zie­rung gab. Die Klas­si­fi­zie­run­gen zwischen den Projek­ten waren zusätz­lich abwei­chend und teils sehr spezi­fisch. Zudem waren die Doku­mente in vielen Fällen nur teil­weise oder gänz­lich schlecht einles­bar für OCR-Verfah­ren.

Machine-Learning erkennt Textdokumente

Die Umset­zung sah die Erstel­lung einer Proto­typ-Appli­ka­tion in drei Schrit­ten vor: (1) Initial wurde die Daten­lage begut­ach­tet und darauf basie­rend eine Machine-Lear­ning Pipe­line aus mehre­ren Verfah­ren konzi­piert. In dieser soll­ten die Doku­mente zunächst einge­le­sen, einzelne Argu­mente erkannt, Argu­mente klas­si­fi­ziert und diesen Text­bau­steine zuge­wie­sen werden. Das Einle­sen, Auftei­len und die Klas­si­fi­zie­rung, wurden in einem ersten Schritt bear­bei­tet. Die Zuwei­sung von Text­bau­stei­nen wurde basie­rend auf vorhe­ri­gen Erkennt­nis­sen vorge­nom­men. (2) In der zwei­ten Phase wurde die Pipe­line zusam­men­ge­führt und ein Fron­t­end konzi­piert, in dem Argu­mente, Klas­sen und Text­bau­steine manu­ell bear­bei­tet und in ein Excel-Doku­ment expor­tiert werden können. (3) Front- und Backend wurden in einer Azure-Umge­bung zusam­men­ge­führt und als Webser­vice zur Verfü­gung gestellt.

Prototyp ermöglicht höhere Genauigkeit

Basie­rend auf der komple­xen Daten­lage und dem nicht zentra­len Klas­si­fi­zie­rungs­an­satz konnte für die Projekte eine Genau­ig­keit zwischen  65% und 75% erreicht werden. Mithilfe des Proto­ty­pen konnte gezeigt werden, dass eine auto­ma­ti­sche Assis­tenz für die Bear­bei­tung von Einwen­dun­gen möglich ist. Auf diesen Erkennt­nis­sen können Umstruk­tu­rie­run­gen für das Projekt­vor­ge­hen und die Daten­er­fas­sung sowie darauf basie­rend eine voll­wer­tige Appli­ka­tion umge­setzt werden.

Die Projektdetails auf einen Blick
Die eingesetzten Technologien (Auswahl)
  • Python
  • Google Tesseract (OCR)
  • Natu­ral Language Proces­sing (NLP)
  • Micro­soft Azure

Projektbericht herunterladen