Forschungsprojekt
Dokumentidentifikation für die Bundesdruckerei

In diesem Projekt werden vom IAAI Machine Learning (ML) Verfahren zur Identifikation von Dokumenten erforscht, entwickelt, evaluiert und optimiert. Die Dokumente liegen in eingescannter Form als Bilder vor. Das zu entwickelnde Verfahren soll Dokumentbilder klassifizieren. Ziel ist die Bestimmung von Land, Dokumententyp und Modelljahr basierend auf Bildaufnahmen von Lesegeräten der Bundesdruckerei. Insbesondere auch für Dokumente ohne maschinenlesbare Zeilen (MLZ). Dazu gehören Berechtigungsnachweise aller Art, Führerscheine, Vorderseite von ID-Karten, weitere Passseiten, usw. Die Identifikation muss robust für die verschiedenen Gerätetypen mit deren spezifischen Eigenschaften (Unschärfe, Belichtung, Farbabweichung) sein. Wesentliche Herausforderungen bestehen in der Erforschung geeigneter Bildrepräsentationen (Image Embeddings) und in der Entwicklung und Evaluation von ML-Algorithmen, welche insbesondere auch bislang unbekannte Dokumenttypen identifizieren können.

Verbundpartner

Projektteam

Manuel Eberhardinger
PhD Student

Machine Learning
Deep Learning

Patrick Takenaka
PhD Student

Machine Learning
Deeplearning

Johannes Maucher
Professor

Machine Learning
Deeplearning

Förderer