Forschungsprojekt
Dokumentidentifikation für die Bundesdruckerei
In diesem Projekt werden vom IAAI Machine Learning (ML) Verfahren zur Identifikation von Dokumenten erforscht, entwickelt, evaluiert und optimiert. Die Dokumente liegen in eingescannter Form als Bilder vor. Das zu entwickelnde Verfahren soll Dokumentbilder klassifizieren. Ziel ist die Bestimmung von Land, Dokumententyp und Modelljahr basierend auf Bildaufnahmen von Lesegeräten der Bundesdruckerei. Insbesondere auch für Dokumente ohne maschinenlesbare Zeilen (MLZ). Dazu gehören Berechtigungsnachweise aller Art, Führerscheine, Vorderseite von ID-Karten, weitere Passseiten, usw. Die Identifikation muss robust für die verschiedenen Gerätetypen mit deren spezifischen Eigenschaften (Unschärfe, Belichtung, Farbabweichung) sein. Wesentliche Herausforderungen bestehen in der Erforschung geeigneter Bildrepräsentationen (Image Embeddings) und in der Entwicklung und Evaluation von ML-Algorithmen, welche insbesondere auch bislang unbekannte Dokumenttypen identifizieren können.
Verbundpartner
Projektteam
Manuel Eberhardinger
PhD Student
Machine Learning
Deep Learning
Patrick Takenaka
PhD Student
Machine Learning
Deeplearning
Johannes Maucher
Professor
Machine Learning
Deeplearning