Dense Passage Retrieval: Neuronale Suche in Texten
Leon Marius Schröder vom IAAI hat mit Unterstützung von Clemens Gutknecht von Bettcall Paul und Leon Lukas vom IT-Referat München einen Artikel dazu für das iX Magazin geschrieben.
Wer kennt es nicht? Man war auf einer Dienstreise und möchte die Kosten dafür abrechnen. Im Intranet sucht man also nach “Dienstreise abrechnen” - und findet gar nichts. Warum? Weil das passende Dokument “Reisekostenabrechnung” heißt, das altbackene Suchsystem aber keinen Zusammenhang zwischen “Dienstreise abrechnen” und “Reisekostenabrechnung” erkennt. Man muss als Mensch also vorher ganz genau wissen, nach welchen Begriffen man suchen muss, um fündig zu werden.
Wer schon mal ChatGPT und Co. ausprobiert hat, wird erlebt haben, wie es sich anfühlt, wenn man in natürlicher Sprache mit einem Computer reden kann. Wäre es nicht toll, wenn auch Suchsysteme solche Fähigkeiten hätten?
Genau das gibt es heute schon - sogar schon länger als ChatGPT. Denn so wie ChatGPT basieren auch moderne Suchsysteme auf neuronalen Sprachmodellen. Damit können Menschen in natürlicher Sprache Fragen an einen Computer stellen und dazu passende Dokumente finden.
Dabei werden die Dokumente und Suchanfragen in sogenannten Vektordatenbanken abgebildet. Um die Abbildung von Dokumenten und Suchanfragen auf Vektoren umzusetzen, kann man verschiedene Methoden anwenden. Eine dieser Methoden heißt Dense Passage Retrieval.
Der Artikel ist in der Ausgabe 6/2023 enthalten. Viel Spaß beim Lesen!