„In Zeiten von Big-Data und der massenweisen Verarbeitung von Daten ist die Qualität der Daten ein zentrales Problem“, so Stefan Klessinger, der seit Oktober 2021 als Doktorand am Lehrstuhl für Informatik mit Schwerpunkt Skalierbare Datenbanksysteme von Prof. Dr. Stefanie Scherzinger arbeitet. In seiner Forschung geht es um die automatische Erkennung von Abhängigkeiten in semi-strukturierten Daten, wodurch die Struktur der Daten (in einem sogenannten Schema) genauer beschrieben wird, als es bestehende Ansätze können.
Ein Beispiel zur Veranschaulichung: Ein Datensatz beschreibt Personen jeweils durch sogenannte Attribute, wie z.B. Vorname, Zweitname, Nachname, Geburtsjahr und Generation. Bestehende Ansätze konzentrieren sich darauf zu erkennen, dass etwa „Zweitname“ nicht immer auftritt oder dass „Geburtsjahr“ eine Zahl ist, während die anderen Attribute jeweils Zeichenketten aus Buchstaben sind. Klessingers Ziel ist es, genauere Beschreibungen durch sogenannte Abhängigkeiten zu formulieren. In diesem Fall könnte man z.B. erkennen, dass es sich um die „Generation Z“ handelt, wenn als Geburtsjahr das Jahr 2000 erscheint.
Mit seiner Forschungsarbeit sicherte sich Klessinger in der „International Conference on Management of Data“ (SIGMOD), die im Juni in Seattle stattfand und eine der wichtigsten internationalen Konferenzen im Bereich Datenbanken ist, den ersten Platz in der "Student Research Competition". Lehrstuhlinhaberin Prof. Dr. Stefanie Scherzinger gratuliert: „Es ist das zweite Mal in Folge, dass es ein Mitarbeiter des Lehrstuhls in die Endrunde des ACM Sigmod Student Research Contests schafft. Dass Herr Klessinger dieses Jahr den Wettbewerb sogar gewonnen hat, freut mich wirklich sehr."