Das Projekt ist Teil meiner Masterarbeit „In Medias Res - Semantische Suche in philosophischen Texten anhand von Kants Gesamtwerk mithilfe von Transformer Modellen“. Das Projekt ist jedoch mit dem Abschluss der Arbeit noch nicht abgeschlossen und wird weiterentwickelt. Ziel war indessen nicht nur ein funktionierendes Programm und entsprechende Webseite zu bauen, sondern auch ein allgemeines Verfahren zur Informationsextraktion für schwerzugängliche Texte zu entwickeln.
Wie sich in der Auswertung zeigt, konnten einige Verbesserungen der Modell sowie ein funktionierendes Verfahren erstellt werden. Weitere Verbesserungen wurden bereits durchgeführt, wie eine Verlinkung zu dem Gesamtkorpus auf korpora.org oder die automatisierte Teilauswertung anhand der bestehenden Bewertungen, oder stehen noch aus. Das Verfahren ist meiner Einschätzung nach vor allem aufgrund der absoluten Vermeidung von Halluzinationen, trotz neuerer Verfahren wie RAGs, und ungefilterter Kontextlieferung immernoch relevant. Dies gilt gerade auch bei sehr fachspezifischen Modellen, die viele Fremdworte oder generell eine nicht so einfach normalisierbare Sprache beinhalten.
Umgesetzt wurde Masterarbeit und auch die weiteren Änderungen von mir, Svenja Wagner. Dank dieser Arbeit Absolventin der Universität Trier im Master Sc. Digital Humanities. Angestellt sowohl an der Universität Trier im Projekt Fürstinnenbibliotheken und Wissenspraktiken im deutschsprachigen Raum des 18. Jahrhunderts und im Forschungsschwerpunkt digitale_kultur an der FernUniversität in Hagen.