Jakob-Fugger-Zentrum
Italienische Sprachchroniken als Linguistic Linked Open Data
Das Projekt liegt im Überschneidungsbereich von Methoden des Semantic Web und der italienischen Sprachwissenschaft mit Schwerpunkt auf der lexikalischen Semantik und Diskursanalyse. Ziel des Projekts, an dem auch Prof. Christian Chiarcos (Angewandte Computerlinguistik, Universität Augsburg) und Prof. Fabio Rossi (Italienische Sprachwissenschaft, Universität Messina) beteiligt sind, ist die Überführung eines Korpus italienischer Sprachchroniken (CronIT) in Linguistic Linked Open Data (LLOD), um so einen auf der Datensemantik basierenden Zugriff im Web zu etablieren. Der Begriff ‚Sprachchronik‘ bezieht sich auf Rubriken zu sprachbezogenen Themen insbesondere aus der Lexik und Morphosyntax. Diese Artikelserien werden über einen längeren Zeitraum regelmäßig in der Print- und Onlinepresse von Autoren veröffentlicht, denen eine gewisse Autorität in Sprachfragen zuerkannt wird. In Italien sind dies fast ausschließlich renommierte Sprachwissenschaftlerinnen und Sprachwissenschaftler. Angesichts der dauerhaften Bedeutung der Sprachchroniken für die öffentliche Sprachdebatte stellen diese Texte ein nationales Kulturgut dar, das durch das Projekt einem breiten Publikum, etwa für didaktische Zwecke und Fragen der Sprachberatung erstmals online zugänglich gemacht wird. Im Rahmen des Projekts werden folgende Teilziele verfolgt:
-
Ausbau der digitalen Erschließung des Datenmaterials hinsichtlich einer multimedialen Erweiterung durch die Integration von Audio- und Videoformaten;
-
Publikation der Daten in der Linked Open Data Cloud (LOD-Cloud) und Anreicherung der Daten mit semantischen Informationen zur Verknüpfung mit anderen Daten (z.B. Online-Wörterbüchern oder Ontologien);
-
(semi)automatische Annotierung des Textmaterials mittels Few-Shot/Zero Shot Learning Methoden zum Zweck einer Sentiment Analysis im Hinblick auf die epistemische, deontische und evidentielle Markierung der in den Texten behandelten Sprachthemen.