Wie man interdisziplinäre Kooperationen zwischen Kommunikationswissenschaft und Informatik gut gestaltet
Katharina Kleinen-von Königslöw, Universität Hamburg
Chris Biemann, Universität Hamburg
In den letzten Jahren haben wir diverse Projektanträge, Strategiepapiere und interdisziplinäre Projekte erfolgreich gestaltet, z. B. eine Online-Codier[Annotations!]plattform zur Verknüpfung von manuellen und automatisierten Inhaltsanalysen verbessert oder Ideen zum Einsatz hybrider Künstlicher Intelligenz zur Erkennung sozialwissenschaftlicher Konzepte in Texten entwickelt. Daraus ergeben sich folgende Überlegungen zur guten Kooperation zwischen Kommunikationswissenschaft (KW) und Informatik.
Die KW braucht die Informatik. Seit ihr Kerngegenstand, die mediale Kommunikation, überwiegend im digitalen Raum stattfindet, fallen kontinuierlich Aufgaben an, für die Informatikkenntnisse nötig sind. Das kann von Servern für Mediendaten und Simulationen, über Programmierschnittstellen oder Scraper, bis zu Programmierung von Nachrichten-Empfehlungssystemen für Experimente oder Machine Learning und neuronale Netzwerke für Inhaltsanalysen reichen. Es geht also nicht nur um Computational Communication Methods, sondern oft darum, „normale“ KW-Forschung zu erleichtern.
Aber braucht die Informatik die KW? Viele dieser Aufgaben sind für die Informatik reine Dienstleistungen, ohne Wert für die eigene Forschung, uninteressant für Drittmittelförderer. Und dennoch kann sich die Kooperation für die Informatik lohnen: Denn wenn die KW Informatik-Methoden zur Beantwortung ihrer eigenen Forschungsfragen anwendet, können dadurch z. B. Anforderungen an Sprachmodelle sichtbar, manuelle Codierungen als Trainingsdaten wiederverwendet werden oder schlicht neue, für die Informatik spannende Problemstellungen entstehen. Aber um das Innovationspotential der KW-Projektideen für ihr Fach einschätzen zu können, braucht es Informatiker*innen, die sich auf die Ideen einlassen und auf dieses Potential abklopfen. Und die bei Bedarf bereit sind, die reinen Dienstleistungsbedarfe der KW im Projekt mit zu adressieren (so wie die eigenen Infrastrukturbedarfe). Oder aber es braucht etwas wie das House of Computing and Data Science der Universität Hamburg, das Forschende bei der Suche nach Kooperationspartner*innen auf Augenhöhe in der Informatik unterstützt, aber auch informationstechnische Dienstleistungen an die Fachwissenschaften vermittelt.
Beide Fächer folgen allerdings unterschiedlichen Logiken, deren sich alle Beteiligten bewusst sein sollten, um Kooperationskonflikte zu vermeiden. Hierzu drei Beispiele:
Anforderungen an die Daten. Die Informatik liebt große, leicht zugängliche Datenmengen; ob diese Daten das Forschungsobjekt der KW aber gut abbilden, ist eher nebensächlich – außer es lassen sich darin für die Informatik relevante Problemstellungen finden. Für die Language Technology, Chrisʼ Forschungsfeld, ist außerdem der reine Text ausreichend, vielleicht noch ergänzt um Metadaten wie Medium, Autor und Rubrik. Für die KW wären aber Informationen zur Platzierung der Texte auf der (Web-)Seite, zu Formatierung und Bebilderung wichtig. Denn ohne diese Informationen können Codierer*innen z. B. journalistische Darstellungsformen nicht mehr so verlässlich wie gewohnt zuordnen.
Zudem ist aus Sicht der KW einer der wichtigsten nächsten Schritte in der Inhaltsanalyse die bessere Integration von Text-, Audio-, Bild- und Videodaten – aber die Expertise hierfür verteilt sich in der Informatik auf unterschiedliche Fachgebiete, mit jeweils eigenen Forschungsinteressen.
Anforderungen an die Datenspeicherung. Die Informatik hat eine stärkere Open-Data-Tradition als die KW und legt viel Wert darauf, die verwendeten Daten zukünftiger Forschung zur Verfügung zu stellen, und sei es in stark vereinfachter Form, um Konflikte mit Urheberrecht und Datenschutz zu vermeiden. Für die KW sind aber z. B. Textdaten, deren Sätze in zufällige Reihenfolge gebracht wurden, uninteressant, da sich die Originalkontexte nicht mehr daraus rekonstruieren lassen. Das hat Auswirkungen darauf, welche Daten in gemeinsamen Projekten genutzt werden können, welche Lizenzvereinbarungen getroffen werden müssen, was später in welcher Form veröffentlicht werden darf oder gelöscht werden muss und natürlich Einfluss auf die Projektkosten.
Anforderung an Tools/Methoden. Im Fokus der Informatik liegt die Entwicklung neuer Tools; die KW ist darauf angewiesen, dass diese gepflegt, auftretende Fehler behoben und die Usability optimiert werden, idealerweise über den Projektzeitraum hinaus. Bei gemeinsamen Projekten muss dies also von Anfang an eingepreist sein. Dafür ist es oft besser, vorhandene Tools weiterzuentwickeln, was nicht immer den Interessen der Informatiker*innen entspricht. Bei den Methoden feilt die Informatik an Algorithmen und Sprachmodellen und feiert jedes Prozent Präzisionsgewinn. Dass ein Modell mit einer Präzision von 51 statt 49 % aus Sicht der KW immer noch unbrauchbar ist, weil es weiterhin fast die Hälfte aller Textstellen „falsch“ codiert, dient dann aber den Projektpartner*innen sicherlich als Ansporn für weitere Modellverbesserungen.