Innovation in der SRG

Die Medien- und Technologielandschaft verändert sich im Zuge der digitalen Transformation rasch. Um dieser Herausforderung zu begegnen, arbeitet die SRG mit Hochschulen und privaten Medien zusammen – sei es im Rahmen der «Initiative for Media Innovation» der EPFL oder im «Media Technology Center» der ETH Zürich. Auch innerhalb des Unternehmens setzt die SRG auf Innovationsförderung. Diese soll einerseits innovative Projekte in der Frühphase unterstützen und andererseits Personen, Projekte und Ideen unternehmensweit vernetzen.

Unterstützung durch den Inno-Fonds

Innovativ denken und handeln bedeutet unter anderem, für herausfordernde Aufgaben einfachere oder kostengünstigere Lösungen zu finden und die Nutzer:innen mit neuen Ansätzen zu begeistern. Ein wichtiges Instrument ist dabei der Inno-Fonds der SRG, der die Anschubfinanzierung für Prototypen und Experimente leistet. Ziel ist es, interdisziplinäres Denken innerhalb der SRG zu fördern und neue Ideen zu testen.

Der Inno-Fonds unterstützte 2021 unter anderem die Entwicklung des Tools «Smart Multilingual Video», das Video- und Audiobeiträge von der Originalsprache automatisch in andere Sprachen übersetzt. Der Prototyp wurde an den SRG-Hackdays – dem SRG-eigenen Hackathon – im März 2021 entwickelt. Hinter dem Projekt «Smart Multilingual Video» steckt ein Team aus Mitarbeiter:innen von SWISS TXT, dem Multimedia-Kompetenzzentrum der SRG, und von SWI swissinfo.ch, der zehnsprachigen Onlineplattform für Auslandschweizer:innen und an der Schweiz interessierte Ausländer:innen.

Ein intelligenter Übersetzungsdienst

Der an den Hackdays entwickelte Prototyp kann bei einem Videobeitrag automatisch Untertitel generieren und diese in eine andere Sprache übersetzen. Diese Untertiteldateien sind anschliessend auf einem SRG-internen Portal verfügbar. Von dort aus werden sie an einen Sprachsynthesizer-Dienst übergeben, der die Dateien mit einer spontan anmutenden Sprechweise wiedergibt.

Der «Smart Multilingual Video»-Prototyp überzeugte an den Hackdays und landete auf dem dritten Rang. Das Projektteam entschied sich, das Tool weiterzuentwickeln und erhielt dafür finanzielle Unterstützung vom Inno-Fonds.

Vision: mehrsprachig verfügbare Nachrichten auf dem Smart Speaker

Tests mit Nutzer:innen rund um die Welt

Im November 2021 wurde eine Befragung bei Nutzer:innen der SWI-Onlineplattform durchgeführt, die aus 27 verschiedenen Ländern stammen. Das Ziel war zu erforschen, welche Audioinhalte sie nutzen und wie sie dies tun. Daraufhin folgten ausführliche Interviews mit ausgewählten Nutzer:innen, um herauszufinden, wie sie einen SWI-Newsletter bewerten, der mittels künstlicher Intelligenz vorgelesen wird.

In einem nächsten Schritt soll die automatische Übersetzung von gesprochenen Texten in Audio- und Videobeiträgen getestet werden. Später soll der Aufbau eines kompletten Dienstes erfolgen. «Dabei ist uns wichtig, dass wir neben den Nutzer:innen auch die Kolleg:innen in den Unternehmenseinheiten einbinden, um alle Anforderungen an einen solchen Dienst zu verstehen», sagt Robin Ribback, Leiter Innovation bei SWISS TXT. Denn der Dienst soll es den Unternehmenseinheiten dereinst ermöglichen, Audiobeiträge wie etwa Podcasts oder Newsletter in verschiedenen Zielsprachen mittels hochwertiger synthetischer Sprache bereitzustellen.

Künstliche Intelligenz in der SRG

Die nationale Koordinationsgruppe für künstliche Intelligenz wurde Ende 2020 ins Leben gerufen. Massimiliano Babbucci, Vorsitzender der Gruppe, spricht über aktuelle Schwerpunkte und Schwierigkeiten im Bereich der künstlichen Intelligenz.

Massimiliano Babbucci
Koordinator der Gruppe für künstliche Intelligenz in der SRG

Massimiliano, Ende 2020 wurde die nationale Koordinationsgruppe für künstliche Intelligenz gegründet. Weshalb?

Die Gruppe soll im Bereich der künstlichen Intelligenz die Zusammenarbeit zwischen den Unternehmenseinheiten verbessern. Dabei muss sie den Überblick über alle laufenden Projekte im Unternehmen haben. Daraus ergeben sich Chancen für weitere Kooperationen sowie für den gegenseitigen Erfahrungs- und Wissensaustausch.

Was tut sich aktuell bei der SRG im Bereich der künstlichen Intelligenz?

Wir haben mehrere Schwerpunkte: Wir wollen zum Beispiel die natürliche Sprache automatisch verarbeiten oder Metadaten aus Audio- und Videoaufzeichnungen herausfiltern können. Gemeinsam mit mehreren Schweizer Universitäten betreiben wir Forschung zu Avataren, zur Bildoptimierung und zur Herstellung von Clips mit Sport-Highlights.

Welche konkreten Projekte laufen in den Unternehmenseinheiten?

Bei RTS läuft beispielsweise ein Projekt, bei dem Spre­cher:innen in Videos automatisch erkannt werden. Das generiert entsprechende Metadaten und ermöglicht Statistiken, die etwa das Verhältnis von männlichen und weiblichen Protagonist:innen aufzeigen. In einem anderen Projekt werden mittels Audioerkennung automatisch die richtigen Segmente in längeren Videos erkannt und die Timecodes für die Verwendung auf «RTS Play» hinzugefügt. RTS hat darüber hinaus mithilfe künstlicher Intelligenz die Qualitätskontrolle bei der Digitalisierung von Videoarchiven durchgeführt und setzt bei der Archivsuche KI-gestützte Objekt- und Gesichtserkennung ein.

Gibt es weitere nennenswerte Projekte?

SRF führt zurzeit ein Videoanalyse-Projekt durch, welches das Dokumentationsteam bei der Arbeit unterstützen soll. Genauer gesagt werden Standardsequenzen beim Archivierungsprozess automatisch erkannt und die korrekten Metadaten erzeugt. In einem anderen SRF-Projekt, das 2020 erfolgreich abgeschlossen wurde, ging es darum, sämtliche Schweizerdeutschen Dialekte automatisch ins Hochdeutsche zu transkribieren. Dieser Algorithmus entstand in Zusammenarbeit mit der externen Firma Recapp und wurde mittlerweile in die Produktionstools eingebaut.

Welche Rolle spielt künstliche Intelligenz für ein Medienunternehmen wie die SRG?

Durch den Einsatz von künstlicher Intelligenz kann unser Unternehmen seine Produktionsprozesse optimieren und seine Ressourcen verstärkt auf die Produktion von hochwertigen Inhalten konzentrieren. KI unterstützt uns bei der Transformation in ein datenfokussiertes Unternehmen und erlaubt die Entwicklung innovativer Produkte.

Vor welchen Herausforderungen steht die SRG bei der künstlichen Intelligenz?

Die meisten Herausforderungen betreffen die Daten, mit denen die KI-Anwendungen «gefüttert» werden: Stehen die Daten in guter Qualität zur Verfügung? Passen die Modelle zueinander? Sind die Daten intern leicht zugänglich? Dabei geht es einerseits um die internen Standards, andererseits um unsere IT-Infrastruktur.

Zur nationalen Koordinationsgruppe für künstliche Intelligenz gehören neben Massimiliano Babbucci fünf weitere Fachexperten aus den verschiedenen Sprachregionen. Jeder von ihnen ist Fachmann in einem der Bereiche Video, Audio, Text und Recommendation. Die Gruppe wurde auf Antrag des Digital Board geschaffen, um KI-Projekte unternehmensweit nachzuverfolgen und das Digital Board fachlich zu beraten.