Innovation in der SRG

Die Medien- und Technologielandschaft befindet sich im steten Wandel. Diesem begegnet die SRG, indem sie unternehmensweit Raum für Innovation schafft. Wie kreative Ideen in kurzer Zeit zu disziplinenübergreifenden Projekten mit Zukunftscharakter heranwachsen, zeigen die beiden Projekte «Donate a Sign» und «Metalounge».

Rahel Luder ist Innovationsverantwortliche bei SWISS TXT. Als Kompetenzzentrum für Accessibility Services produziert die Tochtergesellschaft der SRG unter anderem Gebärdensprach­videos für RSI, RTS und SRF sowie für öffentliche Institutionen und Unternehmen. Aktuell widmet sich die 25-jährige Rahel Luder einem Forschungsprojekt zur Gebärdensprachübersetzung. Die Absicht hinter dem Vorhaben erläutert sie so: «Unser langfristiges Ziel ist, den barrierefreien Zugang zu Informationen für Hörbeeinträchtigte auszubauen. Dafür möchten wir künftig auch ein computergesteuertes Übersetzungsmodell nutzen.» Dieses Modell soll Textinhalte auf Websites oder in Applikationen mittels künstlicher Intelligenz (KI) direkt in Form von Gebärdensprachvideos wiedergeben. «Wir wollen geschriebene Texte übersetzen, weil die Gebärdensprache für viele Menschen mit Hörbeeinträchtigung ihre Muttersprache ist», erklärt Rahel Luder. «Geschriebene Texte sind für diese Personen nicht immer problemlos zu verstehen, weil sie sich grammatikalisch von der Gebärdensprache unterscheiden.»

«Soll ein Übersetzungsmodell zuverlässige Resultate liefern, ist ein umfassender Datensatz unerlässlich.»

Rahel Luder
Innovationsverantwortliche bei SWISS TXT
(Bild: SWISS TXT)

Programmiert wird das KI-basierte Übersetzungsmodell von einem Forschungsteam der Universität Zürich, mit dem Rahel Luder und ihre Kolleg:innen zusammenspannen. Damit dieses Modell trainiert werden könne, benötige es eine grosse Menge an Daten, erzählt die Projektleiterin. Diese umfassen zum Beispiel Gestik, Mimik und Gebärden in visueller Form sowie die dazugehörige Übersetzung in Textform. Viele dieser Daten könne SWISS TXT als Produzentin von Gebärdensprachübersetzungen zur Verfügung stellen. Trotzdem sei der bestehende schweizer- und hochdeutsche Gebärdensprachdatensatz noch nicht gross genug: Zum Beispiel fehle der Begriff «Ärztin», da lediglich die Wörter «Arzt» und «Frau» existierten. Auch weniger gebräuchliche Begriffe wie etwa das Wetterphänomen «El Niño» seien nicht vertreten. Genau hier liege das Problem, sagt Rahel Luder: «Soll ein Übersetzungsmodell zuverlässige Resultate liefern, ist ein umfassender Datensatz unerlässlich.»

Wie lässt sich ein digitaler Wortschatz in Gebärdensprache effizient erweitern, ohne dass die Kosten explodieren? Die Bernerin und ihre Kolleg:innen fanden in Form einer App, die Gebärdensprachvideos sammelt, eine Antwort darauf. Ihre Idee meldete Rahel Luder an den SRG-Hackdays 2023 in Zürich an. Dort tüftelte ein interdisziplinäres Team aus Vertreter:innen von verschiedenen SRG-Unternehmenseinheiten, dem auch eine gehörlose Mitarbeiterin sowie ein externer IT-Spezialist angehörten, während zwei Tagen an einem Prototyp. Dieser überzeugte die Jury und belegte den ersten Platz.

Mariana Wirz
Fachspezialistin Angebot und Innovation bei der SRG und Hackdays-Projektleiterin (Bild: Priscilla Moura)

An den SRG-Hackdays arbeiten Soft- und Hardware-Ingenieur:innen, Designer:innen, Journalist:innen und weitere Fachpersonen während 24 Stunden an neuen Produkten und Ansätzen. Dabei befassen sie sich zum Beispiel mit dem Einsatz von künstlicher Intelligenz, sogenannten Customer Bots, oder dem Thema User:innen-Interaktivität. Ihre Ideen lassen sie vor Ort von Nutzer:innen testen und machen daraus einen Prototyp, den sie am Ende der Veranstaltung präsentieren. «Die Hackdays sind für die SRG ein Nährboden für Produktideen», erklärt Mariana Wirz. «Im Laufe der beiden Tage entwickeln sich diese Ideen so weit, dass sie in den Arbeitsalltag verpflanzt und dort weiterwachsen können.» Dabei brauche es für die Umsetzung eines solchen Anlasses gar nicht viel, berichtet die Projektleiterin: «Die wichtigsten Utensilien für die Teilnehmer:innen sind Kaffee, Strom, ein Internetanschluss und Zugang zu Daten.»

Gebärden spenden für mehr Barrierefreiheit

«Wir nennen unsere App ‹Donate a Sign›, zu Deutsch ‹Spende eine Gebärde›», erklärt die Projektleiterin Rahel Luder. Der Name ist Programm: User:innen, welche die Gebärdensprache beherrschen, können einzelne schweizer- und hochdeutsche Gebärden zu vorgegebenen Begriffen per Video aufnehmen und in die App hochladen. Dafür gibt diese verschiedene Themenfelder wie zum Beispiel «Essen», «Städte» oder «Sportarten» mit entsprechenden Unterbegriffen wie etwa «Reis», «Paris» oder «Fussball» vor. Alle hochgeladenen Videos überprüft das Projektteam auf deren Korrektheit und Qualität, bevor es sie offiziell in den Wortschatz integriert.

So funktioniert die «Donate a Sign»-App (Video: SWISS TXT/Louis Amara).

«Die ‹Donate a Sign›-App ist im Grunde genommen Mittel zum Zweck», fasst Rahel Luder zusammen. «Sie soll möglichst viele Gebärdensprachvideos sammeln und damit den bestehenden Datensatz erweitern. Mit diesem füttern wir wiederum das computerbasierte Übersetzungsmodell.» Das langfristige Ziel sei, das Modell im Sinne der Barrierefreiheit auf sämtlichen Websites der SRG einzusetzen, um dadurch dem hörbeeinträchtigten Publikum einen einfachen Zugang zu den digitalen Inhalten zu ermöglichen. Das Modell könne darüber hinaus auch als Hilfsmittel für die Wissenschaft oder öffentliche Dienste von Nutzen sein. Zu Letzteren gehört beispielsweise die staatliche Alarm-App «Alertswiss», die Gefahrenmeldungen künftig auch als Gebärdensprachvideos übermitteln soll. Das fünfköpfige Projektteam steht diesbezüglich bereits in engem Austausch mit dem zuständigen Bundesamt für Bevölkerungsschutz (Babs).

«Wichtig ist uns der kollaborative Gedanke.»

Rahel Luder
Projektleiterin von «Donate a Sign»

Noch ist das Übersetzungsmodell nicht einsatzbereit, da der Datensatz noch unzureichend ist. In einem nächsten Schritt geht es darum, den Prototyp der «Donate a Sign»-App zu optimieren. Rahel Luder: «Wichtig ist uns der kollaborative Gedanke. Damit möglichst viele Menschen Gebärden spenden, haben wir an den SRG-Hackdays festgelegt, dass sämtliche Videos anonymisiert hochgeladen werden können.» Eine virtuelle Maske verdecke bei der Aufnahme das Gesicht. Ebenso achte das Team auf ein benutzerfreundliches und interaktives Design, bei dem User:innen Emojis für die Bewertung einzelner Gebärden verwenden können. Auf längere Frist soll es Nutzer:innen möglich sein, selbst beliebige Gebärden hochzuladen, die dazugehörige Übersetzung zu liefern und Metadaten wie Sprache oder Themenkategorien hinzuzufügen. «Wir bieten die App zunächst in Schweizer- und Hochdeutsch an», so Rahel Luder. «Eines Tages sollen jedoch noch weitere Sprachen wie Französisch und Italienisch hinzukommen.»

Europaweit Synergien nutzen

Für die Weiterentwicklung der Applikation spannen die Forscher:innen unter anderem mit Fachpersonen der Universität Hamburg zusammen, die sich ebenfalls mit Gebärdensprache beschäftigen. Offiziell an den Start gehen soll die «Donate a Sign»-App, die finanziell vom Inno-Fonds der SRG unterstützt wird, im September 2024. Danach will das Projektteam sein Produkt der European Broadcasting Union (EBU) präsentieren. Rahel Luder: «Wir erhoffen uns davon, europaweit Aufmerksamkeit für unser Vorhaben zu gewinnen und Synergien mit anderen Medienveranstalter:innen nutzen zu können.»

Eine App für alle

Und was geschieht mit der App, wenn sie genügend Gebärdensprachvideos gesammelt und ihren Auftrag erfüllt hat? «Sie soll weiterhin von der Öffentlichkeit genutzt werden können», hält die Projektleiterin fest. «In welcher Form können wir aktuell noch nicht sagen.» Das Projektteam denkt beispielsweise darüber nach, seine Applikation in eine Übersetzungs-App umzuprogrammieren. Diese könnte die gesprochene Sprache respektive Lautsprache direkt in Gebärdensprache übersetzen – und umgekehrt.

Willkommen in der «Metalounge»

Flavio Bundi
Seit 2017 Chefredaktor von RTR (Bild: RTR)

Seit Kurzem bietet RTR ihrem Publikum mit der «Metalounge» eine Studioführung der besonderen Art an. Was die Besucher:innen dort erwartet, erklärt Projektleiter und RTR-Chefredaktor Flavio Bundi im Interview.

Flavio, was genau ist die «Metalounge»?

Die «Metalounge» ist eine interaktive Lernerfahrungsplattform, ein neuer und attraktiver Zugang zum RTR-Universum. Einige kennen vielleicht bereits das Metaverse aus der Gaming-Szene – eine 3D-Erfahrungswelt mit Avataren, die man selbst steuern kann. Wir wollten diese Technologie nutzen, um einen Mehrwert für unser Publikum zu schaffen. Dabei soll nicht nur der Spass im Mittelpunkt stehen, sondern auch die Möglichkeit, interaktiv Erfahrungen zu sammeln. Denn in einem Metaverse lassen sich thematische Räume erschaffen, die auf eine bestimmte Zielgruppe zugeschnitten sind. Unser Fokus liegt aktuell auf Schulklassen und Inhalten im Bereich der Medienkompetenz.

Kannst du mehr dazu erzählen?

Wir haben in unserer «Metalounge» fünf thematische Räume für Schulklassen erstellt, zu denen sie exklusiv Zugang haben. Es gibt zum Beispiel einen Raum zum Thema «Fake News», wo sich Schüler:innen mittels Quizfragen, Videos, Audios und weiterer Lernmaterialien intensiv mit der Thematik auseinandersetzen. Ein anderer Raum vermittelt «die Rolle der Medien im politischen System» und in einem dritten Bereich lernen die Jugendlichen, ihre eigenen Medieninhalte zu produzieren – vom Storyboard bis hin zum fertigen Videobeitrag. Auch Vertreter:innen von RTR sind als Avatare vor Ort und stehen bei Fragen oder für Diskussionen zur Verfügung.

«Mit der ‹Metalounge› können wir insbesondere unsere junge Zielgruppe auf einem neuen Weg erreichen.»

Wie bist du auf die Idee einer «Metalounge» gekommen?

Eine zentrale Frage, die mich stets begleitet, ist: Wie lässt sich Wissen einfach, attraktiv und vor allem nachhaltig vermitteln? Für eine RTR-Sendung haben wir mit einer Firma zusammengearbeitet, die auch 360-Grad-Videoproduktionen anbietet. Im Gespräch über die digitale Welt und ihre Möglichkeiten sind wir beim Metaverse und seinen Möglichkeiten gelandet. Mit der «Metalounge» können wir insbesondere unsere junge Zielgruppe auf einem neuen Weg erreichen und ihr ermöglichen, Inhalte im digitalen Raum mitzugestalten und ihre Kompetenzen einzubringen – auf dem Terrain, wo sie sich zuhause fühlt.

Wie wurde aus deiner Idee schliesslich eine virtuelle Studiolounge? 

Als ich die Idee meinen Kolleg:innen der RTR-Geschäftsleitung präsentiert habe, waren sie begeistert. Nach kurzer Diskussion haben wir uns dazu entschieden, einen Versuch zu starten. Wir bildeten ein dreiköpfiges Projektteam, bestehend aus einem Verantwortlichen der Produktionsfirma, welche die Metaverse-Technologie zur Verfügung stellt, einem Medienpädagogen von RTR und mir. Innerhalb von nur zwei Monaten existierte ein erster Prototyp. Zeitgleich arbeiteten wir daran, mit RTR Intermedia einen digitalen Bildungs-Hub zu schaffen, auf dem wir Schulen unterschiedliche Lernmaterialien zur Verfügung stellen. Die «Metalounge» ist ein Teil dieses Hubs.

«Der persönliche Dialog lässt sich nicht ersetzen, und das ist gut so.»

Wird die «Metalounge» künftig die Studioführungen bei RTR ersetzen?

Auf keinen Fall. Mir ist wichtig festzuhalten, dass die «Metalounge» den direkten Austausch mit unserem Publikum ergänzt. Deshalb besuchen wir weiterhin Schulklassen für Einzellektionen, tageweise oder sogar für ganze Projektwochen. Unsere klassischen Studioführungen finden ebenfalls weiterhin statt. Der persönliche Dialog lässt sich nicht ersetzen, und das ist gut so.

Wo steht das Projekt «Metalounge» heute und wie geht es weiter?

Seit Anfang Januar 2024 ist die «Metalounge» online und für die Öffentlichkeit zugänglich. Erste Tests haben gezeigt, dass sie bei der jungen Zielgruppe gut ankommt. Beispielsweise hat uns eine Schule angefragt, ob sie einen persönlichen, virtuellen Klassenraum in unserer «Metalounge» einrichten darf. Künftig möchten wir die Themenpalette noch erweitern. Hierfür sind unsere Kooperationen mit «Easyvote» sowie der Fachhochschule und der Pädagogischen Hochschule Graubünden wertvoll. Hoffentlich dürfen wir eines Tages sogar Virtual-Reality-Brillen oder VR-Handschuhe einsetzen. Mit diesen könnten die Jugendlichen quasi selbst am Radiopult stehen oder Regie bei einer TV-Sendung führen. Das Tolle an der «Metalounge» ist ja, dass wir sie beliebig aus- und umbauen können. Es sind uns also fast keine Grenzen gesetzt.