Barrierefreie Video- und Audio-Inhalte – Multimedia für alle

Sie möchten Ihre Audio- und Video-Clips barrierefrei anbieten? Dann erfahren Sie hier, wie es geht. Hier geht es zum Podcast zur digitalen Barrierefreiheit.
Die rechtlichen Anforderungen an multimediale Inhalte finden Sie in der WCAG 2.1 unter der Guideline „1.2 Time-based Media“. An dieser Stelle beschäftigen wir uns mit Best Practices

Anforderungen aus der WCAG

Die WCAG hat klare Anforderungen:
Für Videos ohne Sprache oder mit geringem Sprach-Anteil muss eine Audiodeskription oder ein Text-Transkript bereitgestellt werden. Haben Sie ein kurzes Instagram-Video, in welchem eine Person interviewt wird, können Sie die visuellen Aspekte auch kurz im zugehörigen Text zum Video beschreiben und auf eine Audio-Beschreibung verzichten. Selbiges gilt, wenn eine Person alle relevanten visuellen Aspekte verbal beschreibt.
Für Videos mit Sprache müssen Untertitel oder ein Transkript bereitgestellt werden. Bei Videos ohne Sprache sollte über den Begleittext klar werden, dass nicht gesprochen wird. Wenn keine Sprecherinnen zu sehen sind weiß die Gehörlose nicht, dass akkustisch nichts Relevantes passiert.
Transkripte müssen adäquat sein, also den Inhalt des Audio- oder Video-Inahlts möglichst so beschreiben, dass möglichst keine Informationen verloren gehen.

Best-mögliche Aufnahme-Qualität

Generell ist die bestmögliche Aufnahmequalität anzustreben. „Quick and dirty“ produzierte Inhalte können sehr problematisch sein. Mit dem Smartphone aufgenommene Audio- und Video-Inhalte können teils schwer verständlich und erkennbar sein. Unbearbeitete Fotos sind schwierig, da das Bild-Objekt häufig schwer zu identifizieren ist. Versuchen Sie deshalb, die Inhalte möglichst in der bestmöglichen Qualität anzubieten. Am besten sind dedizierte Studios, die eine gute Bild- und Ton-Qualität gewährleisten. Suchen Sie sich eine möglichst ruhige Ecke, wenn Sie ein Interview im Freien durchführen wollen. Verwenden Sie das bestmögliche Equipment wie eine dedizierte Videokamera oder ein externes Mikrofon. Vermeiden Sie geringe Kontraste wie etwa eine hell gekleidete Person vor einer hellen Hauswand. Vermeiden Sie laute Nebengeräusche wie Verkehrslärm, aber auch das Brummen von Klimaanlagen und ähnlichem.
Schon bei der Konzeption und der Aufnahme sollte eine gute Qualität sichergestellt werden. Zwar lässt sich viel in der Postproduktion
korrigieren. Allerdings ist das unnötige Mehrarbeit und es kann auch nicht alles verbessert werden.
Außerdem bieten auch die Smartphones bereits einige Möglichkeiten der Bearbeitung. Verzichten Sie in jedem Fall auf Effekte und Filter schon bei der Aufnahme, sie tragen selten zur Erkennbarkeit bei und können in der Post-Produktion besser angewendet werden.

Barrierefreier Mediapleyer

Das A und O ist ein barrierefreier Media Player. Er sollte vollständig per Tastatur bedienbar sein. Die Bedienelemente sollten groß und gut erkennbar sein. Zu- und abschaltbare Untertitel und Audio-Deskription sollten möglichst unterstützt werden. Es ist auch immer sinnvoll, den Inhalt zum Download in einem gängigen Format wie MP3, OGG, MPEG oder AVI bereitzustellen.
Ein Beispiel dafür ist der Videoplayer der Aktion Mensch: Dort können AudioDeskription, Untertitel und Gebärdensprache zu- und abgeschaltet werden. Eine Alternative ist der Able Player.

Audio-Inhalte

Wenn Sie Podcasts oder andere Audio-Inhalte anbieten, sollten auch diese natürlich möglichst zugänglich sein. Verwenden Sie die best-mögliche Audio-Qualität. Das hilft vor allem Schwerhörigen. Für sie sind laute Nebengeräusche und Rauschen störend. Schwierig ist auch, wenn unterschiedliche Sprecher unterschiedlich laut sind. Schwerhörige müssen bei jedem Sprecherwechsel die Lautstärke regeln. Für Audio- und Video-Inhalte möchte ich Ihnen empfehlen, ein Text-Transkript zu erstellen. Ein Transkript ist eine vollständige Verschriftlichung der gesprochenen Inhalte.

Videos

Auch bei Videos sollten Sie auf eine optimale Erkennbarkeit und Verständlichkeit des Gesprochenen achten. Zwar werden heute auch eher amateurhafte Aufnahmen vor allem in Social Media akzeptiert. Aber Hör- und Sehbehinderte haben es schwer, solche Inhalte wahrzunehmen. Bedenken Sie dabei auch, dass solche Inhalte häufig auf Smartphones mit eher mittelmäßigen Displays und Lautsprechern und häufig auch unterwegs in lauten und visuell nicht optimalen Umgebungen konsumiert werden.
Plötzliche Änderungen der Sound-Lautstärke oder der Beleuchtung sind für die genannten Gruppen ebenfalls nicht optimal. Sie sollten möglichst gering gehalten werden.
Sprecher sollten sich möglichst der Kamera zuwenden. So gibt es neben dem Ton einen weiteren Kanal, über den sie verstanden werden können. Aus Lippenbewegungen und Körpersprache kann bis zu 30 Prozent Information abgeleitet werden.

Text-Transkript

Ein Text-Transkript ist eine vollständige Verschriftlichung gesprochener Inhalte. Das ist viel Fleiß-Arbeit. Doch bietet es viele Vorteile:

  • Es macht die Inhalte für Gehörlose und stark Schwerhörige zugänglich, welche die Alltagssprache verstehen.
  • Es erhöht dem Komfort. „Nachlesen“ ist leichter als „Nachhören“.
  • Sie haben zusätzliche Inhalte für Ihre Website, die von Google besser indiziert werden können und Ihnen deshalb mehr Besucher bringen. Google hört und schaut sich keine Inhalte an. Aber Google kann Text indizieren.

Text-Transkripte bieten sich im Wesentlichen für sprachlastige Inhalte an. Bei Hörspielen oder actions-lastigen Videos müssten Sie auch Szenarien beschreiben, womit aus dem Transkript schon fast ein Drehbuch wird.

Untertitel

Für gehörlose und schwerhörige Menschen sollten in Videos Untertitel untergebracht werden. In Untertiteln wird das Gesprochene verschriftlicht, außerdem werden wichtige Geräusche vermittelt, die zum Verständnis des Clips wichtig sind.
Untertitel haben weitere Vorteile: Auch sie können von YouTube und damit von Google indiziert werden. Somit werden Ihre Video-Inhalte besser gefunden. Außerdem können Untertitel zum Beispiel nützlich sein, wenn ein Sprecher schwer verständlich ist, zum Beispiel wegen einem Dialekt oder Sprachfehler. Nebenbei kann sich auch jemand das Video anschauen, wenn er keine Lautsprecher oder Kopfhörer zur Verfügung hat. Studien zeigen, dass Untertitel vor allem von Hörenden verwendet werden, weil sie den Sound in ihrer aktuellen Situation nicht hören wollen oder können.
Es gibt offene und geschlossene Untertitel (Open und Closed Captions). Closed Captions können ein- bzw. ausgeblendet werden und sind deshalb vorzuziehen.
Verschiedene Tools erleichtern die Erstellung von Untertiteln. In YouTube können Untertitel erstellt und für andere Anwendungen wie Facebook exportiert werden. Die automatische Untertitelung von YouTube ist derzeit nicht praxistauglich.
Ein kostenloses Programm zum Erstellen ist Subtitle Edit. Die meisten professionellen Video-Editoren haben aber bereits eine Lösung dafür integriert.
Fragen Sie nach Möglichkeit einen Gehörlosen, ob die Untertitel so ausreichend sind. Steht Ihnen kein Gehörloser zur Verfügung, schauen Sie sich das Video mit Ihren Untertiteln und ohne Ton an. Können Sie verstehen, worum es geht? Besser ist es, wenn Sie einen am Video unbeteiligten Kollegen bitten, die Prüfung vorzunehmen. Da Sie das Video schon kennen, sind Sie nicht wirklich objektiv.

Audiodeskription

Die Audiodeskription (AD) ist eine Beschreibung von visuellen Video-Inhalten für blinde und sehbehinderte Menschen. Sie ist vor allem für Videos mit geringem Sprachanteil wichtig, da Blinde sonst nicht verstehen, worum es in dem Film geht. Für sprach-lastige Videos ist sie verzichtbar.
In der Regel wird die AD von spezialisierten Agenturen produziert. Das ist relativ teuer. Neben der eigentlichen Video-Produktion wird auch ein Sprecher benötigt, der die Inhalte einspricht. So kann die AD schon für bereits relativ kurze Clips mehrere tausend Euro kosten.
Die AD lässt sich relativ leicht selbst erstellen. In der Regel wird eine zweite Tonspur neben der Originaltonspur des Filmes angelegt. Die Texte werden eingesprochen und anschließend mit dem Film synchronisiert.
Hören Sie sich zunächst den Film ohne Bild an, welche visuellen Infos sind für Nicht-Sehende wichtig? Achten Sie darauf, dass für die Beschreibung nur die Teile des Films genutzt werden können, in denen nicht gesprochen wird. Gegebenenfalls sollten Sie schon bei der Konzeption des Filmes entsprechende Pausen einplanen.
Die Tonqualität der AD sollte der Tonqualität des Films entsprechen, also keine verrauschten Aufnahmen mit schlechten Mikrofonen, wenn der Film nicht die gleiche Qualität hat.
Fragen Sie nach Möglichkeit einen Blinden, ob er den Film mit AD versteht. Steht Ihnen kein Blinder zur Verfügung, schauen Sie sich das Video mit AD ohne Bild an und prüfen Sie, ob die AD ausreichend ist. Auch hier gilt wie bei Untertiteln auch: Bitten Sie einen unbeteiligten Kollegen um die Sichtung des Filmes. Er kann die Qualität der AD objektiver beurteilen.
Eine Alternative zu einer zeitaufwendigen AD besteht darin, die wesentlichen visuellen Infos in die Moderation einzubauen. Ein Vorteil besteht darin, dass diese Infos auch Sehbehinderten zugutekommen, die normalerweise keine AD nutzen. Überlegen Sie, welche visuellen Informationen besonders wichtig sind und bauen Sie diese in den Moderationstext ein.
Derzeit unterstützen weder Facebook noch YouTube die Zu- und Abschaltung von Audiodeskription, Sie werden also in der Regel zwei Versionen hochladen müssen, einmal mit und ohne AD.
Aus dem Videotitel sollte hervorgehen, das eine Audiodeskription enthalten ist: „Mein schönstes Urlaubsvideo“ für den Clip ohne AD und „Mein schönstes Urlaubsvideo mit Audiodeskription“. Anleitung zur Erstellung einer AudioDeskription.

Gebärdensprache

Bei Gebärdensprache gibt es zwei Möglichkeiten: Sie können zu einem konventionellen Video eine Gebärdensprach-Version erstellen. Der Avatar wird dann neben bzw. als Overlay im Video dem Video eingeblendet. Zeichnen Sie hingegen eine Veranstaltung auf, bei der eine Gebärdensprach-Dolmetscherin mit auf der Bühne steht, sollte sie – natürlich nur mit seinem Einverständnis – mit aufgezeichnet werden. Theoretisch wäre es denkbar, die Gebärdensprachdolmetscherin und die Veranstaltung separat aufzunehmen und das Ganze in der Post-Produktion zu synchronisieren. Das hätte den Vorteil, dass der Gebärdensprachdolmetscherinnen besser zu erkennen ist. Außerdem werden Autisten und Ablenkungsanfällige Personen nicht durch den Dolmetscher irritiert. Ob das realistisch ist, kann ich allerdings nicht einschätzen.
Für Inhalte in Gebärdensprache gelten besondere Anforderungen, damit die Gebärdenden möglichst gut erkennbar sind, zum Beispiel soll ein heller Hintergrund und ein guter Blickwinkel verwendet werden.
Für konventionelle Videos, bei denen eine Gebärdensprach-Version produziert werden soll. Hier gilt ähnliches wie für die AudioDeskription: Die nicht zum Film gehörenden Bewegungen können Autisten oder Personen mit Konzentrationsstörungen ablenken. Sie sollten also entweder zu- und abschaltbar sein – siehe den Aktion-Mensch-Player – oder es sollte ein Video mit und ohne Gebärdensprache geben, was am Titel eindeutig kenntlich gemacht wird. Beim IT-Beauftragten der Bundesregierung finden Sie einen Leitfaden und eine Musterausschreibung für Gebärdensprache verlinkt.

Leichte Sprache in Videos

Das Thema verständliche Sprache in Multimedia ist sehr komplex. Natürlich kann man die Beteiligten dazu anhalten, möglichst verständlich zu sprechen. Sind sie darin aber nicht erfahren oder geschult, verfallen sie schnell wieder in alte Sprech-Gewohnheiten. Zwar stehen im Film zusätzliche Kommunikations-Ebenen wie Körpersprache und Kontext zur Verfügung. Dennoch dürfte ein konventioneller Film eine Herausforderung für lernbehinderte Personen sein.
Auch hier können Sie bereits bei der Konzeption des Filmes darauf achten. Handelt es sich um ein geskriptetes Format, können möglichst verständliche Sprechertexte mit wenig Fachjargon und ohne Verschachtelungen vorgesehen werden. Inhalte in Leichter Sprache habe ich bisher nur bei der Arbeitsgemeinschaft Behinderung und Medien gesehen.

Zeit- und Kostenplanung

Planen Sie einen barrierefreien Filrm, fallen zusätzliche Kosten an.
Meine Empfehlung ist, dass sich wenn regelmäßig solche Filme entstehen zwei bis drei Personen inhouse darauf spezialisieren, diese Filme barrierefrei zu machen. Setzt man alle Möglichkeiten konsequent um, kann man bei externer Beauftragung von Kosten von ca. 1000 € pro Filmminute ausgehen. Das gilt für kurze Filme, bei längeren Clips dürften die Kosten pro Minute etwas geringer werden.
Untertitel und AudioDeskription lassen sich meiner Meinung nach gut inhouse erledigen. Falls Sie keine Gebärdensprach-kundige Person im Haus haben, werden Sie die Übertragung in Gebärdensprache allerdings extern beauftragen müssen.
Insbesondere für AudioDeskription und Gebärdensprache sollten Sie viel zusätzliche Zeit einplanen. Gerade Gebärdensprach-Dolmetscherinnen sind schwer zu bekommen. Fragen Sie am besten schon bei der Einholung von Angeboten an, wie viel Zeit für die Bearbeitung benötigt wird. Erfahrungsgemäß sollten Sie für kurze Clips bereits 10 Werktage einplanen, für längere Videos lässt sich keine Aussage treffen, das hängt von der Auslastung des jeweiligen Dienstleisters ab.

Automatische Transkription

Speech to Text ist eine der sich am schnellsten weiter entwickelnden Technologien. Das bietet sich an für die Erstellung von Text-Transkripten sowie für Untertitel für Videos. Die Qualität ist bereits recht gut. Allerdings ist eine manuelle Nachbearbeitung bis auf Weiteres unabdingbar. Dialekte, Eigen-Begriffe und exotische Namen überfordern die TTS.
Die Anschaffung entsprechender Software lohnt sich nur, wenn Sie regelmäßig Inhalte transkribieren müssen. Wenn Sie ohnehin einen Dienstleister beauftragen, wird dieser weit häufiger Inhalte übertragen müssen, deshalb lohnt es sich für ihn, so eine Software anzuschaffen.

Weitere Infos