Texte für auttomatische Verständlich-Machung optimieren

Die automatische Übertragung von Texten in andere Formate wird in Zukunft immer wichtiger werden: Damit sind sowohl die automatischen Übersetzungen in Fremdsprachen, aber auch die Übertragung in verständliche Formate wie einfache oder Leichte Sprache gemeint. In diesem Text soll es darum gehen, wie man Texte von vorneherein so gestalten kann, dass sie besser automatisch übertragen werden können. Im Folgenden spreche ich von verständlicher Sprache und meine sowohl einfache als auch Leichte Sprache.

Inhalt

Warum ist automatische Verständlich-Machung die Zukunft??

Die automatische Übertragung in verständliche Formate ist die Zukunft. So sehr ich die Arbeit der Verständlichkeits-Kolleginnen schätze und ihre Argumente korrekt finde – aus meiner Sicht gibt es keine Alternative. Oft wird argumentiert, dass nur Menschen Texte verstehen können – korrekt – und sie somit alleine im Stande sind, gute und ansprechende Übertragungen anzufertigen – falsch. KIs müssen aufgrund ihrer Arbeitsweise die Texte nicht in dem Sinne verstehen, wie Menschen sie verstehen. Das sieht man an den sehr guten Zusammenfassungen, die sie heute bereits erstellen können.

Das andere häufig vorgebrachte Argument, dass KIs stilistische Eigenheiten entfernen würden, finde ich nicht schlimm. Die wenigsten Informations-Texte werden wegen ihrem Stil gelesen. Wie reden in der Regel von Texten aus Verwaltung, Gesundheit oder Verbraucherschutz, da ist bei bestem Willen keine persönliche Handschrift zu erkennen oder relevant.

Die Fachleute haben nicht die Fähigkeit, Texte verständlich zu schreiben. Ihnen fehlt sowohl die Zeit als auch die Möglichkeit, Erfahrungen in diesem Bereich zu sammeln. Deshalb sind auch Schulungen für Berufe, die nicht professionell schreiben aus meiner Sicht nicht sinnvoll.

Die Übertragung durch Verständlichkeits-Profis ist teuer und zeitaufwendig, wenn man bedenkt, dass oft zwei bis drei Durchläufe bis zur Finalisierung notwendig sind. Wenn es zum Beispiel speziell trainierte Modelle für den Gesundheits-Bereich gibt, können die Fach-Expertinnen das tun, was sie gut können: Die automatischen Übertragungen auf inhaltliche Korrektheit überprüfen. Wenige wissen, dass es um einzelne Bereiche herum spezielle Startups gibt: Health Tech habe ich in meinem aktuellen Job kennengelernt, Legal Tech kenne ich aus meiner Arbeit für den Behinderten-Sektor.

Es gibt einen Grund-Widerspruch der Verständlichkeit, der unlösbar ist: Es gibt nicht die perfekte Form. Wer eine Lernbehinderung hat, braucht nicht unbedingt Leichte Sprache, ebenso wenig wie eine Person mit Migrations-Hintergrund. Analphabetinnen brauchen nicht unbedingt die Formen verständlicher Sprache, die wir ihnen anbieten würden. Jede Person sollte im Idealfall genau das Format bekommen, welches sie in dem Moment benötigt und genau die Informationen, die sie gerade benötigt bzw. haben möchte und nicht irgendwas, was wir ihr einfach vorsetzen. Es ist aber von Anbieterinnen-Seite unmöglich, Texte in mehreren Formaten anzubieten.

Ein weiteres Problem, über das sich die Verständlichkeits-Profis ausschweigen: Während sich bei Fremdsprachen Spezialistinnen etabliert haben, ist das bei verständlicher Sprache in der Regel nicht der Fall. Es gibt Übersetzende, die Texte aus der Medizin oder dem Rechts-Bereich übersetzen. In der verständlichen Sprache gibt es das meines Wissens nicht. Hier glaubt man, jede könne alles verständlich machen. Natürlich gibt es Unterschiede zwischen Übersetzung in Andere Sprachen und verständliche Formate. Aber in beiden Fällen muss man 1. verstehen, was das Original sagt und 2. inhaltlich korrekt übertragen können. Hinzu kommt, dass man oft Kontext hinzufügen muss, um es verständlicher zu machen. Zum Beispiel muss man manchmal erklären, was Insulin im Körper macht. Man schaue sich einfach den Unsinn an, den medizinische Laien als Influencer in ihren verschiedenen Formaten verbreiten, um zu verstehen, dass wir das ohne entsprechende Expertise nicht leisten können. KIs können das aufgrund ihrer Arbeitsweise besser als jeder Laie. Wie oben gesagt würde ich dafür speziell trainierte Modelle verwenden, die also keinen Quatsch erfinden oder Unsinn von Laien kopieren.

Eine nahe Zukunft

Es gibt Schreib-Assistenzen in Software-Form, die bereits verständliche Texte generieren können. ChatGPT ist bereits recht gut, aber spezielle Software zum Schreiben oder speziell trainierte Modelle für die Übersetzung können deutlich mehr leisten. Ich denke, dass es bald einfach nutzbare Tools geben wird, die verständliche Texte automatisch erzeugen oder bei der Optimierung unterstützen.

Das Language-Tool, der Microsoft Editor oder der DeepL-Schreib-Assistent gehen in diese Richtung,, sind aber noch sehr oberflächlich. Dinge wie die Länge von Sätzen, Wörtern oder Absätzen ließen sich heute schon gut automatisch optimieren. Ich glaube, dass diese Tools Verbesserungs-Vorschläge machen werden, ähnlich wie die heutigen rechtschreib-Prüfungen, die man dann annehmen oder ablehnen kann. Eventuell lernen sie danach und ach spezifisch für die Organisation oder die schreibende Person dazu und werden mit der Zeit immer besser. So werden auch Nicht-Expertinnen in die Lage versetzt, einfacher verständliche Texte zu schreiben.

In vielen bereichen reden wir ohnehin von stark standardisierten Texten. Wenn jemand zum Beispiel Diabetes hat, denkt sich die Ärztin nicht eine komplett neue Strategie aus, sondern passt vorhandene Behandlungs-Methoden oder Medikamente auf die Patientin an. Sie arbeiten also wahrscheinlich ohnehin mit Text-Bausteinen, welche schon vorher verständlich gemacht werden könnten. Die Bausteine werden dann einfach zusammengeklickt und der Patientin ausgehändigt.

Warum soll man vorher schon Texte optimieren, wenn die Software das übernimmt?

Weil man hinterher Arbeit beim Proof Reading spart. Für die Software ist das Chunking, also das Zerlegen der Informationen in kleine Häppchen besonders wichtig. Text-Strukturen wie Listen und Überschriften erleichtern das Erkennen wichtiger Informationen. Band-Wurm-Sätze oder lange Komposita erschweren der Software die Analyse.

Ich kann mir zwei parallele Szenarien vorstellen: Wir stellen bereits verständliche Formate zur Verfügung. Oder die Software des Clients überträgt automatisch in verständliche Formate, so wie man heute schon im Browser einstellen kann, dass er alle aufgerufenen Seiten in die Muttersprache überträgt. Dafür ist eine gute Text-Struktur wichtig.

Texte für automatische Übertragungen optimieren

Die folgenden Regeln erscheinen mir für diesen Zweck sinnvoll.

Einfache und klare Sprache verwenden
Vermeide komplexe Satzstrukturen: Nutze kurze und prägnante Sätze. Vermeide Schachtelsätze und unnötige Nebensätze.
Verwende eindeutige Begriffe: Wähle klare und unmissverständliche Wörter. Vermeide Synonyme und Fachjargon, wenn möglich.

Konsistenz im Vokabular
Einheitliche Terminologie: Nutze für denselben Begriff stets das gleiche Wort, um Verwirrung zu vermeiden.
Begriffserklärungen bereitstellen: Bei unvermeidbarem Fachjargon sollte eine klare Definition bereitgestellt werden.

Korrekte Grammatik und Interpunktion
Achte auf Grammatik und Rechtschreibung: Fehlerhafte Sätze können vom Übersetzungstool falsch interpretiert werden.
Verwende standardisierte Satzzeichen: Nutze gängige Interpunktion und verzichte auf ungewöhnliche Satzzeichen, die die Übersetzung verfälschen könnten.

Klare Struktur des Textes
Absätze und Überschriften: Nutze Absätze, Überschriften und Listen, um den Text logisch und übersichtlich zu gliedern.
Chronologische Reihenfolge: Ordne Informationen in einer logischen Reihenfolge, um Missverständnisse zu vermeiden.

Einfache Satzkonstruktionen
Subjekt-Verb-Objekt-Struktur: Verwende die einfache Satzstruktur Subjekt-Verb-Objekt, um die Verständlichkeit zu erhöhen.
Aktiv statt Passiv: Nutze bevorzugt den aktiv statt den Passiv, da aktive Sätze in vielen Sprachen direkter und einfacher zu übersetzen sind.

Vermeidung von Mehrdeutigkeit
Klare Pronomen-Verwendung: Vermeide unnötige Pronomen oder stelle sicher, dass der Bezug des Pronomens eindeutig ist.
Eindeutige Verbindungen: Verwende klare Verbindungen zwischen Sätzen, wie „weil“, „daher“, „also“, um den Zusammenhang deutlich zu machen.

Verzicht auf Slang und Umgangssprache
Formale Sprache: Nutze eine formale und neutrale Sprache, da Umgangssprache oft schwer verständlich ist und bei der Übersetzung problematisch sein kann.
Vermeide literarische Sprache und Metaphern
Literarische Sprache, also Sprache, die vom Lesenden interpretiert werden muss sollte vermieden werden. Metaphern können von KIs oft nicht korrekt interpretiert werden.

Technische Hinweise
Zahlen und Maßeinheiten: Schreibe Zahlen und Maßeinheiten aus oder verwende international verständliche Formate.
Vermeide Abkürzungen: Falls Abkürzungen notwendig sind, erkläre sie beim ersten Auftreten.

Überprüfung und Tests
Die Überprüfung auf inhaltliche Korrektheit durch eine geeignete Person wird bis auf Weiteres notwendig bleiben. Wir alle kennen das Problem von halluzinierende KIs. Wenn sie etwas nicht wissen, denken sie sich oft etwas aus, was plausibel klingt. Das kann nur eine Fachperson beurteilen.

Was kann automatisiert werden, was nicht?

Es gibt zwei Bereiche, die besonders spannend sind: Das Anwenden automatisierter Regeln: Satzlänge, Wortlänge und ein paar andere Regeln können voll automatisch geprüft werden. Und das automatisierte Übertragen.

Was bislang nicht funktioniert – soweit mir bekannt – ist die automatische Neu-Strukturierung von geschriebenen Texten. Es ist häufig der Fall, dass Texte schlecht strukturiert sind. Auch wenn es manchmal so aussieht: KIs verstehen unsere Texte nicht und werden dies auf absehbare Zeit nicht tun. Folgendes schreibt ChatGPT dazu, wie es Texte zusammenfasst:

1. Verstehen der Bedeutung:
Wortbedeutung und Kontext: Eine KI analysiert die Bedeutung der einzelnen Wörter im Kontext, in dem sie vorkommen. Zum Beispiel kann sie erkennen, dass das Wort „Bank“ in verschiedenen Kontexten unterschiedliche Bedeutungen hat (z.B. als Finanzinstitut oder als Sitzgelegenheit).
Semantische Rollen: Die KI versucht zu verstehen, wer was tut. Wenn in einem Satz steht „Die Katze jagt die Maus“, dann weiß die KI, dass die Katze die Aktion ausführt und die Maus das Ziel ist.
2. Identifizieren von Hauptthemen:
Wortfrequenz: Häufig verwendete Wörter oder Phrasen in einem Text weisen oft auf wichtige Themen hin.
Positionsbasierte Hinweise: Informationen, die am Anfang oder Ende eines Textes stehen, sind oft wichtig. Dies wird besonders bei Nachrichtenartikeln oder wissenschaftlichen Texten genutzt.
Titel und Überschriften: Diese geben oft einen klaren Hinweis auf die Hauptthemen.
3. Erkennen von Zusammenhängen und Prioritäten:
Kohärenz und Zusammenhänge: Die KI analysiert, wie verschiedene Teile des Textes miteinander in Verbindung stehen, um herauszufinden, was für das Gesamtverständnis wichtig ist.
Redundanz vermeiden: Die KI versucht, ähnliche oder wiederholte Informationen zusammenzufassen und nur die neuen oder wichtigsten Punkte zu betonen.

Wie schon öfter festgestellt scheitern KIs vollständig an Literatur und Lyrik. Auch verstehen KIs Anspielungen nicht, diese lassen sich deshalb automatisch weder verständlicher noch in eine andere Sprache übersetzen. Auch wenn es eine Metapher 1:1 in einer anderen Sprache gibt heißt das nicht, dass sie die gleiche Bedeutung hat.

KIs scheitern an Kontexten, weil sie Texte zerlegen. Wenn Person X auf Seite 10 halbwegs sinnvoll eingeführt wird und auf Seite 23 wieder aufgegriffen wird, werden die meisten Menschen sich an diese Person erinnern. Die KI wird das eventuell nicht tun.

KIs können nur eingeschränkt Texte auf bestimmte Zielgruppen optimieren. Für diesen Zweck müssten sie entweder genaue Anweisungen bekommen oder auf die Zielgruppe trainiert werden.

Lassen Sie mich das klarstellen: KIs verstehen nicht, was wir ihnen sagen, was sie selbst ausgeben oder sonst irgendwas. Es sind statistische Modelle, die mit zahllosen Daten trainiert wurden. Mir persönlich ist das egal, wichtig ist, was hinten rauskommt. Seien wir mal ehrlich: Wir haben vorher nicht verstanden, was unsere Software tut, und wir werden es immer weniger verstehen und es kann uns auch egal sein, ebenso wie uns die chemischen und physikalischen Reaktionen beim Kochen interessieren, solange es gelingt und schmeckt. Bezogen auf unser Thema heißt das, dass wir uns der Möglichkeiten und Grenzen der KI bewusst sein müssen. Es wäre ein Fehler, alles der KI zu überlassen, ohne es zu prüfen. Es wäre aber ein ebenso großer Fehler, gar nichts zu machen.

Fazit

Sollten wir trotz all dieser Schwächen Schreib-Assistenzen verwenden? Meine klare Antwort ist ja. Betrachten Sie Assistenten als Werkzeuge. Sie können Texte mit der Hand, auf der Schreibmaschine oder im Text-Editor schreiben, aber Sie tun es in der Regel in einer Text-Verarbeitung. Ein Assistent ist ebenso ein Werkzeug, ob KI draufsteht oder nicht ist erst Mal egal. Sie benutzen vermutlich auch die Rechtschreib-Prüfung, die auch nicht perfekt ist.

Fakt ist, dass wir niemals zu dem Punkt kommen werden, an dem wir mit den manuellen Methoden von gestern auch nur einen relevanten Teil unserer Texte in verständliche Sprache umwandeln können. Uns fehlen die Leute, das Geld und die Zeit

Die Zukunft der automatischen Übertragung von Sprache in verständliche Formate ist offen. Ich bin mir aber relativ sicher, dass es in einer nicht allzu fernen Zukunft möglich sein wird, bevorzugte Verständlichkeits-Grade für automatische Übersetzungen in verständliche Sprache entweder im Betriebssystem oder im Browser einzustellen, so wie wir heute Deutsch als Muttersprache definieren können und mehr oder weniger gelungene automatische Übersetzungen aus Fremdsprachen erhalten. Diese Einstellungen bieten heute bereits Edge oder Chrome kostenlos und mit geringer Zeitverzögerung. Auch Firefox bietet eine automatische Übersetzung, die von der Qualität aber eher an die späten 90er erinnert.

Warum ist es wichtig, dass das clientseitig passiert? Es gibt eine nutzerinnen-orientierte Antwort: Die Leute sollen selbst entscheiden können, was sie verständlich haben wollen und nicht vom Good Will der Anbietenden abhängig sein. Und das rechtliche Argument: Wenn wir Texte im Web veröffentlichen, sind wir für deren Inhalt verantwortlich, auch wenn sie automatisch in irgendwas übertragen werden, sofern wir diesen Übertragungs-Dienst bereitstellen. Wenn die Nutzerin hingegen ein Tool verwendet, ist sie dafür verantwortlich, die Korrektheit der Übertragung zu überprüfen. Das klingt so, als ob ich die Verantwortung übertragen wollen würde. Aus meiner Sicht geht es aber nicht anders. Ich kann nicht mehrere Versionen bereitstellen und darauf setzen, dass der Lesende schon die richtige Version für sich findet.

Regeln der einfachen Sprache