Nein, Sie lesen jetzt nicht, dass maschinelle Übersetzungen Teufelszeug sind. Was Sie hier aber lesen: warum die KI bei Übersetzungen überhaupt so einen guten Job machen kann – und warum der Job noch besser wird, wenn ein Mensch an der Übersetzung beteiligt ist.
Sprache, das ist nicht bloß eine Abfolge von Buchstaben und Wörtern, eine Kette an Lauten und Schriftzeichen. Sprache, das ist vor allem auch Kultur und Kontext und gesellschaftlicher Code. Um das zu entdecken, müssen wir gar nicht erst in fremde, uns unbekannte Sprachen eintauchen. Es reicht, im Deutschen zu bleiben. Haben Sie schon einmal einem Österreicher oder einer Österreicherin einen Vorschlag gemacht und als Reaktion ein „Schauen wir einmal!“ gehört? Das mag sich für uns anhören wie ein Versprechen, sich später eingehender mit Ihrem Vorschlag zu beschäftigen, tatsächlich meint Ihr österreichischer Gesprächspartner damit aber: „Eigentlich habe ich so gar keine Lust dazu.“
Maschinelle Übersetzungen und was sie können
Stellen Sie sich vor, Sie würden diesen Code nicht verstehen und damit die Reaktion falsch auffassen. Genau das kann Ihnen passieren, wenn Sie sich ausschließlich auf maschinelle Übersetzungen verlassen, egal ob kostenlos oder kostenpflichtig. Doch wir wollen Ihnen hier nicht erzählen, dass maschinelle Übersetzungen pure Scharlatanerie sind. Vielmehr sind auch wir beeindruckt von den technischen Möglichkeiten und dem Entwicklungspfad, den maschinelle Online-Übersetzungen versprechen. Lassen Sie uns also ein wenig eintauchen in die faszinierende Welt der maschinell generierten Texte.
Wo Online-Übersetzungen entstehen
Folgen Sie uns zuerst nach Island. Hier läuft in einer riesigen Serverfarm die neuronale Architektur eines der wohl bekanntesten Online-Übersetzungsdienste in unseren Breiten, DeepL. Dort werden 5,1 Petaflops Anfragen pro Sekunde verarbeitet. Anders formuliert: 5 100 000 000 000 000 Operationen pro Sekunde. Die Grundlage für diese unglaubliche Rechenmenge sind neuronale Netze – und die bilden einen Quantensprung in der Qualität maschineller Übersetzungen.
Wie die KI zum Übersetzer wird
Eigentlich markieren neuronale Übersetzungen das Überschreiten der Grenze hin zu Künstlicher Intelligenz (KI). Warum? Weil neuronale Übersetzungen aus eigenen Fehlern lernen und ihr Sprachmodell selbst an selten genutzte sprachliche Besonderheiten anpassen. Das ist ein signifikanter Unterschied zu statistischen Modellen. Sie orientieren sich ausschließlich an Wahrscheinlichkeiten. Es ist wie das Da Capo in der Musik: passiert ein Fehler, ist das Orchester nicht synchron oder wird ein falscher Ton gespielt, so wird das Stück wieder dort begonnen, wo der Fehler passiert ist. Mit dieser Methode „gewinnt“ nicht die häufigste Übersetzung, wie es bei statistischen Modellen der Fall ist, sondern es können auch sprachliche Eigenheiten oder seltene Phrasen oder Sprachformeln berücksichtigt werden.
Wo die Maschine Aufwand für den Menschen verursacht
Die Nutzung neuronaler Netze ist ein wesentlicher Fortschritt, zweifellos. Doch es kommt auf viele Faktoren an, damit Maschinen das schaffen können, was Sprache ausmacht und nützlich macht: eine Mischung aus Präzision und Interpretation. Die finnische Translationsforscherin Maarit Koponen hat schon 2016 in einer Studie herauszufinden versucht, wie viel Post-Editing, also menschliche Korrektur, eigentlich nötig ist bei maschinellen Übersetzungen und dafür die Erfahrungen von Übersetzerinnen und Übersetzern gesammelt. Das Ergebnis: es ist bei der Machine Translation durchaus ein Faktor, welches Sprachpaar übersetzt werden soll. Bleiben die maschinellen Übersetzungen in der eigenen sprachlichen Familie, etwa Französisch zu Spanisch, so ist die Qualität dessen, was die Maschine übersetzt, oft überzeugender als bei nicht miteinander verwandten Sprachen wie Englisch und Estnisch. In dem Fall war der wahrgenommene Aufwand für das Post-Editing deutlich höher.
Keinen Tropfen Sprache verschütten
Der Übersetzer aus der Serverfarm hat heute Talente, die bei einfachen Übersetzungen und Textformen wie etwa einer Tagesordnung für eine Konferenz oder Informationen über einfache Produkte völlig ausreichen. Aber Sprache ist, wir haben es ja schon erwähnt, eben auch Kultur und ihr Zauber entfaltet sich nicht bloß als Verkettung von Sätzen oder Absätzen, sondern auch in der Struktur eines Textes. Der englische Schriftsteller Cyril Connoly hat es einmal so formuliert: „Die Übersetzung von einer Sprache in eine andere ist die empfindlichste intellektuelle Übung; Im Vergleich zur Übersetzung wirken alle anderen Rätsel, von der Brücke bis zum Kreuzworträtsel, trivial und vulgär. Um ein Stück Griechisch zu nehmen und es ins Englische zu übersetzen, ohne einen Tropfen zu verschütten; was für eine schöne Begabung.“
Mit Post Editing Services das Beste aus der Maschine holen
Wie können nun Unternehmen, für die exakte Übersetzungen businesskritisch sind, sicherstellen, dass bloß keinen Tropfen Sprache verschüttet wird? Die Antwort ist ein dreistufiges System: auf die Auswahl der passenden maschinellen Übersetzungstechnologie für den jeweiligen Zweck folgt deren richtigen Anwendung und dann die Kontrolle und Veredelung des Ergebnisses durch menschliche Übersetzer:Innen – das Post-Editing.
Machine Translation trifft also auf menschliche Erfahrung und Deep Learning auf tiefes Sprachenverständnis.
Nun werden Sie zurecht fragen: wann ist der Mensch denn nicht mehr nötig, um präzise und kultursichere Übersetzungen einfach per Machine Translation zu ermöglichen?
Lassen Sie uns dazu zuerst einmal in das Jahr 1954 zurückschauen. Am 8. Januar 1954 gab der IT-Riese IBM eine Pressemitteilung heraus, in der es um das Potenzial maschineller Übersetzungen ging. Zitiert wird darin der Sprachwissenschaftler Leon Dostert: Obwohl er betonte, dass es noch nicht möglich ist, `an einem Ende ein russisches Buch einzufügen und am anderen Ende ein englisches Buch herauszuholen´, sagte Doktor Dostert voraus, dass `in fünf, vielleicht drei Jahren´ die interlinguale Bedeutungsumwandlung durch elektronische Verfahren in wichtigen Funktionsbereichen mehrerer Sprachen eine vollendete Tatsache sein könnte.
Wir schreiben das Jahr 2023, und ja, die technologische Entwicklung hat sich seit den 50er Jahren des vergangenen Jahrhunderts exponentiell beschleunigt. Neuronal basierte Technologien haben für einen enormen Qualitätsschub gesorgt.
Und dennoch: Sprache wird ständig durch unseren Alltag, durch unsere Reisen, das Kennenlernen und die Verschmelzung verschiedener Kulturen, durch Echtzeit-Kommunikation mit anderen Menschen verändert, geformt, geprägt. Übersetzungen sind daher ein Spiegel dieser dauerhaften Metamorphose. Wir sind daher ziemlich sicher: Maschinen werden dieses Erfahrungsnetz nicht so rasch simulieren können.