Maschinelle Übersetzung und Post-Editing

von

Ein Sprung ins kalte Wasser

Bisher nutze ich die maschinelle Übersetzung nur als Ergänzung, um bei geeigneten Projekten etwas Tipparbeit zu sparen. Dies allerdings mit einer eigenen Übersetzungsengine, die mit meinen eigenen Memories aus mehr als 20 Jahren Arbeit aufgebaut wurde und in mein CAT-Tool integriert ist. Dies hat zum großen Teil datenschutzrechtliche Gründe, aber es geht auch um den Schutz meines geistigen Eigentums.

Nun hatte ich also diese große Anfrage vorliegen und musste zunächst einen Preis kalkulieren. Schon das war eine Herausforderung, da ich die Qualität, die das fremde System ausspucken würde, im Voraus überhaupt nicht beurteilen konnte. Selbst dann nicht, wenn ich schon umfangreiche Erfahrungswerte vom Korrekturlesen menschengemachter Übersetzungen habe. Die Fehlerquellen sind einfach zu unterschiedlich. Eine Maschine macht andere Fehler als Menschen. Es hatte schon ein bisschen etwas von Würfeln. Zum Glück lag ich beim Zeitaufwand nicht so weit daneben, wenn man das Projekt insgesamt betrachtet.

Stark schwankende Qualität

Dann kam der Text und ich schwankte etwas zwischen Verzweiflung und "Wow! Respekt!" Immer dort, so schien es, wo viel Referenzmaterial im Internet vorhanden war - z. B. mehrsprachige Webseiten von im Bereich tätigen Unternehmen - war sehr viel gut übersetzt. Dann tauchten aber auch z. B. doppelte Passagen auf - woher diese kommen, ist mir nicht klar. Möglicherweise ist dies ein Segmentierungsproblem, wenn die Vorlage keine gut formatierte Word-Datei sondern eine PDF mit "wilden" Zeilenumbrüchen ist oder z. B. zusammenhängender Text über verschiedene Textboxen verteilt wurde.

Oder es wurden plötzlich Namen von Personen oder Unternehmen übersetzt: Aus einem Herrn "Miller" (Beispiel) wurde dann eben ein Herr "Müller" oder aus der "XY Chemicals, Inc." eine "XY Chemikalien GmbH". Die Maschine „weiß“ nun mal nicht, dass Namen nicht übersetzt werden, und selbst wenn es in den Algorithmen berücksichtigt wurde, so funktioniert die Erkennung zumindest nicht fehlerfrei. Unter Umständen kann ein solcher Fehler gar nicht erkannt werden, wenn man den Ausgangstext nicht zum Vergleich zur Hand hat.

Fleißarbeit

Letztendlich war es eine Fleißarbeit, diese ganzen "Klopper" nicht zu übersehen, die manches Mal auch gar nicht so auffällig waren wie die Beispiele oben. Manchmal wurde der Sinn nicht korrekt erfasst, was auch erst beim Vergleich mit dem Ausgangstext eindeutig feststellbar ist. Wobei man bei künstlicher Intelligenz von "erfassen" nicht wirklich sprechen kann. Die Maschine "versteht" nicht, sondern ordnet Dinge zu, die die Algorithmen als wahrscheinlich klassifizieren. So zumindest mein Gefühl oder Verständnis als Nichtinformatikerin. Man kann da einfach mehr oder weniger Glück haben, je nachdem, wie gut das Referenzmaterial ist, das zum Training der Engine verwendet wurde, oder ob es bei völlig neuen Technologien überhaupt welches gibt.

Verfügbarkeit von Referenzmaterial

Eine weitere "Gefahr" sehe ich auch darin, wie sichergestellt werden kann, dass auch weiterhin gutes Referenzmaterial verfügbar ist. Denn bislang wurde das Referenzmaterial ja meist noch von menschlichen Übersetzern erstellt - also übersetzt. Wenn die Maschine auf maschinengemachtes Referenzmaterial zurückgreifen muss, das vielleicht nicht einmal korrekt nachbearbeitet wurde, wird das Ergebnis entsprechend anders aussehen.

Die Zukunft des Übersetzens

Dennoch gehe ich davon aus, dass die maschinelle Übersetzung nicht aufzuhalten ist. Man muss das Werkzeug nur ordentlich einsetzen, so wie alle Werkzeuge oder auch Werkzeugmaschinen - dort, wo es sinnvoll ist und Zeit spart. Also wirklich Zeit und damit Kosten spart, da Vor- und Nachbereitung auch künftig immer gebraucht werden wird und einkalkuliert werden muss.

Qualitätssicherung und Haftung

Es muss in jedem Fall immer ein Schritt für die Korrektur und Qualitätskontrolle eingeplant werden. Vorzugsweise ausgeführt von Spezialisten, die ihr Handwerk verstehen. In der Qualitätskontrolle eines Produktionsbetriebs steht dort schließlich auch eine Fachkraft - ein Techniker oder Meister - und kein kurz angelernter Arbeiter. Denn derjenige, der die Kontrolle macht, ist für das Ergebnis verantwortlich. Je nachdem, um welche Art von Dokument es geht, besteht hier auch noch das Risiko der Haftung. Denn die Dienste haften lediglich für die Nutzung ihrer Software, aber nicht für die Inhalte der Übersetzung.

Fazit

Wer mit maschineller Übersetzung einen gewissen Anteil der Übersetzungskosten sparen möchte, sollte Folgendes beherzigen:

  • Lassen Sie die Datei vom externen Übersetzer oder intern vorbereiten, damit die Formatierung keine Probleme verursacht bzw.
  • Stellen Sie den zu editierende Text möglichst in einem bearbeitbaren Format bereit (z. B. MS Word-Datei)
  • Sensible Daten sollten entfernt werden, bevor diese auf fremden Servern verarbeitet werden, vor allem dann, wenn ein kostenloser Dienst genutzt wird.
  • Lassen Sie das Ergebnis von kompetenten internen oder externen Übersetzern prüfen und korrigieren.

Dann kann sich - je nach Projekt - auch ein Kostenvorteil erzielen lassen, ohne ein unnötiges Risiko einzugehen.

 

Für alle, die sich noch wissenschaftlicher mit dem Thema beschäftigen möchten, empfehle ich folgenden kleinen Leitfaden von Jean Nitzke und Silvia Hansen Schirra, auf den mich eine Kollegin, Bianca Blüchel, aufmerksam gemacht hat: https://langsci-press.org/catalog/book/319. Die PDF-Datei kann kostenlos heruntergeladen werden, steht aber nur in Englisch zur Verfügung.

Zurück