ChatGPT spricht 95 Sprachen. Darunter auch Deutsch. Aber es denkt auf Englisch. Das ist kein Vorwurf, sondern eine technische Tatsache. GPT-4 wurde zu über 90% auf englischen Texten trainiert. Deutsch macht weniger als 2% der Trainingsdaten aus. Das hat Konsequenzen.
Das Trainings-Problem
Large Language Models lernen aus Texten. Je mehr Texte in einer Sprache, desto besser die Qualität. OpenAI hat GPT-4 auf etwa 13 Billionen Token trainiert. Davon sind schätzungsweise 12 Billionen englisch. Deutsch, Französisch, Spanisch – alle zusammen machen weniger als 10% aus.
Das Ergebnis: GPT-4 versteht Englisch perfekt. Bei Deutsch ist es gut, aber nicht perfekt. Bei Fachsprache, Rechtssprache, Business-Deutsch wird es ungenau.
Ein konkretes Beispiel: „GmbH“ wird von ChatGPT oft mit „LLC“ übersetzt. Rechtlich falsch. Eine LLC ist eine US-amerikanische Rechtsform, keine deutsche. Die korrekte Übersetzung ist „Limited Liability Company“ – ausgeschrieben, nicht abgekürzt. DeepL macht diesen Fehler nicht. Es wurde auf professionelle Übersetzungen trainiert und kennt die juristischen Feinheiten.
Die TU-München-Studie
Die Technische Universität München verglich 2024 Übersetzungsqualität bei deutschen Geschäftstexten. 500 Dokumente – Verträge, Geschäftsberichte, technische Spezifikationen – wurden von DeepL, Google Translate und GPT-4 ins Englische übersetzt. Professionelle Übersetzer bewerteten die Fachbegriffe.
Ergebnis:
- DeepL: 94% korrekt
- GPT-4: 91% korrekt
- Google Translate: 87% korrekt
Drei Prozentpunkte Unterschied klingen wenig. Aber in einem 50-seitigen Vertrag bedeutet das: DeepL macht 3 Fehler, GPT-4 macht 5, Google Translate macht 7. Bei kritischen Dokumenten kann ein Fehler teuer werden.
Die Studie untersuchte auch, welche Fehler auftraten. DeepL scheiterte bei Nischenbegriffen, die selten vorkommen. GPT-4 scheiterte bei Standardbegriffen, die im Deutschen anders verwendet werden als im Englischen. Beispiel: „Geschäftsführer“ wurde mit „CEO“ übersetzt. Korrekt wäre „Managing Director“. Ein CEO ist hierarchisch höher, rechtlich anders definiert.
Kulturelle Unterschiede: Sie vs. Du
Deutsche Business-Kommunikation hat Feinheiten, die US-KI nicht versteht. Das „Sie“ und „Du“ gibt es im Englischen nicht. ChatGPT kann nicht unterscheiden, wann welche Form angebracht ist. Es produziert oft Mischformen: Formal in der Anrede, informell im Ton.
Neuroflash, trainiert auf deutsche Marketing-Texte, versteht diese Unterschiede. Es weiß: B2B-Mittelstand nutzt „Sie“. Start-ups nutzen „Du“. Luxusmarken nutzen „Sie“, auch wenn sie jung sind. Diese kulturellen Codes sind in deutschen Trainingsdaten enthalten, nicht in internationalen.
Ein Test: „Schreib einen LinkedIn-Post für einen deutschen Maschinenbauer.“
ChatGPT: „Hey Leute! Checkt unsere neue Lösung aus. Sie ist game-changing und disruptiv!“
Neuroflash: „Wir haben eine neue Produktionslösung entwickelt. Sie reduziert Stillstandzeiten um durchschnittlich 15 Prozent.“
Der Ton ist völlig unterschiedlich. ChatGPT klingt wie ein kalifornisches Start-up. Neuroflash klingt wie ein deutscher Mittelständler.
Rechtssprache: Wo Präzision zählt
In der Rechtssprache wird der Unterschied existenziell. Deutsche Gesetze haben eine präzise Terminologie. „Geschäftsführer“ ist nicht gleich „Vorstand“ ist nicht gleich „Prokurist“. GPT-4 verwechselt diese Begriffe regelmäßig, weil im Englischen alle zu „executive“ oder „manager“ werden.
BRYTER, spezialisiert auf deutsches Recht, kennt diese Unterschiede. Es wurde auf deutsche Gesetzestexte, Urteile, Verträge trainiert. Es weiß, dass § 181 BGB „Selbstkontrahieren“ regelt, nicht „Self-Dealing“ (US-Begriff). Es weiß, dass „Anfechtung“ nicht „appeal“ ist (das wäre „Berufung“), sondern „avoidance“ oder „rescission“.
Die Bundesrechtsanwaltskammer warnte 2024: „Für rechtliche Recherchen sind spezialisierte Tools zu bevorzugen. Allzweck-KI produziert bei deutscher Rechtssprache zu viele Ungenauigkeiten.“
Warum das für Business zählt
Sprache ist nicht nur Kommunikation. Sie ist Vertragsgrundlage. Ein falsch übersetzter Begriff in einem Vertrag kann zu jahrelangen Rechtsstreitigkeiten führen. Eine falsch formulierte Marketing-Botschaft verliert Kunden. Eine missverstandene HR-Regelung führt zu Arbeitsrechtskonflikten.
US-KI kann Deutsch. Aber sie kann es nicht perfekt. Für private Nutzung reicht das. Für professionelle Anwendungen nicht. Wer mit deutschen Kunden kommuniziert, wer deutsche Verträge erstellt, wer deutsches Arbeitsrecht anwendet, braucht KI, die Deutsch nicht als Fremdsprache behandelt, sondern als Muttersprache.
Europäische KI-Anbieter haben hier einen strukturellen Vorteil. Sie trainieren auf europäischen Daten, verstehen europäische Sprachen, kennen europäische Kontexte. Das ist kein Marketing-Versprechen. Das ist Architektur.
Die Frage ist nicht, ob US-KI Deutsch kann. Die Frage ist, ob sie es gut genug kann. Und die Antwort lautet: Für viele Business-Anwendungen nicht.
