wie wenig machen wir uns klar, dass wir nicht an die welt, sondern die kommunikation grenzen. (Oswald Wiener)
Martin Warnke unternimmt in seinem in der schmalen Buchreihe »Fröhliche Wissenschaft« erschienenen Text eine Entdeckungsreise. Dabei berührt er die Geschichte der LLMs, selten beachtete linguistische Thesen, die Kabbala und die Übersetzungstheorie Walter Benjamins.

Einer seiner Einstiegspunkte ist die bei der Anwendung von KI-Chatbots derzeit noch häufig anzutreffende Erscheinung von »Halluzinationen«, syntaktisch korrekten, aber semantisch unsinnigen Aussagen. Ich selbst habe mir einmal ein Literaturverzeichnis mit den Schriften einer Autorin aus dem 19. Jahrhundert zusammenstellen lassen, in dem 40 Prozent der Titel frei erfunden oder dieser Person unberechtigerweise zugeschrieben waren. Obwohl im Effekt gleich, entstehen Halluzinationen völlig anders als menschliche Konfabulationen. Ich habe das Phänomen in mehreren Seminaren getestet: Eine halbe Stunde nach einer gemeinsam angesehenen TV-Nachrichtensendung wurde nur ein gutes Drittel der einzelnen Beiträge korrekt erinnert, häufig gab es Verwechslungen von Orten und Personen, und fast immer wurden auch hinzuerfundene Nachrichten aufgelistet. Das menschliche Gedächtnis spielt allen von uns aufgrund seiner Plastizität solche Streiche – es gibt keine festen und verlässlichen »Speicherplätze« für Erinnerungen. Bei der KI ist der Grund ein anderer, die Halluzinationen füllen probabilistische Lücken aus, weil es einen Mangel an Inputs oder an Überprüfungen durch Rückkopplungen gibt.
LINGUISTIK
Dass eine »Bedeutung tragende Sprache« quantitativen Verfahren unterworfen wird, ist zunächst kein sprachwissenschaftlicher Skandal. Für Linguisten bilden Texte einen Korpus, das nach allen Regeln der statistischen Künste untersucht werden kann. Das statistisch operierende »Distant Reading« Franco Morettis hat auch die Literaturwissenschaft durchaus bereichert. Wer zudem an die Lexika denkt, die englische, lateinische und deutsche Neologismen in Finnegan’s Wake erfassen – ein Buch, das man als Lexik-Maschine bezeichnen könnte –, wird sich von KI-Anwendungen in geisteswissenschaftlichen Feldern positive Erkenntnisse erhoffen, und das mit Recht.
Bei den LLMs und in Martin Warnkes Buch geht es nun jedoch um die Generierung von Semantik aus einem statistisch gefilterten Daten-Ozean. Dass so etwas möglich ist, führen Chatbots seit einigen Jahren in immer ausgefeilteren Texten vor. Martin Warnke hat nun ein sprachwissenschaftliches Modell gefunden, das eine Erklärung dieser Möglichkeit erlaubt. Zellig Sabbetai Harris, ein in den 1950er Jahren durch seine ›strukturale Linguistik‹ durchaus bekannt gewordener Linguist, stellte die Korrelation von häufig vorkommenden Wörtern und häufig vorkommenden Bedeutungen fest. Was er dabei nicht einbezog – jedenfalls findet sich dazu bei Martin Warnke kein Hinweis –, ist der Faktor Kommunikation, der gewiss die Erzeugung von »Bedeutungen« erst ermöglicht und beeinflusst.
Er behandelt jedoch in einem Abschnitt über »Bedeutungskonstitution« den relationalen Bezug sprachlicher Symbole zu Objekten außerhalb der Sprache, den er »Weltbezug« nennt. Ich frage mich allerdings, welchen Weltbezug eine Äußerung wie diese hat (flugs von mir erfunden): »Die Pax Americana der McCarthy-Ära ist mit dem von Trump angestrebten System der Weltregierung nicht ganz vergleichbar.« Wer sich mit diesem Satz auseinandersetzen möchte, sieht sich mit mehreren Varianten und (späteren) Interpretationen der Pax Americana konfrontiert und müsste sich auch darüber schlüssig werden, welche Art Regierungssystem der aktuelle amerikanische Präsident anstrebt. Und worin sollte die Vergleichbarkeit bestehen, die partiell verneint wird? Nur das Durchforsten von Texten oder die Befragung von Experten könnte hier weiterhelfen. Ein LLM-basiertes System stände vor der gleichen Aufgabe und würde schneller als ein Mensch ein für eine Folgediskussion brauchbaren Text ausgeben. Die Gefahr von »halluzinatorischen« Elementen ist bei ihm nicht größer als die der Konfabulation bei mir, der ich ja unter anderem bereits vorurteilsvoll an die Vermutung herangehe. Jedenfalls ist es nach meiner Empfindung mit dem Weltbezug bei diesem Beispiel – und beliebigen anderen, die über eine Aussage wie »Der Ball ist rot« hinausgehen – nicht weit her. (Welt und Sprache rückt der Schriftsteller Elias Hirschl noch näher mit der Erfindung einer »Objektsprache«, bei der man das, was zu sagen ist, als Ding im Mund hat, und es ausspuckt, wenn man spricht.)
Bedeutung geht nicht einfach in Grammatik (und Statistik) auf, aber eine wesentliche Voraussetzung für die Semiose ist nach Auffassung vieler Semiotiker die Kommunikation. Semiotik lässt sich als Kommunikationsprozess definieren, an dem Menschen und Maschinen beteiligt sind. In ihm geht es zentral darum, den Zeichen Bedeutungen zuzuweisen, und das auf beiden Seiten des Prozesses. Bedeutungen können nicht »übertragen« werden, sie hängen vom Verständnis und vom Zeichenvorrat beider Seiten ab, wobei es in der Regel keine Übereinstimmungen gibt. Das semantische Feld, aus dem eine Nachricht stammt, und das semantische Feld, auf das sie trifft, weisen zeitliche, örtliche, kulturelle und viele andere Differenzen auf.

In der Regel ist also mit einer »Störung« der Nachricht im Sinne einer nicht-identischen Bedeutung zu rechnen. Der Grad dieser Störung kann jedoch von den Beteiligten kaum ermittelt werden; das Vorhandensein einer Störung wird häufig nicht einmal erkannt. In dieser Hinsicht unterscheidet sich die Kommunikation zwischen Menschen nicht von der zwischen Menschen und Maschinen.
KABBALISTIK
Um die Kabbala und ihren großen Interpreten Gershom Scholem habe ich bislang immer einen vorurteilsvollen Bogen gemacht. Die Tora enthält eine Welt, die aus ihrem Text entsteht, einem absoluten Text, der keine referentielle Funktion hat und zulässt. Das ist die Sicht der jüdischen Mystik. Sinn und Bedeutung realisieren sich erst in der Rezeption. – Das allein ist allerdings keine Besonderheit der Tora, sondern ein Prozess, der sich bei jeder Mitteilung beobachten lässt. »Tiefe« Bedeutungen werden nicht freigelegt, sondern von den Rezipienten zugeschrieben. So jedenfalls meine Sicht, im Lichte der Semiotik de Saussures und Peirces. Die kabbalistische Auslegungstechnik, die manchmal die Gestalt einer magischen Hermeneutik annimmt, hat allerdings im Zusammenhang mit der angedeuteten linguistischen These von Zellig Harris einen besonderen Reiz. Der nicht-referentielle absolute Text, der durch unendlich viele Annäherungen bedeutsam gemacht wird, ist ein Artverwandter der durch LLMs erzeugten Texte. (Hm, LLM = Gott?)
Gerade dem Kabbala-Kapitel ist anzumerken, dass dem Autor seine Entdeckungen großen Spaß gemacht haben. Und er versteht es, auch durch eine Reihe von Zitaten, mir nun doch eine Lektüre Scholems schmackhaft zu machen.
WALTER BENJAMIN
Die Übersetzungstheorie Walter Benjamins darf nun – nachdem Scholem schon vorgekommen ist – nicht fehlen. Benjamin, so Martin Warnke, unterstellt grundsätzlich eine Instanz, die jeder sprechbaren Sprache vorausgeht. Schon 1916 beantwortete Benjamin in seinem Text »Über Sprache überhaupt und die Sprache des Menschen« die selbstgestellte Frage:
Was teilt die Sprache mit? Sie teilt das ihr entsprechende geistige Wesen mit. Es ist fundamental zu wissen, daß dieses geistige Wesen sich in der Sprache mitteilt und nicht durch die Sprache. Es gibt also keinen Sprecher der Sprachen, wenn man damit den meint, der durch diese Sprachen sich mitteilt. Das geistige Wesen teilt sich in einer Sprache und nicht durch eine Sprache mit …
Warnke stellt nach der Lektüre mehrerer einschlägiger Texte Benjamins fest, dass dessen Auffassung unentschieden zwischen Unmöglichkeit und Notwendigkeit oszilliert, zwischen Mystik und Materialismus – und insofern, in meiner Sicht, auch außerhalb fassbarer sprachwissenschaftlicher Kategorien bleibt. Dass »das sprachliche Wesen der Dinge« ihre Sprache ist, erinnert ein wenig an die Unterscheidung von Medium und Form Fritz Heiders, Niklas Luhmanns und auch Marshall McLuhans. Dass – mit Zellig Harris – Eigenschaften oder Ereignisse zusammen mit den Objekten auftreten, die an ihnen beteiligt sind, bezeichnet Martin Warnke als »materielle Seite der Sprache …, die Ding-Welt, die … den Large Language Models fehlt«. Ich bleibe dabei, mich überzeugt diese Aussage nicht. Nicht deshalb, weil den LLMs der Objektbezug abgesprochen wird, sondern, weil er auch in menschlichen sprachlichen Äußerungen nur äußerst vage ist bzw. nur durch Zuschreibung quasi angenagelt wird. In welcher Ding-Welt ist die Pax Americana angesiedelt?
FAZIT DER LEKTÜRE
Die Zuweisung der LLM in den Verantwortungsbereich der Linguistik ist absolut plausibel, soweit es das Mantra von Zellig S. Harris betrifft – »Bedeutungsunterschiede korrelieren mit Unterschieden in der Verteilung.« Es beantwortet die Frage, wie es möglich ist, das rein probabilistisch entstandene Sätze von Menschen als nicht nur syntaktisch korrekt, sondern auch semantisch erhellend wahrgenommen werden.
Die Ablehnung von neuropsychologischen Analogien kann ich jedoch nicht vollständig nachvollziehen. Sowohl die menschlichen Wahrnehmungen als auch ihre Erzeugungsmechanismen entstehen in den Kontakten zur Außenwelt (und zum eigenen Körpergeschehen). Erfahrungen, Regeln und viele andere Dinge tragen zu einer vieldimensionalen Konstruktion eines Realitätsbildes bei, das letztlich jedoch etwas völlig anderes ist als ein Abruf von präexistenten oder gespeicherten Mustern. Diese konstruktivistische Position hat sich in den letzten Jahrzehnten in der Neuropsychologie durchgesetzt und ist auch der wichtigste Erfolgsfaktor des Deep Learning-Konzepts von Geoffrey Hinton und seinen konnektionistischen Mitstreitern.
Der Untertitel »Eine kleine Geschichte der Großen Sprachmodelle« wird nur im ersten Teil des Buchs eingelöst, der verwickelte Pfad vom Perceptron Frank Rosenblatts über die Auseinandersetzungen zwischen den symbolischen und den konnektionistischen KI-Entwicklern bis zur vollständigen Durchsetzung letzterer wird nur gestreift.
Interessant wäre es durchaus gewesen, wenn die auch Auftragssituationen der KI-Projekte beschrieben worden wären. Beispielsweise stand die symbolische Richtung, für die prominent Marvin Minsky steht, immer militärischen Auftraggebern (der ARPA) nahe. Das erinnert an die Geburtsphase des Internet, hat in diesem Fall aber nicht funktioniert, da die symbolische, auf Verfahrensregeln und einer Datenbanklogik basierende KI nie das leistete, was man von ihr erwartete. Heute ist es die konnektionistische, auf »Deep Learning« basierende Richtung, die mit Mustererkennungssystemen für das Militär, aber auch für die Medizin höchst interessant ist und mit Fördermitteln überhäuft wird. Die Chat-GPT-Welt der promptologischen Texte ist demgegenüber ein Abfallprodukt, mit dem der ganze Erdkreis überzogen wird. Leider scheint für die meisten Menschen die Frage, was denn KI sei, mit dem Hinweis auf diese Text- und Bildgeneratoren schon beantwortet zu sein. Darin sehe ich eine größere Gefahr als in den Maschinentexten, mit denen sich Lehrende aller Bildungsanstalten herumschlagen müssen, auch wenn sie auf das Sprachniveau und die Ausdrucksfähigkeit jüngerer Menschen in Mensch-zu-Mensch-Dialogen einen schon beobachtbaren Einfluss haben. Die im Buch häufig aufgerufenen »Halluzinationen« ließen sich übrigens auch von ihrer anderen Seite her bewerten: Da bekannt ist und immer wieder erlebt werden kann, dass KI blödsinnige Texte (und Bilder) generiert, müssen sich Redaktionen in den Medien ihrer Aufgabe erinnern, alle Angaben vor ihrer Veröffentlichung auf einem anderen Weg zu überprüfen. Akademiker sollten sich aufgefordert fühlen, statt der schriftlichen Wiedergabe von Lernstoff mehr auf Dialoge und die eigene Erarbeitung von Wissen in Projekten zu setzen (was Hochschuldidaktiker ohnehin schon seit Jahrzehnten predigen).
Das Buch bietet einige spannende Stunden Lektüre mit unerwarteten Wendungen und Bezügen, also auch hohem Informationsgehalt.
Martin Warnke: Large Language Kabbala. Eine kleine Geschichte der Großen Sprachmodelle. Berlin: Matthes & Seitz, 2026.
Elias Hirschl: Schleifen. Wien: Zsolnay, 2026.
Das Motto stammt aus: Oswald Wiener: die verbesserung von mitteleuropa. Reinbek: Rowohlt, 1972, Anm. S. CLVI.