Das Meta-Wörterbuch

Das Meta-Wörterbuch
Gerade wird an einem lexikographischen Großprojekt gearbeitet, das auf den Schultern der Brüder Grimm steht, aber auch auf der Basis von Milliarden Wörtern im Internet. Kann es helfen, Framing besser zu erkennen und Shitstorms zu vermeiden?

Am Mittwoch war es "Schatzsuche", zuvor "kauzig": Der "Artikel des Tages" oben rechts auf dwds.de, dem "Digitalen Wörterbuch der deutschen Sprache", stellt täglich ein deutsches Wort vor. Bei manchen kann man sich fragen, ob es diesen Anglizismus wirklich braucht, bei manchen in Diskussionen geraten wie bei "Tyrannenmord" am 20. Juli, dem Jahrestag des bekanntesten Hitler-Attentats. Ein kleiner Clou besteht darin, dass immer Textstellen aufgelistet werden, an denen das Wort vorkam – beziehungsweise vorkommt, denn die Texte und Wörter gibt es ja weiter.

Das DWDS, in dem sich alle Wörter natürlich auch selbstständig suchen lassen, ist auch Teil eines großen Projekts ist, das im Januar anlief und in Berlin in großen Worten vorgestellt wurde. "Das Deutsche ist eine der bedeutendsten Kultursprachen der Welt", heißt es in der Projektbeschreibung des Zentrums für digitale Lexikographie der deutschen Sprache (ZDL), das "den deutschen Wortschatz und seine fortwährenden Veränderungen umfassend und verlässlich" beschreiben soll.

Wie meist im föderalistischen Deutschland sind mehrere Institutionen beteiligt. In erster Linie tragen es die Berlin-Brandenburgische Akademie der Wissenschaften (BBAW) und die Akademie der Wissenschaften zu Göttingen mit etwa 15 bzw. 5 Stellen. Durch das Bundesministerium für Bildung und Forschung ist das ZDL auf fünf Jahre finanziert und hat eine Verstetigung in Aussicht. "Lexikographisch arbeiten kann man ab einem Horizont von zehn Jahren", sagt Volker Harm, Arbeitsstellenleiter des Projekts in Göttingen. Andererseits, länger als eine Generation sollte die Arbeit auch nicht dauern – wie das 'Deutsche Wörterbuch' der Grimms gezeigt habe: Dessen erste Bände seien schon am Ende des 19. Jahrhunderts von denen, die es fortschrieben, als altmodisch empfunden worden.

"Großartig", aber auch "unlesbar"

Um das Wörterbuch der Grimms rankt sich eine gern erzählte Germanisten-Anekdote. Die Brüder, die außer Märchen vieles sammelten, eben auch Wörter, hatten dafür 1838 rund zehn Jahre vorgesehen. Als Jacob Grimm 1863 starb, arbeitete er am Wort "Frucht". Bis das Wörterbuch 1961 abgeschlossen war, kamen zwei Weltkriege, eine Reichsgründung und eine deutsche Teilung dazwischen, und eben die Zeitläufe/ Zeitläufte. Daher wurde in den 1960ern, bei fortbestehender (bzw. durch den Mauerbau gerade verschärfter) deutscher Teilung eine Neuauflage der ältesten Bände in Angriff genommen – die nicht viel schneller vonstatten ging: "Die Bände 1–4 (A–Betreuung) sowie 6–9 (D–Fux) wurden bereits in Berlin und Göttingen bearbeitet und liegen gedruckt vor; Band 5 (Betrieb–C) wurde bis Ende 2016 in Göttingen bearbeitet", informiert die Göttinger Akademie. Ende 2019 dürfte die Neubearbeitung online gehen, etwa im woerterbuchnetz.de der Uni Trier. "Wir stehen auf den Schultern des Grimmschen Wörterbuchs", sagt Harm, der daran mitarbeitete, aber auch: "So großartig ich es finde, es ist teilweise unlesbar".

Das ZDL steht auf Schultern vieler Wörterbücher, auch neuerer. Allerdings habe bei der Gegenwartssprache "der Duden eine Lücke hinterlassen". Die Zeiten, in denen Wörterbücher für Verlage ein Geschäft waren, sind definitiv vorbei. Die digitalen Ausgaben des Duden seien "gut, aber angesichts des Umfangs und der Dynamik der Gegenwartssprache kann ein kleines Team wie das des Duden hier nur Begrenztes leisten", sagt Harm. Das "Wörterbuch der deutschen Gegenwartssprache" kann die Lücke nur bedingt füllen, schon weil es einst von der Akademie der Wissenschaften der DDR teilweise recht ideologisch in Angriff genommen wurde und etwa unterm Stichwort "Maus" nur enthielt, was schon die Grimms verstanden hätten, nicht aber das Computereingabe-Gerät (was im DWDS, das auch, aber nicht nur auf diesen Beständen basiert, aktualisiert wurde).

Gern mit "Lösung" verknüpft: Krisen

Der Göttinger Aspekt am ZDL betrifft Wortgeschichte seit 1600 bis heute – "wir wollen es nicht abschneiden, dann wird es langweilig". An gegenwärtigen Interessen orientiert, sollen rund 700 Wörter aus Themenfeldern wie "Politik und Gesellschaft", "Kultur" oder "Verkehr" ausgewählt und ihre Wortgeschichten anschaulich erzählt werden. Sie werden online untereinander verknüpft und visualisiert, ähnlich wie "Krise" das im DWDS zeigt. Wer mit der Maus den Kreis auf der Zeitleiste greift, kann durch die Jahrzehnte von 1940 bis 2010 fahren und sieht animierte Kollokationen, also im Verbund mit welchen Worten "Krise" so erschien. "Schwer" und "tief" oder "ernst" waren und sind Krisen immer. 2010 war der Begriff mit der Ukraine und Griechenland verknüpft, aber auch mit "Ausweg" und "Lösung". "Krise" taucht in immer neuen Zusammensetzungen auf, aktuell am häufigsten als "Klimakrise". Was also eher Beherrschbarkeit suggeriert als "Klimawandel", oder? Zumindest handelt es sich ziemlich genau um das, was derzeit "Framing" genannt wird: Begriffe, die ins eigene Konzept passen, durchzusetzen, so dass fast alle sie benutzen. Das dürfte ein spannender Anknüpfungspunkt sein.

Gibt es online etwas davon zu sehen? Noch nicht. Im Oktober dürften erste Probeartikel online gehen. Die Uhren gehen in der Wissenschaft anders als im echtzeit-getriebenen Journalismus. Eine Vorschau auf Wörter kann Volker Harm geben: "Masse" mit Bezug auf Menschen erschien, anders als vermutet, schon vor der Französischen Revolution häufig in deutschen Texten. Kam "Zivilgesellschaft" durch Jürgen Habermas in den Sprachgebrauch? Nein, schon Otto von Bismarck verwendete den Begriff. Und "Digitalisierung": Das Wort ist seit 1971 belegt, wie "digitalisieren". "Digital" ist seit 1956 nachweisbar, noch älter ist die medizinische Bedeutung "mit Digitalis behandeln" (wie evangelisch.de-Leser durch das "P.S." unterm Blog "Confessio Digitalis" wissen könnten ...).

Und das "N-Wort", wie Deniz Yücel vorsichtshalber 2013 in der "taz" schrieb, wird vorkommen. In nicht lange zurückliegenden Jahrzehnten tauchte "Neger" oft in Texten auf, in "Pippi Langstrumpf" und Adornos "Dialektik der Aufklärung". Inzwischen wird eigentlich nur noch darüber diskutiert, wenn es in Neuauflagen von Kinderbüchern ersetzt wird. "Wir haben überlegt, keine Empfehlungen zu geben", wie es duden.de tut, sagt Harm. Deutlich werden, ob und wie man Wörter verwendet, sollte aber: "Wir wollen Nutzern helfen, den Sprachgebrauch historisch zu reflektieren und einerseits bewusster, andererseits entspannter mit Wörtern umzugehen". Das könnte dann dazu beitragen, Shitstorms zu vermeiden, die sich ja häufig an Worten entzünden, die die einen unreflektiert benutzen und die anderen in einer unter mehreren möglichen Bedeutungen verstehen (wollen).

"Wir googeln schon"

Die Arbeit besteht darin, die Begriffe in den Textkorpora zu suchen und die Fundstellen, "weitgehend händisch", doch mit digitalen Hilfsmitteln wie Suchfiltern, auf ihre genaue Bedeutung im Lauf der Zeiten durchzusehen. Diese "Textkörper" sind gewaltig: "Dreizehn Milliarden Belege aus historischen und gegenwartssprachlichen" Texten enthalten sie, darunter jahrzehntelange Zeitungsjahrgänge etwa der "Berliner Zeitung" seit 1945 (die ja lange in der DDR erschien und erst in jüngster Zeit zu einer kaum noch ausstrahlenden Lokalzeitung wurde...) bis 2005, "Die Zeit" von 1946–2018 und auch vieles aus dem Internet. Der "Webkorpus 2016c" etwa, von der Österreichischen Akademie der Wissenschaften aus deutschsprachigen Quellen erstellt, ist der zweitgrößte Korpus nach dem "DWDS-Zeitungskorpus (ab 1945)". Vieles ist, auch aus Rechte-Gründen, nicht enthalten. Manches ergibt sich so – etwa, dass die Uni Bremen eine "Digitale Sammlung Deutscher Kolonialismus" anlegte, die etwa für das N-Wort aufschlussreich sein dürfte.

Wobei, ist das Web selbst nicht ein noch viel größerer Korpus, den Suchmaschinen durchpflügen? "Wir googeln schon", bekundet Harm: "Besonders 'Google Books' ist als Kontrollinstanz wichtig. Allerdings müssen die Ergebnisse als verlässliches Digitalisat oder physisches Buch vorliegen. Schließlich zeigt Google bei unterschiedlichen Suchen oft unterschiedliche Ergebnisse an." Nach welchen Maßgaben der kalifornische Konzern wem was wie anzeigt, ist ja sein zentrales Geschäftsgeheimnis. Man darf also gespannt sein auf das "Meta-Wörterbuch", das auf deutschsprachige Wörterbücher aller Generationen, Gesellschaften und Staaten aufsetzt. Und darauf, wie es online erscheinen wird: "Die Ideen werden entwickelt und sind noch nicht in Stein gemeißelt", sagt Harm.

Stein ist neben Keramik das wohl dauerhafteste Speichermedium, und Papier, was immer die auf Smartphones fixierten Generationen davon halten, dürfte wesentlich haltbarer bleiben als rein digitale Daten, deren Formate und Trägermedien rasanter veralten, als es in der Echtzeit scheint. Das ZDL wird dennoch "rein fürs Internet konzipiert", informiert der Göttinger Forscher: "Wir überlegen, vielleicht eine kleinere Zahl, etwa die 100 interessantesten Wortgeschichten als Buch herauszugeben."