Google als Suchmaschine für Emotionen

Wie fühlte sich eigentlich die Generation unserer Eltern, Grosseltern und Urgrosseltern? Waren die Menschen in den 1920er oder 1970er Jahren glücklicher oder ängstlicher als wir es heute sind? Ein Forschungsteam machte sich auf Spurensuche im riesigen britisch-amerikanischen Bücherarchiv von Google.

Vier Tänzerinnen in den «Goldenen Zwanziger Jahren», in den USA die «Roaring Twenties» genannt.

Bildlegende: Nie las man so viele freudige Wörter wie in den «Goldenen Zwanzigern», in den USA die «Roaring Twenties» genannt. zvg

Literarische «Emotionsarchäologen», angeführt vom Anthropologen Alberto Acerbi von der Universität Bristol, haben sich durch einen gewaltigen digitalen Bücherberg gewühlt: Das internationale Forschungsteam hat sich den «Ngram»-Datensatz von Google vorgeknöpft. Dieser umfasst die gigantische Textmasse von über 5 Millionen digitalisierten englischsprachigen Büchern des 20. Jahrhunderts – von der Kriminalgeschichte bis zum Naturkundebuch, vom Reparaturmanual für Lokomotiven bis zum neorealistischen Familienroman «Korrekturen» von Jonathan Franzen. Das entspricht nicht weniger als 4% aller je veröffentlichten Texte.

Solche riesigen Datenmengen seien für die Sozialwissenschaften von unermesslichem Wert, sagt Acerbi: «Der Ngram-Datensatz von Google ist eine Goldmine für uns. Ngram umfasst eine derart gewaltige Datenmenge, dass sie uns zumindest in Ansätzen etwas verraten kann über kulturelle Veränderungen.»

Die Gefühlskurve eines Jahrhunderts

Mit Computerprogrammen hat das Team um Alberto Acerbi Milliarden von Wörtern gezählt. Die Forscher suchten in den Texten nach Begriffen, die sich sechs verschiedenen Basisemotionen zuordnen lassen: Ärger, Ekel, Angst, Freude, Trauer und Überraschung.

Sie hätten keine grossen Erwartungen gehabt, sagt Acerbi, der Erstautor der im Online-Magazin PLoS One veröffentlichten Studie. Sie seien durch pure Neugier angetrieben ans Werk gegangen. Umso erstaunter seien sie gewesen, als die Datenkurven ihrer Statistikprogramme ein Auf und Ab der Gefühle gezeichnet hätten, das verblüffend genau übereinstimme mit den einschneidenden politischen, wirtschaftlichen und gesellschaftlichen Bewegungen des vergangenen Jahrhunderts.

Auseinanderdriften der USA und Grossbritannien

Nie finden sich während des 20. Jahrhunderts derart viele Wörter, die Freude ausdrücken, wie in den Goldenen Zwanziger Jahren, einer Zeit des wirtschaftlichen Aufschwungs. Wohingegen die untersuchten Texte aus dem Jahr 1941, dem Jahr als die USA in den 2. Weltkrieg eintraten, gezeichnet sind von Wörtern der Trauer. Egal ob in Fachbüchern oder belletristischen Werken, in keinem Jahr wird «Traurigkeit» so explizit benannt wie 1941.

Lange Zeit verlaufen die emotionalen Fieberkurven in britischen und US-amerikanischen Büchern mit identischem Schwung durchs 20. Jahrhundert. Doch in den 1960er und erst recht in den 1980er Jahren kühlt der Ton der Briten merklich und zählbar ab. Während in US-amerikanischen Büchern die Emotionalität in derselben Zeit deutlich zunimmt. Soweit die Wörter in Zahlen.

Kritik am blossen Zählen von Wörtern

Zwei Kurven zeigen die Verwendung der beiden Emotionen «Angst» und «Ekel» über hundert Jahre, verglichen mit der durchschnittlichen Verwendung aller sechs Emotionen der Studie.

Bildlegende: Die Verwedung der beiden Emotionen «Angst» und «Ekel» nahm über 100 Jahre einen unterschiedlichen Verlauf. Alberto Acerbi, Vasileios Lampos, Philip Garnett, R. Alexander Bentley

Doch wie sind diese nun zu interpretieren? Werden die Briten immer cooler und die Amerikaner immer hysterischer – egal, ob sie eine Nähmaschinen-Gebrauchsanweisung schreiben oder eine Familientragödie in Worte fassen? Ändert sich lediglich der Gebrauch von Wörtern oder zeichnet sich ein veritabler Mentalitätswechsel ab?

«Darauf haben wir noch keine Antworten», sagt Alberto Acerbi. «Wir sehen einfach, dass sich da ein emotionaler Graben auftut zwischen den USA und den Briten. Aber warum dies so ist, wissen wir zurzeit noch nicht.» Genauso ratlos stehen die Anthropologen vor der Tatsache, dass sich das Drama des 1. Weltkriegs – im Gegensatz zum 2. Weltkrieg – offensichtlich nicht auf die Zahl emotionaler Wörter ausgewirkt hat.

Wer auf solche Fragen Antworten sucht, kommt mit Wörterzählen allein nicht weit, kritisieren zahlreiche Geisteswissenschaftler quantitative Studien dieser Art. Zum einen seien emotionale Wörter nur ein Stilmittel unter vielen, um Gefühle zum Ausdruck bringen. Ein Text könne hoch emotional sein, ohne die entsprechenden Gefühle je explizit zu benennen, sagt etwa Philipp Schweighauser, Experte für US-amerikanische Literatur an der Universität Basel. Und selbst wenn Stimmungswörter eingesetzt würden, erhielten diese ihre Bedeutung erst im Kontext, in der Beziehung zu anderen Wörtern: «Man kann den Glücks- oder Traurigkeitskoeffizienten von Texten nicht an Adjektiven oder Substantiven wie 'sad' oder 'sadness', 'happy' oder 'happiness' ablesen. Ein Buch, in dem viel 'sad' oder 'happy' vorkommt, ist nicht unbedingt ein Sad- oder Happy-Buch.»

Eine sinnvolle Ergänzung?


Emotionen in englischsprachigen Büchern

4:02 min, aus Kultur kompakt vom 02.05.2013

Trotzdem verspricht sich der Basler Literaturprofessor Philipp Schweighauser durchaus zusätzlichen Erkenntnisgewinn dank solcher Big-Data-Studien. Denn diese Methode erlaube Zeit sparende und repräsentative Analysen von Texten über lange Zeitspannen und unterschiedliche Kulturen hinweg. Doch für die Interpretation von Gefühlsschwankungen, wie sie die vorliegende Studie aufzeichne, brauche es eben das Wissen aus tiefer gehenden empirischen Studien.

Das Bild der coolen Briten und der überdrehten Amerikaner möge zwar gängige Klischees bedienen und tatsächlich sei in der US-amerikanischen Literatur insbesondere seit 9/11 eine Rückkehr zu emotionalen Familienromanen wie etwa Jonathan Franzens «Korrekturen» festzustellen. «Dennoch verwehre ich mich dagegen, ohne solide empirische Daten grundsätzliche Aussagen zum emotionalen Haushalt der gesamten amerikanischen Kultur oder auch zum emotionalen Gehalt des amerikanischen Sprachgebrauchs zu machen.»

Mit dieser Kritik kann der Nachwuchsforscher Alberto Acerbi leben. Denn er sieht seine quantitative Methode als Ergänzung zur qualitativen, interpretierenden Methode von Geisteswissenschaftlern wie Philipp Schweighauser. Doch er ist überzeugt, dass derart riesige Daten-Berge wie Google Ngram mit seinen über fünf Millionen Büchern viele Schätze bergen. Auch wenn er weiss: Die passenden Grabungsinstrumente müssen er und seine Mitforscher erst noch entwickeln.

Ngram

Wird ein Text in Teile zerlegt, zum Beispiel in einzelne Wörter oder Buchstaben, entsteht eine Zahl n an Fragmenten. Diese wird englisch als «Ngram» und deutsch als «N-Gramm» zusammengefasst. N-Gramme werden vor allem im Bereich der Informationssicherheit und der Linguistik verwendet.