Soziale Netzwerke: Gspürsch mi - jetzt automatisiert

Facebook hat für ein Experiment die Nachrichten von 690'000 Benützern mit Hilfe von Computern nach Emotionen abgetastet. Wie kann rationale Software erkennen, welche emotionale Haltung in einem Text steckt? Diese Techniken werden bereits seit Jahren entwickelt und in der Forschung angewendet.

Grafik

Bildlegende: Oscar Senti-meter: Die Grafik zeigt aufgrund von Tweets, wie und wie stark ein Schauspieler diskutiert wird . Los Angeles Times, Annenberg Innovation Center

Facebook wollte in einem Experiment herausfinden, ob der emotionale Gehalt einer Nachricht die Leser beeinflusst. Voraussetzung für das Experiment: Die Forscher mussten zuerst die Nachrichten von 690'000 Benützern mit Hilfe von Computern auf Gefühle hin untersuchen.

Das Wörterbuch der Emotionen

Im Zentrum steht ein Wörterbuch mit etwa 2000 Einträgen, die von Probanden bewertet wurden. Allen Begriffen in der Liste wurde ein Wert auf einer Emotions-Skala zugewiesen, je nach dem wie stark negativ oder positiv das Wort wirkt. «Lieben» und «schön» sind Beispiele für positive besetzte Ausdrücke. Um den Emotionsgehalt eines Textes zu eruieren, sucht die Software nun nach Begriffen aus dem Wörterbuch und berechnet dann einen Gesamtwert.

Komplexe Realität

Doch dieses Vorgehen alleine reicht in der Praxis nicht aus. Die Software muss noch mehr können: Was, wenn in einem Text Tippfehler enthalten sind oder der Verfasser sich nicht an die konventionelle Orthographie hält? Beides ist bei Texten, die in Foren oder auf sozialen Netzwerken veröffentlicht werden, keine Seltenheit. Und auch mit sturem Nachschlagen von einzelnen Worten aus dem Emotionen-Lexikon verpasst die Software so einiges – eine Negation zum Beispiel («nicht schön») oder eine Modifikation («soooo gut!»).

Viel Gefühl steckt auch in den Emoticons – den beliebten Piktogrammen, die aus Sonderzeichen zusammengesetzt werden. Für all diese Probleme gibt es aber Lösungen, die in fortgeschrittenen Software-Paketen für die sogenannte Sentiment-Analyse zum Einsatz kommen.

Sentiment-Analyse ist nicht neu

Portrait Jonathan Taplin

Bildlegende: Jonathan Taplin: Direktor des Annenberg Innovation Lab YouTube

Analysiert wird auf diese Weise schon seit mehreren Jahren was das Zeug hält: Bei der Oscar-Verleihung 2012 verfolgten die Forscher des in Kalifornien ansässigen Annenberg Innovation Lab in Echtzeit, wie viele Zuschauer sich über Twitter gerade zu dem Anlass äussern. Es entstand eine Art Fieberkurve, an der sich der Verlauf der Veranstaltung ablesen lässt: Entblösst Angelina Jolie ihr Bein, so schnellt die Kurve in die Höhe und als klar wird, dass Meryl Streep ihren dritten Oskar gewinnt, erreicht sie ihren Höhepunkt.

Doch nicht nur die Zahl der Tweets interessiert die Forscher, auch die Haltung, die in den Texten steckt. So konnten sie nachweisen, dass die Hälfte der Zuschauer enttäuscht waren von der Wahl Streeps.

Reden ist Gold

Die Sentiment-Analyse verwandelt das Internet in eine Goldmine für die Meinungsforscher. Die Wissenschafter am Annenberg Innovation Lab etwa verfolgen und analysieren für zwei Hollywood Studios laufend die Twitter Nachrichten zu den aktuellen Film-Produktionen der beiden Studios.

Aus den Kurznachrichten geht hervor, wie heftig über einen Film diskutiert wird und ob die positiven oder negativen Meinungen überwiegen. So wird auch nachvollziehbar, wie sich eine Werbekampagne auswirkt. Beispiel: Zwei Tage nachdem Dreamworks 20 Millionen Dollar in eine TV-Werbekampagne für den Film «Arthur Christmas» gesteckt hat, wird aus den Tweets ersichtlich, dass die Kampagne ein Erfolg ist. Hatten sich zuvor etwa 80 Prozent negativ über den Film geäussert, so sind es danach weniger als 20 Prozent.

«Das ist erst der Anfang der Sentiment-Analyse. Sie wird in Zukunft das wesentliche Instrument für die Marketingleiter» sagt Jonathan Taplin, Direktor des Annenberg Innovation Lab. Er ist überzeugt, dass die Möglichkeiten der Sentiment-Analyse die Unterhaltungsindustrie revolutionieren werden: Sein Institut kann für jede TV-Sendung eine Fieberkurve zeichnen, aus der sich in Echtzeit die Einstellung der Zuschauer ablesen lässt wie in der Oskar-Nacht.

Web 2.0 bietet grosses Potential für Wissenschafter und Marketing-Spezialisten: Im Internet der sozialen Netzwerke und Foren kann sich jeder zu allem äussern, leistungsfähige Computer können in Echtzeit Stimmungen aus diesen Texten extrahieren. Der nächste Schritt: Berechnung von Prognosen aufgrund dieser Bestandsaufnahmen mit einer Genauigkeit, die bis jetzt unmöglich war.