Zum Inhalt springen

Stimmanalyse im Jahr 2018 Wenn eine Stimme sogar den Lohn verrät

Die Stimme wird als Eingabemittel immer wichtiger. Damit stellen sich ganz neue Fragen zur Privatsphäre.

Ein weisser HomePod von Apple.
Legende: Spracheingabe bei elektronischen Geräten wird immer wichtiger. Neu auch beim HomePod von Apple. Keystone

Unsere Stimme gebe eine riesengrosse Menge von Informationen über uns preis, weiss Rita Singh. Sie kennt sich aus: Singh forscht an der US-Universität Carnegie Mellon in Pittsburgh dazu, was sich dank des Einsatzes von künstlicher Intelligenz alles aus der Stimme erfahren lässt.

Rita Singh leitet die Machine Learning for Signal Processing Group an der US-Universität Carnegie Mellon in Pittsburgh. Sie sagt, das beste Mittel zum Schutz der Privatsphäre sei mehr Technologie: Algorithmen, die all die Informationen aus der Stimme entfernen, die für eine bestimmte Aufgabe nicht wirklich nötig sind.

Und dann setzt sie mit ruhiger Stimme an, all die Informationen aufzuzählen: Informationen über die Form des Gesichtes oder die Struktur des Skelettes, über die Grösse, das Gewicht, das Alter, ob jemand Medikamente nimmt oder krank ist – physisch oder psychisch.Dazu kommen Informationen über Verhaltensmerkmale einer Person: «Zum Beispiel wie dominant sie ist oder ob sie Führungsqualitäten hat. Informationen über den demographischen Hintergrund, über den Ausbildungsgrad und sogar darüber, wie viel jemand verdient», sagt Singh.

Und nicht nur über die Person, die spricht, soll die Stimme Auskunft geben, sondern auch über ihre Umgebung: Ob sich beispielsweise der Sprecher oder die Sprecherin in einem Raum befindet, wie gross dieser Raum ist, wie die Wände beschaffen sind und wie die Decke, was am Boden liegt. «Da gibt es sehr viele Informationen!», stellt die Computerwissenschaftlerin lachend fest.

In der Stimme stecken Informationen zur Grösse, zum Gewicht oder zum Alter einer Person. Aber auch dazu, ob jemand krank ist, wie dominant diese Person ist oder welche Führungsqualitäten sie hat.
Autor: Rita SinghComputer-Wissenschaftlerin

Allerdings: Noch ist die Technologie nicht so weit, um all diese Informationen tatsächlich zuverlässig aus der Stimme herauszulesen. Doch Rita Singh verspricht sich rasche Durchbrüche. Nicht zuletzt dank Fortschritten im Gebiet der künstlichen Intelligenz. Denn mit dieser Technik kann der Computer Informationen aus winzigen Tonfragmenten gewinnen, die nicht länger als ein Vierzigstel einer Sekunde dauern.

Rita Singh: «Ich würde die derzeitige Situation mit dem Stand der Genforschung in den 1980er-Jahren vergleichen. Bloss dass es bei uns noch schneller vorwärtsgehen wird als damals in diesem Feld, weil sich viel mehr Leute mit der Forschung zur künstlichen Intelligenz beschäftigen.»

Ein Amazon-Echo-Dot-Lautsprecher.
Legende: Amazon will keine Stellung nehmen zur Frage, wie Stimmen der Benutzer heute und in Zukunft ausgewertet werden. Keystone

Neuen Möglichkeiten schaffen auch neue Probleme. Denn unsere Stimme wird immer öfter aufgezeichnet – sei es an Hotlines von Telefonanbietern oder Banken, bei Sprachassistenten auf dem Smartphone oder bei intelligenten Lautsprechern wie Google Home, Amazon Echo und neu dem Home Pod von Apple. Die Hersteller dieser Produkte hätten die Möglichkeit, unsere Stimme auf ihren Servern zu speichern, auszuwerten und so detaillierte Benutzerprofile zu erstellen.

Die einzelnen Anbieter gehen mit diesen Möglichkeiten ganz unterschiedlich um: «Bei der Swisscom dient die Stimme ausschliesslich zur Identifikation der Kunden. Es werden keine Daten gespeichert oder zu Profilen verarbeitet», sagt Pressesprecherin Sabrina Hubacher. Auch Apple rühmt sich, Nutzerdaten höchstens in anonymisierter Form auf den eigenen Servern zu speichern.

Amazon dagegen will auf die Anfrage, wie die Stimmen der Benutzerinnen und Benutzer heute und in Zukunft ausgewertet werden, keine Stellung nehmen. Und bei Google heisst es, dass heute keine solchen Auswertungen gemacht werden. Über die Zukunft lasse sich nicht spekulieren.

Was die rechtlichen Bestimmungen angeht, ist die Lage in der Schweiz klar. Auch nach einem Hinweis, dass die Stimme aufgezeichnet wird, ist eine spätere, heimliche Analyse dieser Daten nicht erlaubt. «Eine weitergehende Analyse mit künstlicher Intelligenz ist selbstverständlich durch das Datenschutzgesetz untersagt», erklärt der eidgenössische Datenschutzbeauftragte Adrian Lobsiger.

Das heimliche Auswerten der Stimme ist in der Schweiz verboten.
Autor: Adrian LobsigerEidgenössischer Datenschutzbeauftragter

Wenn schon, dann müssten die Benutzerinnen und Benutzer genau darüber aufgeklärt werden, dass ihre Stimme ausgewertet wird, zu welchem Zweck das geschieht und mit welchen Mitteln. Sogar wie die künstliche Intelligenz funktioniert, die dabei eingesetzt wird, und weshalb sie zu welchen Schlüssen kommt, müsse offen liegen. Und selbst da wäre Adrian Lobsiger sehr zurückhaltend, eine solche Praktik zu erlauben.

Ein Portrait Adrian Lobsiger.
Legende: Der eidgenössische Datenschutzbeauftragte Adrian Lobsiger will nicht so leicht grünes Licht für Stimmanalysen geben. Keystone

Die Computer-Wissenschaftlerin Rita Singh hat noch eine andere Idee, wie mit dem Problem umzugehen: «Mehr Technologie!» Nämlich Algorithmen, die alle Informationen aus der Stimme herausfiltern, die für die Steuerung eines Gerätes oder die Übermittlung einer Nachricht nicht wirklich notwendig sind.

Noch seien diese Algorithmen zu langsam, um kommerziell eingesetzt zu werden. Aber wenn die Technik einmal so weit sei, dann müssten wir uns um unsere Privatsphäre bei der Sprachsteuerung von Apps und elektronischen Geräten keine Sorgen mehr machen.

Keine wichtigen News verpassen

Erhalten Sie die wichtigsten Nachrichten per Browser-Push-Mitteilungen.

Push-Benachrichtigungen sind kurze Hinweise auf Ihrem Bildschirm mit den wichtigsten Nachrichten - unabhängig davon, ob srf.ch gerade geöffnet ist oder nicht. Klicken Sie auf einen der Hinweise, so gelangen Sie zum entsprechenden Artikel. Sie können diese Mitteilungen jederzeit wieder deaktivieren.

14 Kommentare

Navigation aufklappen Navigation zuklappen

Sie sind angemeldet als Who ? (whoareyou) (abmelden)

Kommentarfunktion deaktiviert

Uns ist es wichtig, Kommentare möglichst schnell zu sichten und freizugeben. Deshalb ist das Kommentieren bei älteren Artikeln und Sendungen nicht mehr möglich.

  • Kommentar von Thomas Käppeli (Tokapi GT)
    Auch Wissenschaftlern geht manchmal die Phantasie durch. Aus Klangbildern lässt sich tatsächlich viel herauslesen. Der Informationsgehalt steht aber in Relation zur Bandbreite der erfassten Frequenzen. So lag z.B. der Frequenzbereich bei analoger Telephonie bei lausigen 300 bis 3400 Hz. Zur Sprachübermittlung ausreichend. Für den Traum von Rita Singh, braucht es mindestens Tonaufzeichnungen in Studio Qualität. Da sind schon die Mikrophönchen der Massenelektronik noch weit davon entfernt ;-)
    Ablehnen den Kommentar ablehnen
  • Kommentar von René Balli (René Balli)
    Stimmen stimmen!
    Ablehnen den Kommentar ablehnen
  • Kommentar von Thomas Heimberg (tomfly)
    Noch was: Auch der Raum in dem ich mich befinde, soll Auskunft über mich geben. Mein Wohnzimmer ist ziemlich spärlich möbliert, mein Studio ist aber voll gepackt mit Möbel, Bücher, Zeitschriften, Krimskrams. Im ersten Fall wird dann der Computer analysieren, dass ich arm oder phantasielos bin und im zweiten Fall reich oder ein Messy? So ein Quatsch, was da immer wieder von der Digitalgilde erfunden wird. Gibt es noch Menschen, die irgendwie noch normal sind, oder sind alle der "App" verfallen?
    Ablehnen den Kommentar ablehnen