Zum Inhalt springen

Header

Inhalt

Netzwelt Warum unsere Smartphones mehr Sprachen lernen müssen

Handys, PCs und Navigeräte von morgen verstehen uns aufs Wort – vorausgesetzt, sie sprechen unsere Sprache. Doch das trifft nur auf vier Prozent aller Sprachen zu, allen anderen droht der digitale Tod. Wie Europa seine Sprachvielfalt ins digitale Zeitalter retten will.

Das Computerprogramm, auf dem ich diese Zeilen geschrieben habe, kennt Sprachen, von denen ich noch nie gehört habe: Fulfulde, Haussa oder Mapudungun. Wikipedia gibt’s in fast allen der 80 europäischen Sprachen, darunter Baskisch, Walisisch, Schottisch-Gälisch oder Okzitanisch. Insgesamt gibt es Wikipedia in 286 Sprachen. Und Google Translate übersetzt mir – um in Europa zu bleiben – vom Galizischen ins Bosnische.

Kunterbunte Sprachvielfalt im Internet also? Schön wär’s: Aktuelle Studien zeichnen ein düsteres Bild. Der ungarische Mathematik-Linguist András Kornai warnt unter dem bedrohlichen Titel «Digital Language Death», dass nur rund 300 der weltweit 7000 Sprachen im Internet überleben werden – im besten Fall. Das sind 4 Prozent. Auch die meisten europäischen Sprachen sind digital schlecht aufgestellt oder gar inexistent. Das europäische Forschungsnetzwerk META-NET überprüfte 30 Sprachen, 21 von ihnen sind – Stand heute – in der digitalen Welt nicht überlebensfähig.

Nur wenige Sprachen werden gut unterstützt

Forschungsnetzwerk META-NET

Box aufklappen Box zuklappen

Führende europäische Sprachtechnologie-Experten schlossen sich im Forschungsnetzwerk META-NET zusammen. Es deckt heute 34 Länder ab – neben der EU sind auch Forscher aus der Schweiz, Türkei, Norwegen oder Island dabei. In den «White Paper Series» untersuchte META-NET die digitale Zukunftsfähigkeit von 30 der 80 europäischen Sprachen.

Georg Rehm ist Computerlinguist am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Berlin und Netzwerkmanager von META-NET. Er sagt: «Wir haben in Europa die Situation, dass einige wenige Sprachen technologisch gut unterstützt werden: Englisch, Französisch, Spanisch, das Deutsche schon mit Abstrichen. Und sehr viele Sprachen, die schlecht oder im schlimmsten Fall gar nicht unterstützt werden.» Besonders gefährdet sind laut META-NET etwa Isländisch, Litauisch, Maltesisch, Griechisch, Polnisch oder Ungarisch.

Um auf die Anfangsbeispiele zurückzukommen: Bei Wikipedia gibt es einige wenige Sprachen mit sehr vielen Artikeln. Die meisten auf Englisch, gefolgt von Niederländisch und Deutsch. Und dann gibt es ganz viele Wikipedien mit verhältnismässig wenigen Artikeln – die Baskin oder die Litauin findet zwar ihre Muttersprache, wird aber für viele Artikel gezwungen, auf eine andere Sprache wechseln.

Kleine Sprachen bleiben auf der Strecke

Der verstorbene Steve Jobs bei der Präsentation eines iPhones.
Legende: Das iPhone kennt nicht alle Sprachen. Flickr/Erik Pitti

Neue Computertechnologien basieren immer häufiger auf Sprache: automatische Übersetzungsprogramme, die Stimme im Navigerät oder sprachgesteuerte Assistenten, wie wir sie von unseren Smartphones kennen – die nächste Technologiegeneration versteht uns aufs Wort. Theoretisch jedenfalls.

Ein Beispiel ist Siri beim iPhone, das auf Befehl einen Termin erfasst oder mir die SMS vorliest. Kroatisch oder Isländisch beherrscht Siri nicht. Wenn Unternehmen wie Google, Apple oder IBM grosse Summen in Sprachtechnologie investieren, bleiben kleine Sprachen auf der Strecke.

«Es gibt eine Reihe von Sprachen in Europa, die oftmals nicht bekannt sind, und die auch nur wenige Sprecher haben, teilweise im fünf- oder sechsstelligen Bereich. Das Bestreben von Firmen ist da relativ gering, aufwendige Sprachtechnologien für das Maltesische oder für das Isländische zu bauen», so Georg Rehm. Daher müsse an dieser Stelle die Europäische Union helfen – nicht nur für die 24 offiziellen Sprachen, sondern auch für Nischensprachen wie Galizisch, Baskisch oder Isländisch.

Das kulturelle Erbe bewahren

Forschungsprogramme

Box aufklappen Box zuklappen

«Horizon 2020» ist ein EU-Förderprogramm für Forschung und Innovation, das für 2014 bis 2020 über 80 Milliarden Euro beinhaltet – auch für Forschungsprojekte zu Sprachtechnologie. «Connecting Europe Facility» ist die digitale Agenda für Europa – darin spielen maschinelle Übersetzungsverfahren eine wichtige Rolle.

Der Schutz von Minderheiten ist in Europa historisch begründet – ein Beispiel sind die baltischen Staaten, die sehr lange auch in sprachlicher Hinsicht unterdrückt waren – Russisch wurde ihnen aufgedrückt und die eigene Muttersprache verboten. «Es wäre ein sehr uneuropäischer Gedanke, einer Sprache den Vorzug zu geben und sie zur dominierenden Sprache zu machen», so Georg Rehm.

Im Gegensatz zu den mehrheitlich monolingualen USA kennt Europa etwa 80 Sprachen. Dieses kulturelle Erbe gelte es zu bewahren und zu erweitern, so Rehm: «Wir müssen dafür sorgen, dass unsere Sprachen digital fit werden.» Ebenso wie die Grenzen sollen in Europa auch die Sprachbarrieren fallen – nicht, indem man sich auf eine Sprache einigt, sondern indem man die verschiedenen Sprachen fit macht für die Zukunftstechnologien wie maschinelle Übersetzungstools.

Die Infrastrukturen schaffen

Was tun, damit in Zukunft der Bordcomputer im Auto Maltesisch spricht? Damit die Griechin mühelos eine slowenische Website lesen kann? Die grosse Herausforderung wird nun sein, die sprachtechnologischen Grundlage für diese Sprachen zu schaffen. Solche Software ist auf riesige Datenmengen angewiesen, diese Basis fehlt für kleine Sprachen noch.

Im EU-Rahmenprogramm «Horizon 2020» für Forschung und Innovation etwa ist auch der Bereich Sprachtechnologie vertreten. Und in der Initiative «Connecting Europe Facility» (siehe Box), die Europa mit neuer Infrastruktur stärker verbinden will, gibt’s auch eine digitale Komponente. Es ist einiges in Gang, doch für die wirklich grossen Durchbrüche scheint das Geld zu fehlen. Ein Erfolg sei, dass jetzt kleine Sprachen bevorzugt würden, es sollen Technologien speziell für diese kleinen Sprachen erforscht werden. «Das Thema ist im Mainstream angekommen, aber die Erforschung und Entwicklung dieser Technologien ist sowohl aufwendig als auch teuer, so dass mehr Investitionen notwendig werden», so Georg Rehm.

Und wie steht es nun ums Deutsch? Die Sprache ist im Internet relativ stark vertreten und «entgegen aller Unkenrufe nicht in Gefahr», schreibt META-NET als Fazit der oben genannten Studie. Auch im digitalen Raum und im Umgang mit der Technologie werde sie derzeit noch nicht vom Englischen verdrängt. Doch auch hier: «Das kann sich sehr schnell ändern, wenn die Technologie in Kürze die menschliche Sprache beherrscht.»

Meistgelesene Artikel