Dienstag, 8. Dezember 2020

# 269 - Wer spricht denn da? Wir sind von immer mehr Algorithmen umgeben

Seit den 1950-er Jahren wird versucht, der menschlichen Sprache mit technischen Mitteln möglichst nahe zu kommen. Aber Sprache ist eben nicht nur der Austausch von Worten unter Verwendung der korrekten Grammatik. Menschliche Kommunikation setzt darüber hinaus eine Art Weltverständnis voraus, das Wissen um Hintergründe und Zusammenhänge. Der Autor und Journalist Christoph Drösser hat sich nicht nur Siri, Alexa & Co. angeschaut, sondern in seinem Buch Wenn die Dinge mit uns reden einen Ausblick auf die zu erwartende Weiterentwicklung der Kommunikation zwischen Mensch und Maschine gegeben.

Auch wer selbst keine "Alexa" in seinem Wohnzimmer hat, weiß, was der Sprachassistent kann: Er ist in Lautsprecher integriert und kann zahlreiche Smart Home-Geräte steuern. Alexa gehört zu den KI-Anwendungen, also zu dem, was heute unter "Künstlicher Intelligenz" verstanden wird. Mit einer mittlerweile sehr menschenähnlichen Stimme lauert die Software auf ihr Stichwort, das ihr signalisiert, dass ihr Nutzer etwas von ihr möchte: den aktuellen Wetterbericht, die Lieblingsmusik oder eine Lexikoninformation. Erweitert man das Grundgerät mit smarten Geräten, können per Sprachbefehl Saugroboter bedient, Heizkörper reguliert oder Türen geöffnet werden. Der Erfolg dieses und anderer Sprachassistenten beruht auf der Bequemlichkeit der Käufer: Viele alltägliche Dinge lassen sich mit der Stimme erledigen, sich wegen banalen Tätigkeiten aus dem Sofa hochzuquälen kann vermieden werden. 

Klar, dass das nur funktioniert, wenn die entsprechenden Geräte ununterbrochen online sind. Sie schicken alle Daten in eine Cloud und erhalten von dort Daten zurück. So "lernt" der Algorithmus ständig dazu - und dadurch, dass Mitarbeiter irgendwo auf der Welt mithören, was bei den Kunden passiert. Auf diese Weise soll der Grad der Perfektionierung weiter vorangetrieben werden.

Aber dieser Typus von Sprachprogrammen ist natürlich noch lange nicht der Weisheit letzter Schluss. Das Ziel ist ein Algorithmus, der sich am Sprachverständnis des Menschen orientiert und das möglichst so gut, dass er menschliche (Sprach-)Züge annimmt und als dessen Gesprächspartner agieren kann - und nicht bloß als auf der Reiz-Reaktion-Ebene verharrt. Bei aller Technikbegeisterung, die Christoph Drösser seinen Lesern vermittelt, mischt sich an dieser Stelle eine gehörige Portion Skepsis in seine Ausführungen. Insbesondere dann, wenn es um die Entwicklung von Sprachmodellen geht, die mit Deep Learning arbeiten und sich dazu eignen, einige Dinge in der Wirtschaft und der Gesellschaft umzukrempeln.

Das amerikanische Forschungsunternehmen OpenAI hat mit Generative Pre-trained Transformer 3 - oder kurz GPT-3 - ein solches Modell entwickelt. GPT-3 befindet sich seit Juli 2020 im Betatest und hat mit 175 Milliarden maschinellen Lernparametern das bislang führende Produkt Turing NLG von Microsoft, das erst im Februar 2020 eingeführt worden ist, mit seiner mehr als zehnfachen Kapazität überrundet.

GPT-3 ist zunächst einmal ein Textgenerator, der nicht versteht, was er schreibt. Das ist für Menschen jedoch kein Grund, sich beruhigt zurückzulehnen. Die Sprache ist zwar nicht identisch mit der eines Menschen und auch die Sinnhaftigkeit mancher von GPT-3 erstellter Texte lässt zu wünschen übrig. Das Sprachmodell eignet sich aber bestens für den Einsatz als Chatbot, für das Schreiben von Hausarbeiten im Grundstudium - und leider auch für die Verbreitung von Fake News, die vom durchschnittlichen Leser nicht mehr von wahren Meldungen unterschieden werden können, weil das Modell seinen Schreibstil an den von tatsächlich existierenden Schreibern wie z. B. bestimmten Zeitungsjournalisten anlehnen kann. Nicht zuletzt ist zu erwarten, dass durch den Einsatz von GPT-3 Menschen arbeitslos werden, die ihr Geld bislang mit dem Schreiben von Texten verdient haben. Wie bei allen Neuerungen hat die Medaille auch hier zwei Seiten.

Was Wenn die Dinge mit uns reden von zahlreichen anderen Sachbüchern unterscheidet, ist die Heranziehung von Fachkompetenz durch Interviews: Drösser befragt u. a. den Experten für KI und Sprachverarbeitung Richard Socher und die Stanford-Professorin Monica Lam, die mit ihrem Team das Open-Source-System Almond entwickelt hat, das in Konkurrenz zu Alexa und Siri treten soll.

Lesen?

Wer sich mit Sprachassistenz und -modellen bereits beschäftigt hat, wird in Christoph Drössers Buch auch Bekanntes antreffen. Aber jedem, der sich hierfür interessiert, kann der Titel empfohlen werden, weil sich der Autor und seine Interviewpartner dem Thema von verschiedenen Blickwinkeln aus annähern. Die Sorge, vor lauter Fachbegriffen nicht zu verstehen, worum es geht, ist unbegründet: Drösser schreibt so, dass ihm auch Techniklaien folgen können.

Wem der Name des Autors bekannt vorkommt, hat von ihm möglicherweise schon Artikel in der Wochenzeitschrift DIE ZEIT gelesen. Drösser war dort lange Redakteur und hat das Ressort "ZEIT-Wissen" gegründet. Etliche Jahre hat er außerdem in der Kolumne "Stimmt's?" Fragen von Lesern beantwortet wie z. B. Verhindert ein Löffel im Flaschenhals, dass Sekt über Nacht schal wird? (Antwort: Nein, von ihm natürlich ausführlich begründet.)

Wenn die Dinge mit uns reden ist 2020 im Dudenverlag erschienen und kostet als Klappenbroschur 16 Euro sowie als E-Book 13,99 Euro.

Keine Kommentare:

Kommentar veröffentlichen