[OPR] Habscheid & Hector & Hrncal & Waldecker: Intelligente Persönliche Assistenten mit Voice User Interfaces als ,Beteiligte‘ in häuslicher Alltagsinteraktion

Auf dieser Seite können Sie das Diskussionspapier zu der Einreichung für das Journal für Medienlinguistik im PDF-Format herunterladen. Das Blogstract fasst die Einreichung allgemein verständlich zusammen. Sie können das Diskussionspapier und das Blogstract unter diesem Beitrag kommentieren. Bitte benutzen Sie hierfür Ihren Klarnamen. Bei Detailanmerkungen zum Diskussionspapier beziehen Sie sich bitte auf die Zeilennummerierung des PDFs.


Zum Diskussionspapier (PDF)

Blogstract zu

Intelligente Persönliche Assistenten (IPA) mit Voice User Interfaces (VUI) als ,Beteiligte‘ in häuslicher Alltagsinteraktion. Welchen Aufschluss geben die Protokolldaten der Assistenzsysteme?

von Stephan Habscheid, Tim Moritz Hector, Christine Hrncal und David Waldecker

Stationäre Sprachassistenzsysteme, die als „Intelligente Persönliche Assistenten“ (IPA) fungieren sollen, sind in einer zunehmenden Zahl von Haushalten im Einsatz. Sie werden durch die Nutzer_innen mündlich über sog. „Voice User Interfaces“ bedient und sollen verschiedene Funktionen erfüllen: Dazu zählen – dem Zukunftsversprechen der Anbieter nach – u.a. Aufgaben, wie sie traditionell von Hauspersonal, Sekretariaten, Konversationspartner_innen und Überbringer_innen von Nachrichten übernommen wurden. Zudem sollen sich die Dialoge mit den Systemen perspektivisch mehr und mehr der „natürlichen“ sprachlichen Interaktion unter menschlichen Haushaltsmitgliedern annähern.

Um solche Aufgaben und Leistungen auf mündlichen Zuruf erbringen zu können, müssen IPA die Räume, in denen sie eingesetzt werden sollen, dauerhaft nach zu hörenden Geräuschen und Gesprächsbeiträgen „absuchen“. Wenn das Aktivierungswort (z.B. „Alexa“ oder „Siri“) fällt, verarbeitet der IPA die nachfolgenden Signale. Das dauerhafte „Scannen“ der Wohnung ist insofern einerseits erwünscht, um den Komfort einer Reaktion des IPA auf Zuruf nutzen zu können. Es ist andererseits aber auch umstritten, denn zur Erbringung von Leistungen werden die Daten durch die Hersteller verarbeitet und in die Logik ihrer Systemarchitekturen eingebettet. Dabei ist für die Endnutzer_innen nicht klar erkennbar, wie und zu welchen Zwecken die Daten verarbeitet werden und wie sich dadurch ihr Alltag unmerklich verändert. Welche Daten von den IPA aufgezeichnet werden und wie der IPA „reagiert“ hat, ist allerdings in einer zugehörigen Smartphone-App hinterlegt. Die Nutzer_innen können die Daten dort noch einmal anhören, Feedback an den Hersteller senden und die Daten auch, jedenfalls aus der Oberfläche der App, löschen.

In unserem Beitrag gehen wir der Frage nach, welchen Aufschluss diese „Protokolldaten“ über die Rolle von IPA im kommunikativen Alltag geben können: Wie sind die Mensch-Technik-Dialoge heute gestaltet? Wie sind sie mit laufenden Gesprächen unter den Nutzenden einerseits, mit der Plattform der Anbieter (z.B. Amazon) und der für IPA aufgebauten technischen Infrastruktur andererseits verwoben? Welchen Aufschluss geben die Aufzeichnungen darüber, wie im Dialog mit Sprachassistenten neue alltägliche Situationen entstehen?

Anhand der bisher durchgeführten Untersuchungen auf Basis von realen Protokolldaten, die uns Nutzer_innen von „Amazon Echo Dot“ mit Hilfe von Bildschirmvideos zur Verfügung gestellt haben, können wir zeigen, wie die Protokolldaten u.a. als Möglichkeit präsentiert werden, als Nutzer_in Einfluss auf die von Amazon gespeicherten Daten zu nehmen. Dabei ist in der App die Löschung der Daten, nicht aber ihr Export möglich. Die Daten können hier also lediglich der Kontrolle durch Amazon entzogen werden, sollen jedoch entsprechend dem Interface-Design nicht ohne weitere Umstände für andere Zwecke verwendet werden.

In medienlinguistischer Perspektive geben die Protokolldaten einen Einblick in die sprachlichen Nutzungsstrategien, den Umgang mit Störungen und die versuchte Bedienung der Geräte durch mehrere Personen gleichzeitig. Auch wenn hier bereits erste Schlussfolgerungen gezogen werden können, zeigt sich, dass für ein umfängliches Bild der Alltagspraxis auch einbezogen werden muss, was der IPA (vor und nach den an ihn gerichteten Kommandos) nicht aufgezeichnet hat. Ebenso sind längere Einheiten nur über die Protokolldaten nicht greifbar. Verschiedene Nutzungssituationen im Alltag können hingegen erfasst und klassifiziert werden. Auch zeigt sich, wie die Nutzer_innen das Gerät testen und „herausfordern“, um den Funktionsumfang und dessen Grenzen kennenzulernen.

Leave a Comment