Wie die Analyse von Sprachaufnahmen unsere Privatheit bedroht

Internetfähige Geräte wie Smartphones, Smartwatches, Laptops und Smart Speakers sind im modernen Leben allgegenwärtig geworden und dringen immer tiefer in unsere Privatsphäre vor. Zu den Sensoren, die in solchen Geräten am häufigsten zu finden sind, gehören Mikrofone.

Zusammen mit zwei Kollegen hat unser Doktorand Jacob Kröger untersucht, welche sensiblen persönlichen Informationen sich mithilfe moderner Analysemethoden aus Sprachaufnahmen ableiten lassen. Während andere Datenschutzbedenken hinsichtlich mobiler Geräte in Forschung und der öffentlichen Debatte bereits intensiv beleuchtet werden, fand diese Gefahr bisher kaum Berücksichtigung.

Die drei Forscher vom Weizenbaum-Institut und der TU Berlin haben viele Patente, experimentelle Forschungsergebnisse und Informationsmaterialien zu existierenden Produkten durchforstet, um gemeinsam eine Frage zu beantworten: Welche Informationen lassen sich, basierend auf ihrer Ausdrucksweise und dem Klang der Stimme, über eine Person in einer Sprachaufnahme ableiten?

Ihre Studie veröffentlichten die Forscher kürzlich in dem Artikel “Privacy Implications of Voice and Speech Analysis – Information Disclosure by Inference“. Die Grafik unten (dem Buchkapitel entnommen, daher auf Englisch) gibt einen Überblick über die wesentlichsten Ergebnisse.

Grafik: Überblick über sensible Informationen, die aus Sprachaufnahmen abgeleitet werden können

Abgesehen vom Inhalt des Gesagten können über die Stimmen und Ausdrucksweisen der sprechenden Person in einer Sprachaufnahme implizit eine Fülle persönlicher Informationen abgeleitet werden so z.B. über biometrische Identität, körperliche Merkmale, geografische Herkunft, Emotionen, Alkoholkonsum, Alter, Geschlecht, körperliche und psychische Gesundheit und sogar den sozioökonomischen Status der jeweiligen Person.

Gerade mit Hinblick auf die rasante Verbreitung von Sprachassistenten wie Amazon Alexa und Apple’s Siri ergeben sich aus diesen Ergebnissen wichtige gesellschaftliche Implikationen, welche die Forscher in ihrem Artikel diskutieren.

Publikation (hier zum Download verfügbar)

Kröger, J.L. and Lutz, O.HM. and Raschke, P. (2020). Privacy Implications of Voice and Speech Analysis – Information Disclosure by Inference. In: Friedewald M., Önen M., Lievens E., Krenn S., Fricker S. (eds) Privacy and Identity Management. Data for Better Living: AI and Privacy. Springer International Publishing, 242–258.
download PDF