Der digitale Patient“ will sich in einer Debattenreihe den Möglichkeiten und Grenzen von Big Data im Gesundheitswesen konstruktiv nähern. Unser Blog fungiert dabei als Plattform, wir lassen hier Experten aus den verschieden Bereichen zu Wort kommen. Während Prof. Martin Dugas im vorigen Beitrag über die bessere Nutzung von Daten, Transparenz bei medizinischen Formularen und effektive Forschung, um dem Versprechen von Smart Medicine gerecht zu werden, geschrieben hat, bloggt Jan-Keno Janssen über die Notwendigkeit, mehr Transparenz über den Ursprung des Rohmaterials für Big Data im Gesundheitswesen herzustellen.


„Daten sind das neue Gold“ – das ist eine Weisheit, die man sich auf Konferenzen immer mal wieder zuraunt. Es gibt aber einen ziemlich großen Unterschied: Anders als Gold vermehren sich die Daten permanent. So haben wir in den letzten zwei Jahren mehr Daten produziert als in der gesamten Menschheitsgeschichte davor. Vieles passiert bewusst (zum Beispiel senden die Benutzer von Facebook und WhatsApp 41,6 Millionen Nachrichten pro Minute), vieles aber auch unbewusst: Wissen Sie auf Anhieb, welchen Smartphone-Apps sie den Zugriff auf ihren Standort erlaubt haben? Auch ohne eine einzige installierte App hinterlassen Sie eine dicke Datenspur: Ihr Mobilfunkprovider weiß zum Beispiel jederzeit, in welchen Funkstationen sie gerade eingebucht sind — und kann so einen relativ präzisen Standortverlauf speichern. Ihr Fernseher protokolliert, welche Sendungen sie schauen. Und womöglich speichert sogar ihr „smarter“ Rauchmelder, wann sie zuhause sind.

Aus dem immer höheren Datenhaufen lassen sich freilich nützliche Dinge herausdestillieren. So musste die medizinische Forschung bislang häufig mit viel zu kleinen Probanden-Gruppen arbeiten – heute können die Wissenschaftler auf riesige anonymisierte Datenpools zugreifen, die zum Beispiel von Fitnessarmbändern generiert werden.

Niemand weiß genau, welche Geräte welche Daten erheben

Problematisch allerdings: Die Fitnessarmbänder-Träger haben keine hundertprozentige Garantie, dass ihre Daten wirklich anonym bleiben — oder ob sie am Ende mit ein bisschen Big-Data-Zauberei nicht doch identifiziert werden können. Ein Beispiel: Der Fitness-Armbandhersteller hat die Daten ordnungsgemäß anonymisiert und alle Namen durch willkürliche Zeichenketten ersetzt. Nun werden die Daten verkauft. Der Käufer hat sich aber nicht nur mit den Fitnessdaten eingedeckt, sondern auch mit Bewegungsdaten von Mobilfunkprovidern (die zum Beispiel für Stau-Vorhersagen verkauft werden). Nun muss man nur noch Social-Media-Posts nach freiwilligen Standort-Daten durchwühlen — und schon lassen sich aus den drei Datenquellen gruselig detaillierte und vor allem personalisierte Bewegungsprofile zusammenbauen. Wenn Sie sich jetzt fragen, ob das denn so schlimm sei: Würden Sie wollen, dass ihr Arbeitgeber weiß, wie lange Sie gestern geschlafen haben? Wie hoch Ihr Blutalkoholspiegel am letzten Wochenende war?

So wie jede Technik ist auch Big Data nicht inhärent böse oder gefährlich. Das Problem liegt in der fehlenden Transparenz: Niemand weiß genau, welche Geräte und Apps welche Daten erheben. Und: Niemand kann zweifelsfrei sagen, wo welche persönliche Daten lagern. Zwar gibt es in Deutschland eine Auskunftspflicht — die ist aber sinnlos, wenn man nicht weiß, wo man anfragen muss.

Mehr Transparenz über Rohdaten

Wir generieren immer mehr Daten, die auf immer mehr Servern bei immer mehr Firmen landen. Diese Daten, oft hinter unserem Rücken gesammelt, werden für Analysen genutzt, die dramatische Auswirkungen auf unser Leben haben können. Algorithmen ermitteln längst unsere Kreditwürdigkeit, bald entscheiden sie wahrscheinlich über unsere berufliche Eignung und über unseren Krankenkassenbeitrag. Die Big-Data-Unternehmen werden uns das als großen Fortschritt in Sachen Gerechtigkeit verkaufen — schließlich kommen die Ergebnisse durch vermeintlich objektive Berechnungen zustande statt durch schnöde Intuition. Was die Unternehmen uns nicht sagen: Dass die Algorithmen mit Rohdaten arbeiten, von denen wir häufig gar nicht wissen, dass sie überhaupt existieren. Wir brauchen deshalb dringend mehr Transparenz.


Im nächsten Beitrag wird Artur Olesch  über den zukünftigen Beitrag von Big Data zu einem Paradigmenwechsel von einer Interventionsmedizin hin zu einer Präventivmedizin bloggen.

Abonnieren Sie jetzt unseren Newsletter, um über neue Blog-Beiträge per E-Mail informiert zu werden.


Alle Artikel der Debattenreihe Big Data anzeigen