Big Data – das große Versprechen der neuen digitalisierten Welt
Im Informationszeitalter ist Big Data ein Schlüsselbegriff. In ihm spiegeln sich die Chancen und Risiken einer digitalen Gesellschaft wie im Brennglas. Dass die Nutzung und Auswertung von Massendaten nahezu alle Bereiche des Lebens durchdringt, steht längst außer Frage. Auch das Gesundheitswesen steht vor einer umfassenden Digitalisierung.
Rund 100 Millionen Einträge spuckt die Suchmaschine in Sekundenbruchteilen aus, wenn man den Begriff Big Data eingibt. Wofür steht dieser Begriff? „Big Data“ hat meist zwei Bedeutungen. Der Begriff benennt ein Problem, nämlich die stetig anwachsende Flut von Daten, die längst jede menschliche Vorstellung übersteigt und herkömmliche Analyseverfahren überfordert (Klein). Der Begriff steht aber auch gleichzeitig für die Lösung dieses Problems. Denn wer Big Data sagt, meint auch diejenigen Techniken und analytischen Methoden, welche diese Datenflut erfassen, auswerten und speichern können.
Schillernde Ambivalenz
Der Begriff selbst ist relativ jung. 2008 erobert er den Titel des Wissenschaftsmagazins „Nature“. Denn er verweist auf ein drängendes Problem der Forschung: In vielen Disziplinen sprengen die in Versuchen und Simulationen erzeugten Datenmengen alle zuvor gekannten und beherrschbaren Größenordnungen. Zwei Jahre später schon thematisiert das Wirtschaftsblatt „The Economist“ die Datenflut in ihren wirtschaftlichen Auswirkungen und beschreibt deren Chancen und Herausforderungen.
In seiner Stellungnahme “Big Data und Gesundheit – Datensouveränität als informationelle Freiheitsgestaltung“ verwendet der Deutsche Ethikrat eine „Arbeitsdefinition“. Das Gremium zieht damit aus der internationalen Diskussion und der Erkenntnis, dass es keine einheitliche Begriffsbestimmung gibt (vgl. de Mauro), nicht nur einen eigenen Schluss. Sondern es schreibt Big Data eine weitere Eigenschaft zu, die auch und gerade im Bereich der Gesundheit wichtig ist: die der Möglichkeit zur neuen Verknüpfung:
„Big Data ist der Umgang mit großen Datenmengen, der darauf abzielt, Muster zu erkennen und daraus neue Einsichten zu gewinnen, und der hierzu angesichts der Fülle und Vielfalt der Daten sowie der Geschwindigkeit, mit der sie erfasst, analysiert und neu verknüpft werden, innovative, kontinuierlich weiterentwickelte informationstechnologische Ansätze nutzt.“ (Deutscher Ethikrat, 2017, S. 36)
Plötzlich können alle Daten gesundheitsrelevant werden
Gut drei Jahre ist es her, da behauptete die deutsche Hochschulmedizin (Positionspapier IT-Lösungen, S. 2), dass auf den Gesundheitsbereich künftig ein „Drittel der weltweit erhobenen und austauschbaren Daten“ entfallen. Jetzt setzt der Ethikrat noch eines drauf: Zur Logik von Big Data gehöre es, personenbezogene Daten aus einer immer größeren Zahl von Quellen ständig neu zu kombinieren, sodass nahezu alles gesundheitsrelevant werden kann, auch Daten sogenannter Wearables, Sensoren oder Äußerungen in sozialen Medien (Deutscher Ethikrat, 2017, S. 4ff., 54).
Big Data speisen sich im Gesundheitsbereich aus einer Vielzahl von Quellen: klinischen oder (Kohorten-) Studien, elektronischen Patientenakten (die in Deutschland immer noch in Entwicklung sind, aber bereits von Privatfirmen angeboten werden), Registern, Biobanken sowie den durch Hochdurchsatztechnologien erzeugten ‚Panomics’. Wohin diese Entwicklung führt, lässt sich schon heute an der UK Biobank absehen. Dort werden 2020 die Genome einer halben Million Briten öffentlich gemacht. Bereits jetzt zahlen Pharma-Firmen für die Nutzung dieser Big Data und versprechen sich davon einen Schub in der Arzneimittel-Entwicklung und für die biologische Forschung. (Technology Review, 08.01.2018).
IT-Größen nehmen Gesundheitsgeschäft ins Visier
Noch allerdings fehlen die infrastrukturellen Voraussetzungen in vielen Bereichen des Gesundheitswesens für eine systematische Nutzung von Big Data, um gesundheitsrelevante Daten wie die von EKG, Blutwerten, Bildern, Abrechnungen oder -omics-Daten von allen Patientinnen und Patienten einer Klinik oder Krankenhauskette zusammenzufassen, zu analysieren und auszuwerten.
Hinzu kommen im Zeitalter einer nahezu alle Lebensbereiche durchdringenden Digitalisierung Daten, die von Internet- und Mobilfunk-Unternehmen gewonnen werden, Daten, die in wissenschaftlichen Publikationen veröffentlicht wurden, sowie des Weiteren Daten, die in einer ärztlichen Umgebung oder mit ärztlicher Begleitung und mit Medizingeräten aufgenommen wurden, und schließlich Daten von ‚Wearables‘ und ähnlichen Geräten zur Selbstvermessung. Dass sich IT-Unternehmen wie Alphabet, der Mutterkonzern von Google, vom Geschäft mit Gesundheitsdaten viel versprechen, zeigt das dichte Geflecht von Beteiligungen, Investitionen, Forschungsprojekten und Kooperationen (Gigerenzer, 2016, S. 34f.) im Gesundheitsbereich.
Die intelligente Verknüpfung dieser Daten wird, so die Hoffnung, das medizinische Wissen in Zukunft deutlich erhöhen und absichern. Mit Methoden der Wissensmodellierung, des maschinellen Lernens und Cognitive Computing können Rechner selbstständig neues Wissen aus diesen Daten generieren (vgl. "Mit Klassifikatoren und multimodaler Datenfusion Big Data Sinnvolles entlocken"). Aus deren Integration und Analyse erhoffen sich die Akteure des Gesundheitswesens, bislang unerkannt gebliebene neue Muster zu erkennen und daraus neue Einsichten respektive Entscheidungshilfen zu gewinnen. Damit ergeben sich Chancen für verbesserte Diagnostik (z. B. Panomics-getriebene Identifizierung von Biomarkern), Therapie, Vorsorge und Kostensenkung.
Onkologie ist Vorreiter der Big-Data-Nutzung
Unter dem Stichwort Präzisionsmedizin, individualisierte resp. stratifizierte Medizin werden bereits heute, vor allem in der Onkologie, Big Data aus der Forschung mit einer Vielzahl klinischer Daten zusammengeführt (acatech, 48f.). Davon erhofft man sich genauere Diagnosen und auf das molekulare Patientenprofil zugeschnittene personalisierte Therapien (vgl. "Mit Big Data genauer therapieren"). Dafür jedoch müssen in Uniklinika erst die Voraussetzungen geschaffen werden, sowohl für Patienten als Datengeber wie auch für (nicht-)medizinische Forscher. Mit den „Eckpunkten für eine Heidelberger Praxis der Genomsequenzierung“ (Marsilius-Kolleg der Universität Heidelberg und EURAT-Gruppe, 2013) haben sich die Heidelberger Forscher von Universität und DKFZ einer Art Selbstregulierung im Big-Data-Zeitalter unterworfen, die das Patientenwohl, die Forschungsfreiheit und den klinischen Fortschritt auszutarieren versucht.
Die Nutzung von Big Data im Gesundheitswesen erstreckt sich auf eine Vielzahl von Akteuren mit teilweise sich widersprechenden Interessen (Deutscher Ethikrat, 2017, S. 11). Die biomedizinische Forschung erhofft sich dadurch ein besseres Verständnis wissenschaftlich relevanter Zusammenhänge und Prozesse durch bildgebende und molekularbiologische Verfahren. Die Gesundheitsversorgung (sog. erster Markt) erwartet sich vom Big-Data-Einsatz stärker personalisierte Behandlungen und bessere Effektivität und Effizienz, Versicherer und Arbeitgeber präzise Profile einzelner Personen und Personengruppen. Global agierende IT- und Internetfirmen (sog. zweiter Markt) erstreben eine wachsende kommerzielle Verwertung durch die Verknüpfung und Analyse gesundheitsrelevanter Daten mit zahlreichen anderen Informationen. Betroffene bzw. Patienten schließlich erwarten durch die wachsende Selbstvermessung relevante Informationen zu einem gesundheitsbewussten Lebensstil und für ihr persönliches Wohlergehen (nach Deutscher Ethikrat, 2017, S. 11ff.)
Droht ein Angriff auf die evidenzbasierte Medizin?
All diesen Chancen bei der Nutzung von Big Data stehen im selben Maße Risiken (Dual Use) gegenüber. Im hochsensiblen Gesundheitsbereich sehen Experten das traditionelle Datenschutzrecht, gerade im Blick auf den Patienten, für den wachsenden Umgang und die Nutzung von Big Data überfordert. Nicht wenige Stimmen (vgl. "Mehr Daten bedeutet nicht automatisch mehr Information") warnen vor der Gefahr, Korrelationen und Datenmuster an die Stelle von Theorien und Gesetzen zu setzen, sich vom Goldstandard evidenzbasierter Medizin klammheimlich zu verabschieden und die Korrelation über die Kausalität zu stellen (z. B. Wissenschaftstheoretiker wie Prof. Klaus Mainzer, 2015). „Big Data bleibt (...) ergänzungs- und kontrollbedürftig“ (Deutscher Ethikrat, 2017, Vorsitzender Prof. Steffen Augsberg, PK Ethikrat, 30.11.2017)
„Der mögliche Nutzen von Big Data steht und fällt mit der Expertise und Integrität der Personen oder Institutionen, die Daten generieren, auswählen, verknüpfen und interpretieren.“ (Deutscher Ethikrat, 2017, S. 45). Angesichts des von verschiedenen Interessen befeuerten Hypes um Big Data sollte diese Feststellung stets Gehör finden: „Es wäre also ein Missverständnis zu glauben, dass mehr Daten auch automatisch zu mehr Wissen über kausale Effekte führen.“ (Deutscher Ethikrat, 2017, S. 47)