Data-Mining: Neue Chancen für Medizin und Gesundheit
In der Forschung und im Gesundheitswesen werden riesige Datenmengen erzeugt, die sinnvoll ausgewertet werden müssen. Dies macht die rechnergestützte Extraktion relevanter Daten unter dem Einsatz statistischer Methoden nötig. Dieses Verfahren, das man als Data-Mining bezeichnet, ermöglicht es, sinnvolle Muster in großen Datenmengen zur erkennen. Besonders relevant ist Data-Mining zum Beispiel beim Einsatz von High-Throughput-Verfahren, beim Einsatz von Visualisierungstechniken und in der Telemedizin.
Damit Daten nach bestimmten Vorgaben ausgewählt, aufbereitet und analysiert werden können, kooperieren Experten aus der Informatik, Mathematik und Statistik mit Spezialisten aus den jeweiligen Anwendungsgebieten - also etwa mit Biologen, Pharmazeuten oder Medizinern. Vertreter noch junger Berufsbilder wie Bioinformatiker und Systembiologen haben damit begonnen, das große Potenzial dieser Entwicklung zu erschließen.
Datenaufkommen sinnvoll nutzen
Derzeit arbeiten Anwender in Medizin und Forschung mit Datenvolumen im Terabyte- und Petabyte-Bereich. Alle zwei Jahre soll sich Schätzungen zufolge die weltweit insgesamt bestehende Datenmenge verdoppeln. Der Begriff „Big Data“ versucht das Ausmaß der Datenlawine zu beschreiben, die immer schneller auf Wissenschaftler und Institutionen zurollt. So verändern die schnellen Entwicklungen in der Genom- und Proteomforschung die Biowissenschaften auf geradezu dramatische Weise. Nicht nur die Datenressourcen im Bereich Genomsequenzierung werden angesichts der rasanten Entwicklung weiter steigen. Doch nützlich werden die Daten erst, wenn sie organisiert und durch den Einsatz von Data-Mining-Algorithmen anhand ihrer Muster interpretierbar werden.
Praktischer Nutzen im Gesundheitswesen
Konkreten Nutzen für den Alltag im Gesundheitswesen kann Data-Mining sowohl in wirtschaftlicher als auch in medizinischer und organisatorischer Hinsicht bieten. So lassen sich Datenressourcen in Krankenhäusern und Kliniken beispielsweise für Controllingprozesse, das medizinische Prozessmanagement oder für die Risikoerkennung aufbereiten. Verschiedene Data-Mining-Methoden und Modelle der Aufbereitung machen Datenressourcen übersichtlich und ermöglichen fachgerechte Interpretationen. Auch in der medizinischen Versorgung und Betreuung können Abfragen und Ergebnisse aus Data-Mining-Verfahren genutzt werden, beispielsweise durch das Abfragen von Vergleichsdaten aus medizinischen Analysen für Prophylaxe, Diagnose, Therapie oder Nachsorge.
Simulation lebender Zellen
Allein in Baden-Württemberg existieren eine ganze Reihe von Biotechnologie-Unternehmen, die aufgrund ihrer technologischen Kernkompetenz das Thema „Big Data“-Handling im Fokus haben. Beispielhaft werden hier die Unternehmen Insilico Biotechnology AG in Stuttgart sowie die quantiom bioinformatics GmbH & Co. KG in Weingarten vorgestellt.
Die Insilico Biotechnology AG aus Stuttgart gestaltet und optimiert biotechnologische Prozesse für die chemische und pharmazeutische Industrie sowie für die Ernährungsindustrie. „Wir liefern Vorhersagen für das Verhalten von Zellen oder Organismen. Dadurch können wir die Entwicklungszeit für neue biotechnologische Prozesse verkürzen oder bestehende Prozesse optimieren - etwa für die Produktion von Medikamenten“, erklärt Klaus Mauch, Geschäftsführer von Insilico. Das Unternehmen verfügt über eine weltweit einmalige Systembiologie-Plattform, welche proprietäre Datenbanken, Zellmodelle und rechnergestützte Auswertungsverfahren zusammenfasst. Durch die Integration und Auswertung experimenteller Daten mittels genomweiter Netzwerkmodelle bietet Insilico neue Lösungen zur Herstellung von Biochemikalien und Biopharmazeutika sowie zur Validierung von Wirkstoffen. Zu den Kunden gehören große Industrieunternehmen, zum Beispiel die Boehringer Ingelheim Pharma GmbH & Co. KG in Biberach.
Innovative Patientenüberwachung
Mit einer erfolgreich in Klinik und Forschung eingesetzten Data-Mining-Software zur Patientenüberwachung überzeugt das Unternehmen quantiom bioinformatics GmbH & Co. KG aus Weingarten. Die Software erleichtert das Lesen von Messprofilen einzelner Patienten. Der sogenannte 'Generic Signal Profiler' ermöglicht eine automatisierte Untersuchung von Patientenprofilen. Er kann beispielsweise erkennen, ob ein Patient während des Schlafens Atemstörungen hat. Ein Produkt, das mit dem Generic Signal Profiler entwickelt wurde - die sogenannte RNA Integrity Number (RIN) - ist dem Unternehmen zufolge bereits Industriestandard zur Qualitätskontrolle von RNA (Ribonukleinsäure) in Tausenden von Laboren weltweit.
Automatische Bildanalysen
Ein wegweisend neues Verfahren zur automatisierten Bewegungsverfolgung von biologischen Partikeln in Bildern aus der Zellmikroskopie wurde im Jahr 2012 in Barcelona prämiert. Das probabilistische Verfahren für „Partikel Tracking“ ist eine Entwicklung von Dr. William J. Godinez und Dr. Karl Rohr in enger Kooperation mit Partnern am Universitätsklinikum Heidelberg. Das Verfahren kommt bei der Erforschung von Infektionskrankheiten durch Hepatitis-C-Viren zum Einsatz.
Verfahren mit Zukunft
Schon heute sind Data-Mining-Verfahren verfügbar, die auf durchschnittlichen Standardrechnern Tausende von Datensätzen bewältigen. Zusätzliche Potenziale erschließen sich für Data-Mining durch die fortschreitende Speicherintensität der Medien sowie eine zunehmende Vernetzung von Datenbanken in Medizin, Gesundheit und Forschung.