Das Humanproteom - das nächste große Ziel
Das „Humanproteom-Projekt“, eine auf zehn Jahre angelegte globale Initiative zur systematischen Kartierung aller Proteine des Menschen in ihrem biologischen Zusammenhang, ist aus dem Planungsstadium in die experimentelle Phase eingetreten. Die effektive Bedeutung des Projektes hängt davon ab, wieweit die dadurch bereitgestellten Ressourcen von Proteomforschern genutzt werden und diese ihre Daten in das Projekt einbringen.
Von der erfolgreichen Sequenzierung des menschlichen Genoms im Humangenomprojekt vor mehr als zehn Jahren hatte man sich versprochen, dass durch die Identifizierung krankheitsrelevanter Gene nunmehr auch Wege zur Therapie bisher unheilbarer Krankheiten gefunden würden. Rasch musste man erkennen, dass diese Erwartungen sich nicht erfüllen konnten. Krankheiten sind wie alle physiologischen und entwicklungsbiologischen Zustände des Organismus Ausprägungen des Phänotyps, der in einer intensiven Wechselbeziehung mit seiner Umwelt steht.
Die wichtigsten Komponenten und Akteure des Phänotyps und seiner Interaktionen sind die Proteine. Wie schon ihr Name ausdrückt (der von dem sich ständig verwandelnden griechischen Meeresgott Proteus abgeleitet ist), sind Proteine außerordentlich veränderlich. Während man sich inzwischen weitgehend einig ist, dass der Mensch 20.000 bis 21.000 proteinkodierende Gene besitzt, schätzt man die Gesamtzahl aller im Menschen wirksamen Protein-Isoformen auf etwa eine Million. Sie entstehen durch DNA-Rekombination, alternatives Spleißen der primären Gen-Transkripte und unterschiedlichste post-translationale Modifikationen - darunter Glykosylierungen und Phosphorylierungen - und sind abhängig von Entwicklungsstand und Expressionsort sowie von den physiologischen, pathologischen und pharmakologischen Umständen.
Das 2008 beschlossene und im September 2011 begonnene Humanproteom-Projekt (HPP) hat sich das gigantische Ziel gesetzt, innerhalb von zehn Jahren eine Proteomkarte zu erstellen, die Ordnung in die verwirrende Vielfalt der Gesamtheit aller menschlichen Proteine bringen und als Gerüst und Bezugspunkt aller künftigen Proteomforschung dienen kann.
Technologische Säulen und Forschungsstrategien
Die Initiatoren des HPP - die Creme der internationalen Proteomforschung - gehen davon aus, dass durch die technischen Fortschritte der letzten Jahre eine Kartierung des menschlichen Proteoms möglich geworden ist. Wie schon das Humangenomprojekt gezeigt hatte, erzeugen solche Großprojekte auch eine Dynamik, durch die ganz unvorhersehbare Innovationen entstehen, die das Projekt weiter und womöglich schneller vorantreiben können. Das erwartet man auch für das HPP.
Mit seiner experimentellen Strategie beruht das Proteomprojekt auf drei technologischen Pfeilern: (1) quantitative Massenspektrometrie in Verbindung mit Flüssigkeitschromatografie und anderen Auftrenn-Verfahren wie zweidimensionaler Gelelektrophorese; (2) das Abfangen und Identifizieren von Proteinen mithilfe von Antikörpern („protein capture“); (3) Bioinformatik-Instrumente und Datenbanken („knowledge bases“).
Zwei unterschiedliche Strategien zur Erforschung des menschlichen Proteoms werden parallel und unabhängig voneinander verfolgt: I. das „Chromosomen-zentrische“ Humanproteinprojekt (C-HPP) und II. das an der Biologie der etwa 230 verschiedenen menschlichen Zellen und den Haupterkrankungen des Menschen ausgerichtete B/D-HPP („Biology/Disease-Driven“ HPP). Über den Stand des C-HPP sind jetzt erste Berichte veröffentlicht worden, und für den 12. Jahreskongress der Human Proteome Organization, der im September 2013 im japanischen Yokohama stattfinden wird, erwartet man viele neue Beiträge, die bereits eine Vorstellung davon geben werden, welch eine Explosion an Informationen durch dieses Großprojekt noch ausgelöst werden kann.
Das „Chromosomen-zentrische“ Humanproteinprojekt C-HPP
Aus der bekannten DNA-Sequenz des menschlichen Genoms kann die Zahl der proteinkodierenden Gene relativ genau ermittelt werden. Sie beträgt 20.059 - nach den neuesten Angaben (Dezember 2012) von neXtProt, einer vom Schweizerischen Institut für Bioinformatik entwickelten, auf menschliche Proteine spezialisierten Datenbank. Die meisten Publikationen gehen aber noch von 20.300 bis 21.000 proteinkodierenden Genen aus. Die Ziele des C-HPP sind die Kartierung und Funktionsbeschreibung der gesamten Proteingarnitur, die von jedem einzelnen Chromosom kodiert wird.
Ein 25-gliedriges Konsortium wurde gebildet, in dem alle 24 menschlichen Chromosomen-Typen (die 22 diploid vorliegenden Autosomen und die beiden Geschlechtschromosomen X und Y) sowie das Mitochondriengenom unter Federführung von Forschungsgruppen oder Organisationen verschiedener Staaten oder einer Staatengruppe bearbeitet werden. Wissenschaftler, die am C-HPP mitarbeiten wollen, können sich ein Chromosom wählen, das ihrem eigenen Interesse etwa an spezifischen Krankheiten (zum Beispiel Krebs oder genetische Erkrankungen) oder an bestimmten Targets (zum Beispiel Biomarker) entspricht.
Die Teilnahme erfordert keine Veränderung der eigenen und eigenständigen Proteom-Experimente; nur Daten werden mit allen anderen Teams der entsprechenden Chromosomengruppe ausgetauscht. Vergleichbarkeit wird durch gemeinsame Standards und Referenzproteine festgelegt. So werden Kenntnisse über die von dem Chromosom kodierten Proteine und auch Informationen über noch „fehlende oder schlecht charakterisierte Proteine“ zusammengetragen und der wissenschaftlichen Gemeinschaft zugänglich gemacht.
Offene Fragen
Nach heutigen Daten aus der Massenspektrometrie und dem „protein capture“ sind bisher etwa zwei Drittel der erwarteten Proteine mit einiger Sicherheit identifiziert worden; ihre Funktionen sind aber meist nur lückenhaft bekannt. Zu durchschnittlich 30 bis 35 Prozent der proteinkodierenden Gene auf allen Chromosomen gibt es noch keine verlässlichen Informationen über ihre Genprodukte. Durch weiteres Absenken der Nachweisgrenze für Proteine in den experimentellen Daten kann die Informationslücke vielleicht verkleinert werden. Wahrscheinlich gibt es aber auch biologische Ursachen, welche die Gesamtproteom-Analyse komplizieren:
- Viele Proteine werden von mehr als einem Gen kodiert; ein Beispiel für ein solches Multigenprotein ist der von acht Genen kodierte Rezeptor 2W1 aus dem Riechepithel. Mit Mitteln der Proteomik sind solche genetischen Komplikationen nicht zu klären.
- Umgekehrt kann ein hoher Grad an Polymorphismus eines Proteins dazu führen, dass es in den analytischen Daten vielfach auftaucht; das klassische Beispiel dafür sind die Proteine des Hauptkompatibilitätskomplexes MHC.
- Ganze Proteingruppen könnten systematisch unterrepräsentiert sein, weil sie schwer aufzutrennen oder aufgrund extremer Homologie nicht zu unterscheiden sind; dazu gehören z.B. membrangebundene Proteine, Cytokeratine oder die olfaktorischen Rezeptoren.
- Manche Proteine sind noch nicht entdeckt worden, weil sie eine sehr kurze Lebensdauer haben und nur in winzigen Mengen vorkommen, wie regulatorische Proteine im Zellkern, oder weil sie nur schwach in solchen Geweben oder Zellen exprimiert werden, die bisher nicht gut untersucht worden sind.
Diese Punkte sind sicher nur eine unvollständige Aufzählung der Herausforderungen, denen sich die Proteomforscher während der Laufzeit des C-HPP zu stellen haben. Viele Probleme wird man lösen können, aber andere, heute noch unabsehbare Fragestellungen werden hinzukommen.
Das von „Biologie und Krankheiten getriebene“ HPP
Der zweite Arm der globalen Proteom-Initiative, das sogenannte „Biology/Disease-driven HPP“, verläuft parallel und liefert komplementäre Informationen zum C-HPP. Es ist - nach gegenwärtigem Stand - in 16 Teilprojekte gegliedert, die sich an spezifischen biologischen Prozessen oder Systemen und Krankheitsbereichen orientieren. Für fünf Bereiche haben sich bereits federführende Teams gebildet: Diabetes, Krebsproteomik, Mitochondrien, Infektionskrankheiten und Epigenetik / Chromatin-assoziierte Proteine.
Andere Bereiche wie die Proteomik des Blutplasmas, der Leber, des Gehirns, der Nieren und Harnwege, der Herz-Kreislauf-Krankheiten, der Stammzellen sowie die Proteomik von Modellorganismen befinden sich noch im Planungsstadium. Für alle Teilprojekte werden von den Experten Listen von Proteinen erarbeitet, die für das Thema besonders relevant sind oder es doch sein könnten. Für die Untersuchung von Signalwegen beispielsweise wären alle menschlichen Proteinkinasen (das sogenannte Kinom) zu erfassen, ein Gebiet, das auch für die pharmazeutische Industrie von besonderer Bedeutung ist. Die Themen des B/D-HPP bieten auch Raum für die Proteomanalysen intrazellulärer Kompartimente und Systeme wie dem Kernporenkomplex und dem Endo-Exocytose-Transportweg und schließen beispielsweise auch die Proteome von infektionsverursachenden Parasiten ein.
Noch 2013 werden verschiedene Pilotprojekte beginnen. Wie auch das C-HPP ist das B/D-HPP auf die Mitarbeit führender Proteomlaboratorien in der Welt angewiesen. Sein Erfolg hängt davon ab, dass die durch Massenspektrometrie und Affinitätschromatografie gewonnenen Daten und Proben der wissenschaftlichen Öffentlichkeit ungehindert zur Verfügung gestellt werden.
Wie der Schweizer Proteomforscher Ruedi Aebersold, eine der führenden Persönlichkeiten des HPP, schreibt, ist es das Ziel des B/D-HPP, weit mehr zu sein als eine Bestandsliste der Proteinexpression. Das Projekt liefert Informationen über biologische Netzwerke, Verbindungen zu anderen zellulären Komponentenklassen und Systemen wie dem Genom, Epigenom, Transkriptom und Metabolom, und es stellt Reagenzien und Informationen für Wissenschaftler bereit, die für die biologische und klinische Forschung Proteomik benutzen.
„Vom Humanproteomprojekt kann die wissenschaftliche Gemeinschaft einen vollständigen Katalog von Proteinen erwarten, einschließlich neuer Wirkstoff-Targets, neuer diagnostischer Biomarker und einer Bestandsliste der Isoformen der zellulären Regulatoren wie zum Beispiel der wichtigsten Signalwege“ (zitiert nach: J. Proteome Res., Special Issue C-HPP, 20. Dec. 2012). Die Struktur des HPP stellt sicher, dass sich das Forschungsgebiet kontinuierlich weiterentwickelt – mit stetig verbesserten Technologien, Probensammlungen und Datenbanken, einer internationalen Koordination im Datenmanagement und einem globalen Austausch an Information.