Die Bioinformatik (englisch bioinformatics, auch computational biology) ist eine interdisziplinäre Wissenschaft, die Probleme aus den Lebenswissenschaften mit theoretischen computergestützten Methoden löst. Sie ist aus der modernen Biologie und Medizin nicht mehr wegzudenken und hat dort zu grundlegenden Erkenntnissen beigetragen. Bekanntheit in den Medien erreichte die Bioinformatik in erster Linie 2001 mit ihrem wesentlichen Beitrag zur Sequenzierung des menschlichen Genoms.
Bioinformatik ist ein weitgefächertes Forschungsgebiet, sowohl was die Problemstellungen als auch die angewandten Methoden angeht. Wesentliche Gebiete der Bioinformatik sind die Verwaltung und Integration biologischer Daten, die Sequenzanalyse, die Strukturbioinformatik, die Analyse von Daten aus Hochdurchsatzmethoden (*OMICS). Da Bioinformatik unentbehrlich ist, um Daten im großen Maßstab zu analysieren, bildet sie einen wesentlichen Pfeiler der Systembiologie.
Der Bioinformatik wird im englischen Sprachraum oft die computational biology gegenübergestellt, die einen weiteren Bereich als die klassische Bioinformatik abdeckt, meist benutzt man beide Begriffe jedoch synonym.
Bioinformatik ist mittlerweile eine etablierte eigenständige Wissenschaft, die zu den Grundlagenwissenschaften der Biologie und Medizin zählt, und als solche in Deutschland an vielen Standorten studierbar.
Mit der Aufklärung und weitreichenden Funktionsanalyse verschiedener vollständiger Genome verlagert sich der Schwerpunkt bioinformatischer Arbeit auf Fragestellungen der Proteomik, wie z. B. dem Problem der Proteinfaltung und Strukturvorhersage, also der Frage nach der Sekundär- oder Tertiärstruktur bei gegebener Aminosäuresequenz. Auch die Frage nach der Interaktion von Proteinen mit verschiedenen Liganden (Nukleinsäuren, anderen Proteinen oder auch kleineren Molekülen) wird untersucht, da sich daraus neben Erkenntnissen für die Grundlagenforschung auch wichtige Informationen für Medizin und Pharmazie ableiten lassen, beispielsweise darüber, wie ein durch eine Mutation verändertes Protein Körperfunktionen beeinflusst, oder welche Medikamente wie an verschiedenen Proteinen wirken. Da bioinformatische Informationen oft über viele Datenbanken verteilt sind (ca 350 weltweit), werden Bioinformatik Meta-Suchmaschinen (Bioinformatik-Harvester, Entrez) häufig benutzt, um entsprechende Informationen zu finden.
Ein nicht unerheblicher Teil der Arbeit eines Bioinformatikers besteht - neben mathematisch anspruchsvollen Analysen - in der Datenaufbereitung und Speicherung in geeignet indizierten und verlinkten biologischen Datenbanken. Die verwirrende Vielfalt von DNA- (z. B. GenBank) und Proteindatenbanken (z. B. UniProt/SwissProt) weltweit führte bisher oft zu redundanter und damit fehlerlastiger Datenhaltung, zumal DNA-Sequenzen teils in Fragmenten, teils in vollständig assemblierten Genomen vorliegen. Idealerweise würde die Speicherung von Genom- und Proteomdaten eine Rekonstruktion der Regelwerke eines gesamten Organismus erlauben. Die gewünschte Abbildung von identifizierten Proteinen zu "ihrem" Gen und umgekehrt sowie die Zuordnung von Proteinen zu einem metabolischen Pfad ist aber noch nicht in Sicht.
Ein wesentlicher Punkt neben fehlerbehafteten Einträgen und doppelter Datenhaltung unter unterschiedlichen Schlüsseln ist die weitgehende Abwesenheit von kontrollierter Vokabularien und Ontologien, die eine Zuordnung von Funktionsbezeichnungen quer durch alle Ebenen ermöglichen. Das Gene Ontology-Konsortium (GO) versucht derzeit, eine konsistente Nomenklatur für die Funktion, den Prozess und der Zelllokalisation von Gen-Produkten zu erstellen.
|
|
|