Bioinformatik & MassenspektrometrieVerschiedene wissenschaftlich anspruchsvolle Themen können im Rahmen der Zusammenarbeit zwischen der MLU Halle und dem IPB als Diplomarbeiten, Projekte oder an studentische Hilfskräfte vergeben werden. Neben den hier aufgeführten konkreten Projekten können weitere Themen können in einem persönlichen Gespräch entwickelt werden. BewerberInnen melden sich bitte bei Dr. Steffen Neumann oder den weiteren Mitgliedern der Arbeitsgruppe. Metabolomics DatawarehouseUnter einem Datawarehouse versteht man eine auf spezielle Anfragen optimierte Datenbank. Oft werden Daten aus operativen (normalisierten) Schemata in das (meist denormalisierte) Warehouse Schema transformiert. Für die Metabolomics Datenbanken am IPB soll ein Warehouse mit dem Framework BioMart Framework erstellt werden, das anspruchsvolle Abfragemöglichkeiten und Verknüpfungen von experimentellen Daten und öffentlichen Datenquellen bietet. Dazu gehört die Erstellung des ETL Prozesses mit dem MartBuilder, die Konfiguration des Web Frontends MartView und die Einbindung der Daten in die Workflow Engine Taverna. VPD mit PostgresFür den Schutz sensibler Daten gibt es in der Datenbankwelt die Row-level access control (bei Oracle z.B. VPD genannt). Dabei werden Zugriffsrechte nicht nur auf Tabellen- oder Spaltenebene vergeben, sondern auch die einzelnen Datensätze geschützt.
Dieses Konzept soll für die Postgres Datenbank verwirklicht werden, basierend auf Regeln, die Benutzeranfragen umschreiben die die Rückgabe eines Tupels vom Ergebnis einer Policy Funktion abhängig machen. Neben der Implementation gehört eine kleine Beispielanwendung für die Rechteverwaltung und eine Performance Studie zum Projekt.
Eigenpeaks und andere ModelleBei der Messung von Metabolomics Experimenten werden an Chromatographie gekoppelte Massenspektrometer (LC-MS) eingesetzt. Bedingt durch die Chromatographie haben die Metabolite teilwiese charakteristische Peakformen. Die Peaks können einerseits als Rohdaten gespeichert werden, oder nach der Vorverarbeitung nur noch durch die Koordinaten (Masse, Retentionszeit) und ihre Intensität repräsentiert werden. Im ersten Fall entsteht dadurch eine horrende Datenmenge, im zweiten Fall gehen u.U. Informationen verloren. Analog zu Methoden aus der Bildverarbeitung und Proteomics sollen für die MS Daten am IPB statistische oder modellbasierte Verfahren verglichen werden, einen Peak mit möglichst wenig Parametern zu characterisieren. Annotation von ElementarkompositionenZiel dieser Projektarbeit ist die Rekonstruktion der Elementarkomposition CnHmOpPqSr von Metaboliten aus beobachteten Massen.
Die exakte Masse von z.B. Stickstoff beträgt N=14.0067, zusammen mit den weiteren exakten Werten und chemischem Hintergrundwissen lässt sich aus der Masse 428.013435 die Summenformel C10H14N4O11P2 errechnen. Die natürlichen Isotopenverhältnisse beschreiben die Häufigkeit der Isotope, so verhalten sich 12C zu 13C wie 98,9 zu 1,1.
Diese exakten Naturgesetze werden leider durch die Massenspektrometer nur annähernd wiedergegeben. Im Rahmen des Projektes sollen daher folgende Punkte bearbeitet werden:
Die Annotation soll sich in die bestehende Metabolomics-Infrastruktur einbinden lassen. Analysepipeline für FTICR DatenAm IPB wird ein FTICR Massenspektrometer u.a. zur Metabolitenanalyse betrieben. Ziel des Projektes ist es, die für LC-MS bestehende Analysepipeline der Arbeitsgruppe für die Verarbeitung der FTICR Daten anzupassen. Dazu gehören folgende Aufgaben:
Das System soll als Pipeline in R und/oder Java implementiert werden, und über JavaServerFaces bedient werden. NetzwerkrekonstruktionRekonstruktion verschiedener biologischer bzw. regulatorischer Netzwerke aus Microarray-Expressionsdaten, u.a. von S. cerevisiae. Ziel dieser Projektarbeit ist die Rekonstruktion verschiedener biologischer bzw. regulatorischer Netzwerke aus Microarray-Expressionsdaten. Das Lernen der Netzwerkstruktur aus den Daten erfolgt mit Hilfe von Bayesnetzen. Ein Algorithmus zum Lernen der Bayesnetzstrukur ist der "Sparse Candidate Algorithmus". Dieser liegt bereits implementiert vor und wird zur Bewältigung der Aufgabe zur Verfügung gestellt. Für die Rekonstruktion von regulatorischen Netzwerken aus den Microarray-Daten gibt es mehrere Möglichkeiten: Zum einen können die Daten im Voraus mit einer geeigneten Methode geclustert werden und die Netzwerke dann nur auf den einzelnen Clustern trainiert werden, wobei so die Komplexität der zu lernenden Netze herabgesetzt wird. Zum anderen kann ein bereits biologisch verifiziertes Netz herangenommen werden und versucht werden, dies zu rekonstruieren. Im Mittelpunkt der Projektarbeit soll außerdem die biologische Verifizierung der gelernten Netze stehen. Hierzu können biologische Fachliteratur und Datenbanken (GeneOnthology?) verwendet werden. Für die Rekonstruktion stehen zwei Datensätze von S. cerevisiae zur Verfügung. Diese bestehen jeweils aus ca. 6000 ORFs? und 73 bzw. 300 Experimenten. Stichwörter:
Clustering von Metaboliten
Die Aufgabenstellung umfasst Implementierungsaufgaben bereits vorhandener Ansätze in folgenden Bereichen:
Hilfestellung zur Einarbeitung wird selbstverständlich gegeben. Bei Interesse wendet euch an: begert@ipb-halle.de InteroperabilitätWeb Services, Code Generierung und Service Oriented Architecture (SOA) für Datenaustausch und Analyse in der Bioinformatik. In der Bioinformatik existieren verschiedene Standards für Archivierung und Austausch von Transkript, Proteomics und Metabolit Daten. Diese meist in UML gefassten Modelle sind die Grundlage für XML Austauschformate, Datenbank Schemata und (Web-)Applikationen. Web Services bieten entsprechende Funktionalität auch Standortübergreifend an. Wir suchen nach Studierenden, die Spass haben an der Nutzung fortschrittlicher Software Technik, Code Generierung und Service Oriented Architecture (SOA). |
Forschungsgruppen
|



Clustering, Assoziationsanalyse und Visualisierung von hochdimensionalen -omics Daten mit R und Bioconductor. Die Arbeitsgruppe Bioinformatik und Massenspektrometrie am IPB beschäftigt sich u.a. mit der Auswertung von Pflanzenmetabolitendaten, die mittels Flüssigkeitschromatographie und Massenspektrometrie gewonnen werden. Im Rahmen einer Projektarbeit (daraus evtl. auch Diplomarbeit) suchen wir Studierende zur Unterstützung der Auswertung von Metabolitendaten (Metabolite Profiling, Data Mining)