E-Mail (intern) | Aktuelles | Veranstaltungen | Stellenangebote | Ausschreibungen | Kontakt | Sitemap | Impressum
Molekulare Signalverarbeitung
Leiter der Abteilung
Prof. Steffen Abel
Natur- und Wirkstoffchemie
Leiter der Abteilung
Prof. Ludger Wessjohann
Stress- und Entwicklungsbiologie
Leiter der Abteilung
Prof. Dierk Scheel
Sekundärstoffwechsel
Leiter der Abteilung
Prof. Dieter Strack
home  >  Stress- und Entwicklungsbiologie  >  Bioinformatik & Massenspektrometrie  >  Diplomarbeiten und Hiwi-Stellen
Informationen zur Abteilung
Infrastruktur
Veranstaltungen
17.03.2010 09:00 - Christin Fellenberg
A hydroxycinnamoyltransferase responsible for synthesizing suberin aromatics in Arabidopsis. Gou et al. (2009) PNAS ... weiter...
Infos
Forschungsgruppe

Diplomarbeiten und Hiwi-Stellen


Bioinformatik & Massenspektrometrie


Forschungsprojekte
Diplomarbeiten und Hiwi-Stellen
MitarbeiterPublikationen

Verschiedene wissenschaftlich anspruchsvolle Themen können im Rahmen der Zusammenarbeit zwischen der MLU Halle und dem IPB als Diplomarbeiten, Projekte oder an studentische Hilfskräfte vergeben werden. Neben den hier aufgeführten konkreten Projekten können weitere Themen können in einem persönlichen Gespräch entwickelt werden.

BewerberInnen melden sich bitte bei

Dr. Steffen Neumann
sneumann@ipb-halle.de
Tel.: 0345 5582-1470

oder den weiteren Mitgliedern der Arbeitsgruppe.

Metabolomics Datawarehouse



Unter einem Datawarehouse versteht man eine auf spezielle Anfragen optimierte Datenbank. Oft werden Daten aus operativen (normalisierten) Schemata in das (meist denormalisierte) Warehouse Schema transformiert. Für die Metabolomics Datenbanken am IPB soll ein Warehouse mit dem Framework BioMart Framework erstellt werden, das anspruchsvolle Abfragemöglichkeiten und Verknüpfungen von experimentellen Daten und öffentlichen Datenquellen bietet. Dazu gehört die Erstellung des ETL Prozesses mit dem MartBuilder, die Konfiguration des Web Frontends MartView und die Einbindung der Daten in die Workflow Engine Taverna.



VPD mit Postgres



Für den Schutz sensibler Daten gibt es in der Datenbankwelt die Row-level access control (bei Oracle z.B. VPD genannt). Dabei werden Zugriffsrechte nicht nur auf Tabellen- oder Spaltenebene vergeben, sondern auch die einzelnen Datensätze geschützt.

 

Dieses Konzept soll für die Postgres Datenbank verwirklicht werden, basierend auf Regeln, die Benutzeranfragen umschreiben die die Rückgabe eines Tupels vom Ergebnis einer Policy Funktion abhängig machen. Neben der Implementation gehört eine kleine Beispielanwendung für die Rechteverwaltung und eine Performance Studie zum Projekt.

 

 

 

Eigenpeaks und andere Modelle



Bei der Messung von Metabolomics Experimenten werden an Chromatographie gekoppelte Massenspektrometer (LC-MS) eingesetzt. Bedingt durch die Chromatographie haben die Metabolite teilwiese charakteristische Peakformen. Die Peaks können einerseits als Rohdaten gespeichert werden, oder nach der Vorverarbeitung nur noch durch die Koordinaten (Masse, Retentionszeit) und ihre Intensität repräsentiert werden. Im ersten Fall entsteht dadurch eine horrende Datenmenge, im zweiten Fall gehen u.U. Informationen verloren.

Analog zu Methoden aus der Bildverarbeitung und Proteomics sollen für die MS Daten am IPB statistische oder modellbasierte Verfahren verglichen werden, einen Peak mit möglichst wenig Parametern zu characterisieren.




Annotation von Elementarkompositionen



Ziel dieser Projektarbeit ist die Rekonstruktion der Elementarkomposition CnHmOpPqSr von Metaboliten aus beobachteten Massen.

 

Die exakte Masse von z.B. Stickstoff beträgt N=14.0067, zusammen mit den weiteren exakten Werten und chemischem Hintergrundwissen lässt sich aus der Masse 428.013435 die Summenformel C10H14N4O11P2 errechnen. Die natürlichen Isotopenverhältnisse beschreiben die Häufigkeit der Isotope, so verhalten sich 12C zu 13C wie 98,9 zu 1,1.

 

Diese exakten Natur­gesetze werden leider durch die Massenspektrometer nur annähernd wiedergegeben. Im Rahmen des Projektes sollen daher folgende Punkte bearbeitet werden:

 

  1. Zusammenstellen eine Test- / Trainingsdatensatzes.

  2. Deskriptive Statistik über diese Beispiele, Schätzung von Modellparametern.

  3. Evaluation von mindestens einem bestehenden Tool für die Auswertung der Elementarkompositionen.

 

Die Annotation soll sich in die bestehende Metabolomics-Infrastruktur einbinden lassen.


Analysepipeline für FTICR Daten



Am IPB wird ein FTICR Massenspektrometer u.a. zur Metabolitenanalyse betrieben.

Ziel des Projektes ist es, die für LC-MS bestehende Analysepipeline der Arbeitsgruppe für die Verarbeitung der FTICR Daten anzupassen. Dazu gehören folgende Aufgaben:

  1. Konvertierung der Bruker Rohdaten in das mzData Format. Entweder über die Software CompassXport oder die Tools des ProteomeCommons Projektes (Evaluation & Auswahl).
  2. Import des mzData Files in die IPB-eigene Datenbank (Dieser Teil ist bereits implementiert).
  3. Signalverarbeitung der FTICR Daten mit Bioconductor/PROcess oder OpenMS tools.
  4. Zuordnung der Massen aus verschiedenen Messungen
  5. Clustering der Daten mit den Algorithmen aus unserer Toolbox

Das System soll als Pipeline in R und/oder Java implementiert werden, und über JavaServerFaces bedient werden.


Netzwerkrekonstruktion



Rekonstruktion verschiedener biologischer bzw. regulatorischer Netzwerke aus Microarray-Expressionsdaten, u.a. von S. cerevisiae.

Ziel dieser Projektarbeit ist die Rekonstruktion verschiedener biologischer bzw. regulatorischer Netzwerke aus Microarray-Expressionsdaten. Das Lernen der Netzwerkstruktur aus den Daten erfolgt mit Hilfe von Bayesnetzen. Ein Algorithmus zum Lernen der Bayesnetzstrukur ist der "Sparse Candidate Algorithmus". Dieser liegt bereits implementiert vor und wird zur Bewältigung der Aufgabe zur Verfügung gestellt. Für die Rekonstruktion von regulatorischen Netzwerken aus den Microarray-Daten gibt es mehrere Möglichkeiten: Zum einen können die Daten im Voraus mit einer geeigneten Methode geclustert werden und die Netzwerke dann nur auf den einzelnen Clustern trainiert werden, wobei so die Komplexität der zu lernenden Netze herabgesetzt wird. Zum anderen kann ein bereits biologisch verifiziertes Netz herangenommen werden und versucht werden, dies zu rekonstruieren. Im Mittelpunkt der Projektarbeit soll außerdem die biologische Verifizierung der gelernten Netze stehen. Hierzu können biologische Fachliteratur und Datenbanken (GeneOnthology?) verwendet werden. Für die Rekonstruktion stehen zwei Datensätze von S. cerevisiae zur Verfügung. Diese bestehen jeweils aus ca. 6000 ORFs? und 73 bzw. 300 Experimenten.

Stichwörter:

  • S. cerevisiae
  • regulatorische Netzwerke
  • missing data
  • Clustering
  • Bayesnetze

Clustering von Metaboliten



Clustering, Assoziationsanalyse und Visualisierung von hochdimensionalen -omics Daten mit R und Bioconductor. Die Arbeitsgruppe Bioinformatik und Massenspektrometrie am IPB beschäftigt sich u.a. mit der Auswertung von Pflanzenmetabolitendaten, die mittels Flüssigkeitschromatographie und Massenspektrometrie gewonnen werden. Im Rahmen einer Projektarbeit (daraus evtl. auch Diplomarbeit) suchen wir Studierende zur Unterstützung der Auswertung von Metabolitendaten (Metabolite Profiling, Data Mining)

Die Aufgabenstellung umfasst Implementierungsaufgaben bereits vorhandener Ansätze in folgenden Bereichen:

  • Visualisierungstechniken (bereits gängige, sowie neue Verfahren)
  • Clustering (dichtebasiert, hierarchisch, Publikationen)
  • Assoziationsanalyse (A Priori, Frequent Patterns, ...)

Hilfestellung zur Einarbeitung wird selbstverständlich gegeben.
Interessenten sollten sich im Hauptstudium befinden.
Die Implementation soll mit der Sprache R (www.r-project.org) erfolgen.

Bei Interesse wendet euch an:

begert@ipb-halle.de
Tel.: 0345 2928-510
Arbeitsgruppe MSBI


Interoperabilität



Web Services, Code Generierung und Service Oriented Architecture (SOA) für Datenaustausch und Analyse in der Bioinformatik.

In der Bioinformatik existieren verschiedene Standards für Archivierung und Austausch von Transkript, Proteomics und Metabolit Daten. Diese meist in UML gefassten Modelle sind die Grundlage für XML Austauschformate, Datenbank Schemata und (Web-)Applikationen. Web Services bieten entsprechende Funktionalität auch Standortübergreifend an.

Wir suchen nach Studierenden, die Spass haben an der Nutzung fortschrittlicher Software Technik, Code Generierung und Service Oriented Architecture (SOA).


zurück  |  Drucken  |  Seitenanfang
Forschungsgruppen