Phylogenetic Footprinting
Genomannotation durch komparative Sequenzanalyse
Genregulation
Referat von Mandy Fuchs & Christopher Hardt
Cross-Species Sequence Comparisons: A Review of Methods and Available
resources
Kelly A. Frazer, Laura Elnitski, Deanna M. Church, Inna Dubchak, and Ross C. Hardison
Multi-species sequence comparison: the next frontier in genome annotation
Inna Dubchak and Kelly Frazer
Genome Res. 2003 Jan;13(1):1-12. Review
Genome Biol. 2003;4(12):122. Epub 2003 Nov 27
InhaltHintergrundAlignments und Suche nach konservierten Sequenzen (2 Programme)ErgebnisseZusammenfassung
Nach der Sequenzierungdie Annotation
Immer mehr Genome sequenziertNächster Schritt: komplette und korrekte Annotation (noch sehr lückenhaft)Suche nach funktionellen Sequenzelementen durch komparative Sequenzanalyse
BasisAnnahme: Evolution funktioneller Sequenzen langsamer als die der nichtfunktionellen (wegen Selektionsdruck)
Betrachte mehrere Spezies mit verschiedenen (geeigneten) phylogenetischen Abständen
Ziel: Finde ...kodierende Sequenzenkonservierte nichtcodierende Sequenzen mit womöglich regulatorischer FunktionSpezies-exklusive Sequenzen
Appetithäppchen
Referenzsequenz: Humane CFTR Region
Wo sind die regulatorischen Elemente?
Appetithäppchen
Ah, da sind sie ja!
PipMaker vs. VISTABeide folgen einem gemeinsamen
Schema:
Aber es gibt auch Unterschiede...
PipMaker(http://bio.cse.psu.edu)
Verwendet BLASTZ für lokale AlignmentsKurze, exakte Matches, die zu Alignments mit Gaps erweitert werdenEmpirische Scoring-MatrixAffine Gap-KostenBis ~2mb Sequenzlänge
PipMaker: Ein- und Ausgabe
Beispiel: ~308 kb auf 7q31 (ST7 Locus)
VISTA(http://www-gsd.lbl.gov/vista)
Verwendet AVID für globale AlignmentsMaximal-Match-Finding mit Suffix TreesAnkerauswahl: Menge der nicht überlappenden oder überkreuzenden MatchesAlignments der Regionen zwischen den Ankern
effizient für lange Sequenzen (bis 4mb), besser als z.B. CLUSTALW
VISTA: Ein- und Ausgabe
Beispiel: ~308 kb auf 7q31 (ST7 Locus)
Filtern von konservierten Elementen
Heuristische Auswahl der Sequenzen, die in allenpaarweisen Alignments bedeutend erscheinen (exkl. bekannte Exons):
Mensch-Pavian: 95% ident./100bpMensch-Kuh: 93% ident./100bpMensch-Maus: 86% ident./100bpMensch-Fugu: 55% ident./100bp
Wenige nicht-codierende Sequenzen, die aber wahrscheinlich wegen aktiver Konservierung biologische Funktionen haben
Kandidaten für regulatorische Elemente
Mensch-Pavian zu sehr verwandtMensch-Fisch dagegen zu weit entferntMensch-Maus: einpaar konservierte Regionen, die bzgl. ihrer Umgebung deutlich herausstechen
Neues Exon oder regulatorisches Element?
Exon?Test: Suche nach entsprechenden
ESTs
Intronische regulatorische Sequenz?
Test: Gain-of-function assay
ErgebnisseUm konservierte Regionen zu finden erscheinen Multi-Spezies Vergleiche mit 40-80 Mio. Jahre Divergenzzeit am besten (z.B. Mensch-Maus-Kuh)Entfernt verwandte Spezies (z.B. Mensch-Kugelfisch, 450 Mio. Jahre) lassen kodierende und nicht-kodierende unterscheidenNah Verwandte (z.B. Mensch-Schimpanse) erlauben die Identifizierung von speziesspezifischen Sequenzen
Letztendlich auch: Stamm - Klasse - Ordnung - Familie - Gattung – Art und die Frage: Was ist wo konserviert? Mehr Informationen über die Mechanismen der
Evolution
Komparative Genomanalyse
Einige neue funktionelle Sequenzen gefunden; alte bestätigt oder z.T. widersprochenErscheint vielversprechend, aber Probleme gibt es noch:
Verschiedene Evolutionsraten zwischen Spezies, aber auch in einem Genom
Ansätze mit variablen EvolutionsratenZu nah verwandt auch „unwichtige“ Sequenzen konserviertZu weit entfernt haben nur begrenzt gemeinsame Gene
grob: mehr Sequenzen liefern bessere Ergebnisse
ZusammenfassungNutze Korrelation zwischen phylog. Abstand und Konservierung um funktionelle Sequenzen zu findenPipMaker und VISTAUltimatives Ziel: Komplette Annotation der Genome, inkl. Identifizierung und Klassifizierung funktioneller Elemente
Noch Fragen?
Ansonsten danke für die Aufmerksamkeit und ab ins
Café