Upload
vin
View
89
Download
0
Embed Size (px)
DESCRIPTION
Molekulární genetika rostlin. Rostlinný genom Chromatin a metylace DNA RNA interference Mimojaderné genetické elementy Transpozóny, viry a viroidy Klasické genetické mapování Transgenoze a reverzní genetika Genomika Transkriptomika a proteomika. Členění rostlinného genomu. - PowerPoint PPT Presentation
Citation preview
Molekulární genetika rostlin
• Rostlinný jaderný genom • Chromatin a metylace DNA• RNA interference • Genom plastidů a mitochondrií• Transpozóny, viry a viroidy
• Genetika a genetické mapování• Transgenoze a reverzní genetika• Genomika, transkriptomika a proteomika
Členění rostlinného genomu
• jaderný genom = genom sensu stricto
• plastidy - plastom
• mitochondrie - chondriom
54 Mbp – Cardamine amara 124 852 Mbp - Fritillaria
149 000 Mbp - Paris japonica
- momentálně největší známý genom (mnohobuněčný)
http://data.kew.org/cvalues/
Velikost rostlinného genomu
C-value
• velikost nereplikovaného genomu v gametě
genome size (bp) = (0.910 x 109) x DNA content (pg)
DNA content (pg) = genome size (bp) / (0.910 x 109)
1 pg = cca 910 Mbp; MW (1 bp) = cca 660 Da
Velikosti rostlinných genomů 10 Mb Ostreococcus (jednobuněčná řasa)
54 Mb Cardamine amara
64 Mb Genlisea aurea
125 Mb Arabidopsis
500 Mb Oryza
5 000 Mb Hordeum
17 000 Mb Triticum
84 000 Mb Fritillaria (největší diploidní)
143 000 Mb Paris (oktaploidní)
- u krytosemenných rostlin rozdíly ve velikosti téměř 3 000 x - u nahosemenných velké genomy často kolem 10 000 Mb - rozdíly v počtu genů menší (cca 20 – 200 tis.?)
poměr objemu koulí 3000x
Velikosti rostlinného genomu
Co lze vyčíst?
- genomy v evoluci rostou (původnější jsou menší genomy)
- průměrný nárůst velikostigenomu je vyšší u jednoděložných
C-value paradox
• neexistuje korelace mezi komplexitou organismu a velikostí jeho genomu
• i genomy fylogeneticky blízkých organismů se často výrazně liší velikostí genomu
Příčiny: - duplikace úseků rostlinné DNA či celých genomů
(polyploidizace) - množení invazní DNA (transpozóny) - ale i redukce velikosti rekombinací a delecemi
(př. 2n bavlníky)! - velikost genomu jen částečně koreluje se sekvenční
komplexitou genomu (informační bohatostí)
odbočka: sekvenční komplexita(~ množství nesené informace)
Repetitivní:AAAAAAAAAAAAAAAAAAAAA komplexita 1 (21xA)ATCATCATCATCATCATCATC komplexita 3 (7xATC) (u kódující sekvence je množství informace různé)
Unikátní:ATCGTATCGCGATTTTAACGT komplexita 21 (1xAT…)
- repetitivnost/unikátnost záleží na velikosti posuzovaného „okna“ (= velikosti analyzovaných fragmentů DNA)
Sekvenční komplexita rostlinných genomů
vysoce repetitivní sekvencestředně repetitivní sekvencejedinečné sekvence Sekvenční
komplexita
Reasociační kinetika - měření komplexity genomu
(analýzy genomů nejen v předsekvenační době)
• DNA fragmentována na 300 - 500 bp fragmenty a denaturována
• průběh reasociace sledován v čase (chromatografické oddělení ss a ds DNA)
• analýzou kinetiky (Cot křivek) lze zjistit podíl jedinečných a opakovaných sekvencí:
princip: vzácné sekvence reasociují pomaleji než hojné (nižší pravděpodobnost setkání)
Reasociační kinetika- vliv komplexity DNA
Eukaryotické genomy zpravidla obsahují tři frakce sekvencí lišící se komplexitou
vysoce repetitivní = nízká komplexita
středně repetitivní
unikátní sekvence= vysoká komplexita
Typy sekvencí v jaderném genomu(členění není zcela jednoznačné)
• Jedinečné sekvence – geny i nekódující DNA
• Středně repetitivní DNA– Tandemové repetice rRNA, tRNA a histonových genů (jejichž produkty jsou
potřeba ve větším množství)– Mnohočetné genové rodiny (jen při vysokém % identity nukleotidových
sekvencí – jinak řazeny mezi jedinečné sekvence)– Pohyblivé genetické elementy (transpozóny)
- i vysoké počty repetic (někdy spadají pod vysoce repetitivní)
• Sekvence s nízkou komplexitou (vysoce repetitivní)– Tandemově uspořádané krátké sekvence (SSR)– Centromery (180 bp repeat Arabidopsis) a telomery (TTTAGGG)n
- mohou se chovat jako satelitní DNA (micro-, mini-)
Zastoupení sekvencí s různou kompexitou v genomech se liší!
jedinečné sekvencestředně repetitivní sekvencevysoce repetitivní sekvence
(Westhoff: Molecular plant development, 1998)
Reasociační kinetika malých a velkých genomů
Rozdíly v uspořádání velkých a malých genomů
velké genomy: geny přítomné v „gene-rich“ ostrovech mezi dlouhými úseky nekódující, zpravidla repetitivní DNA
Rekonstrukce postupné kumulace mobilních elementů v několika lokusech genomu kukuřice
Ve sledovaném úseku u prosa nejsou žádné transpozóny (TE), u kukuřice tvoří 60 % délky
Centromerové 180 bp A.th.
45S rDNA Crocus(Heslop-Harrison, Plant Cell 12:617, 2000)
Repetitivní sekvence lze detekovat in situ (FISH)(dnes již i unikátní sekvence)
telomer. rep. žita (TTTAGGG)n
subtelomer. rep. žita
Sekvenování rostlinných genomůhttp://genomevolution.org/wiki/index.php/Sequenced_plant_genomes
Stav k 4/13 – (šedivě méně kompletní genomy)
Sekvenování velkých genomů
- sekvenování po částech (chromozómech)- sekvenování nemetylované DNA (= transkripčně aktivní)- sekvenování ESTs
odbočka – definice pojmů: Expressed Sequence Tags (ESTs)
- krátké sekvenované úseky cDNA (300-600 nt)- úseky transkribovaných genů (primárně z mRNA)
- alternativní zdroj kódujících sekvencí u velkých genomů(rychlé a levné)
- velmi redundantní, ale současně neúplné
Příprava EST knihovny
- mRNA
- RT s oligoT primerem – cDNA
- štěpení heteroduplexu RNázouH
- syntéza 2. vlákna cDNA
- štěpení restriktázou
- ligace adaptorů klonování
sekvenace
- často jen fragmenty genů (někdy lze poskládat celé)- různé hladiny transkriptů (redundance x absence)- genová exprese regulována orgánově, časově, vývojově, environmentálně, …- chybí regulační sekvence (promotory, introny,...)
Výhody: jen transkribované (=aktivní) geny, bez intronů (kombinací s genomovou – identifikace reg. sekvencí), …
Problémy (slabiny) EST knihoven:(v porovnání s genomovou knihovnou)
Arabidopsisthaliana
1 týden 3 týdny
4 týdny 6 týdnů
Genom Arabidopsis: 125 Mbp
genyESTsTE = transposible elements
vysoká hustota nízká hustota
genyESTsTE
genyESTsTE
genyESTsTE
genyESTsTE
Predikce počtu genů v genomu
Feature Value
DNA molecule Chr.1 Chr.2 Chr.3 Chr.4 Chr.5 SUM
Length (bp)Top arm (bp)Bottom arm (bp)
Base composition (%GC) Overall Coding Non-coding
Number of genes Gene density (kb per gene ) Average gene Length (bp) Average peptide Length (bp)
Exons Number Total length (bp) Average per gene Average size (bp)
Number of genesWith ESTs (%) Number of ESTs
29,105,11114,449,21314,655,898
33.444.032.4
6,5434.0
2,078
446
35,4828,772,5595.4247
60.8
30,522
19,646,9453,607,09116,039,854
35.544.032.9
4,0364.9
1,949
421
19,6315,100,2884.9259
56.9
14,989
23,172,61713,590,2689,582,349
35.444.333.0
5,2204.5
1,925
424
26,5706,654,5075.1250
59.8
20,732
17,549,8673,052,10814,497,759
35.544.132.8
3,8254.6
2,138
448
20,0735,150,8835.2256
61.4
16,605
25,53,40911,132,19214,803,217
34.544.132.5
5,8744.4
1,974
429
31,2267,571,0135.3242
61.4
22,885
115,409,949
25,49827,206 protein cod.+ MIR, …
132,98233,249,250
105,773
Genom Arabidopsis - statistika
Většina rostlinných genů tvoří genové rodiny
• genové rodiny jsou často tandemově uspořádané, ale i rozptýlené po genomu
• duplikovány jsou celé úseky chromozómů Arabidopsis (odráží dávné duplikace)
• tandemové repetice (tvořeny z blízkých i vzdálených paralogů)
Počet členů rodiny (paralogů)
Homologie - orthology vs. paralogyOrthologní geny = geny u různých organismů, které jsou přímými potomky genu přítomného u společného předka těchto organismů
Paralogní geny = geny, které se duplikovali u daného druhu
Species A
Species B
AncestralSpecies
Gene A
Gene A”
Gene A’
Species A
Species B
AncestralSpecies
Gene A
Gene A” Gene A’”
Gene A’
Paralogous genes
Mechanismy zmnožení genů(zvýšení počtu paralogů)
• tandemové duplikace• transpozice• segmentální duplikace• celogenomové duplikace
Jak se liší geny v genomech různých druhů?
Geny Genové rodiny
Arabidopsis x Populus – značný překryv (cca 1,5 x více paralogů u topolu)
(Arabidopsis + Populus) x Oryza – mnoho genů specifických pro jednoděložné
i malé genomy obsahují řadu duplicit!
Duplikované úseky chromosómů tvoří 60 % genomu A. thaliana (67.9 Mb)
Polyploidie- polyploidizace výrazně zvyšuje plasticitu genomu - významná role v evoluci (nejen rostlin) - paleopolyploidie x neopolyploidie
- došlo x nedošlo k následné významné diploidizaci
- allopolyploidie x autopolyploidie (triploidní most)- různé či stejné genomy
Výhody polyploidie: vyšší plasticita – i ekologická, neofuncionalizace (hlízkové baktérie, dužnaté plody, ….)
Zmnožení chromozomálních sad - polyploidizace
x x
- splynutím neredukovaných gamet- „triploidní most“ (neredukovaná gameta triploida + redukovaná gameta)
autopolyploidie allopolyploidie
n = x = 4 n = x = 4 n = x = 4 n´ = x´ = 7
2n* = 4x = 16
2n* = 2x + 2x´ = 22
Podobná frekvence obou typů u polyploidních rostlinných druhů
- splynutí neredukovaných g.- spontánní zdvojení (endoreduplikace)
Zdvojení chromozómů je nutné pro meiózu(nejsou-li druhy blízce příbuzné se stejným počtem
chromozómů)
species A
species BX
sterile fertileGenome duplication
Přednostní párování homologních chromozómů
Mohou párovat i homeologní = příbuzné, ale pocházející od různých rodičů (u mezidruhových hybridů)
Příklad allopolyploidních genomůBrassica sp.
Druh Česky Karyotyp Genom
Brassica rapa
Brukev řepák 2n = 2x = 20
A
B. nigra B. černohořčice 2n = 2x = 16
B
B. oleracea B. zelná 2n = 2x = 18
C
B. juncea B. sítinovitá 2n = 4x = 36
AB
B. napus B. řepka 2n = 4x = 38
AC
B. carinata B. kýlnatá 2n = 4x = 34
BC
Brassica nigra
Brassica rapaBrassica olarecea
Brassica carinata Brassica juncea
Brassica napus
BB
AABB
AAAACC
BBCC
CC
allopolyploidi
Polyploidizace v evoluci rostlin
Datování celogenomových duplikacídle počtu synonymních mutací na synonymní místo - Ks
Phe Leu Met ValKs=3/2,66 UUU CUA AUG GUU
UUC UUG AUG GUU0 0 1/3 1/3 0 1 0 0 0 0 0 1
Ks
Počet genů
Fawcet et al. 2013
Porovnání dvojic paralogních genů
Peaky indikují celogenomové duplikace
Polyploidizace v evoluci rostlin• mnoho druhů neopolyploidních, zřejmě všechny paleopolyploidní• aneuploidní varianty - po allopolyploidizaci časté, př. hexaploidní pšenice - existují stabilní linie s chybějícím raménkem chromozómu• většina rostlin (všechny semenné) opakovaně v evoluci polyploidních:
Proč?Jaké jsou výhody?
Osudy zmnožených genů se liší – teorie genové rovnováhy (gene dosage balance)
• geny jejichž produkty přímo interagují (signální dráhy, podjednotky komplexů,.. tzv. „connected genes“) se snáze udrží po celogenomových duplikacích
- ztráta či dílčí zmnožení jedné z komponent vyvolá genovou nerovnováhu (v hladinách produktů!), která snižuje fitness - celý zmnožený komplex pak může být funkčně
specializován a zvyšovat komplexitu organismu(neofunctionalization, subfunctionalization)
- sekundární funkce zřejmě již přítomna u předka, - duplikace umožní adaptivní evoluci obou funkcí
bez selekčních zábran (nutnosti zachování primární funkce)
- Escape from adaptive conflict - EAC model
• u ostatních genů je tomu naopak – tyto geny se častěji ztratí po celogenomových duplikacích a lépe se udrží po případném dílčím zmnožení
Změny bezprostředně po vzniku allopolyploida různé u různých kříženců:- změny v metylaci DNA- ztráty částí či celých chromozómů (aneuploidie – problémy s
fertilitou)- často dochází k aktivaci TE- exprese homeologních genů zpravidla není v hybridu aditivní
- redukce může být asymetrická (vzhledem k rodičům)- transkriptom bývá celkově redukován více než genom- orgánové rozrůznění exprese (vzhledem k rodičovskému původu)- nová místa exprese - nová regulace
- „divergent resolution“ - speciace(ztráty různých kopií duplikovaných genů u různýchjedinců - letalita v F2 generaci (1/16) u esenciálních g.– může být základem reprodukční bariéry, sympatr. sp.
Tvorba haploidních rostlin- přeprogramováním vývoje buněk samčího či samičího gametofytu in vitro – netvoří se gamety, ale dochází k procesu analogickému embryogenezi (ale ne ze zygoty)
- zpravidla z prašníkových kultur (nezralých mikrospor) = androgeneze - možno i ze samičího gametofytu = gynogeneze
- haploidní rostliny jsou sterilní- spontánně či kolchicinem lze navodit endoreduplikaci (replikací bez mitózy) - vznikají dihaploidní kompletně homozygotní jedinci
androgeneze (pylová embryogeneze) u řepky
Počet chromozómů – význam?
• Velikosti chromozómů u rostlin
2,4 Mb Genlisea
30 Mb Arabidopsis
800 Mb Triticum
- jiné vazbové skupiny (možná výhoda?) (rekombinovatelnost genů)
- omezení fertility hybridů, …
Počty chromozómů
• Extrémy: – Haplopappus gracilis: 2n = 4
– Sedum suaveolens: 2n = cca 640
• Vnitrorodové rozdíly:
Luzula sp. (bika): – 2n = 6 až 66– holocentrické chromozómy– průměrná velikost chromozómu se
mezi druhy liší až 60x(Cullis, 2004)
L. pilosa
L. elegans
Počet chromozómů a velikost genomu
1n chromosome number
Poč
et d
ruhů
Poč
et d
ruhů
Genomy rostlin se podobají (i přes rozdílné počty chromozómů)
Paterson et al., Plant Cell 12: 1523-1539, 2000
Kolinearita x syntenie
Syntenie = přítomnost orthologních lokusů u dvou druhů na stejném chromozómu
A’B’Species A
Species B
AncestralSpecies
C’
A”B”C”
ABC
Kolinearita = skupina lokusů je u dvou druhů přítomna ve stejném pořadí
A’C’Species A
Species B
AncestralSpecies
B’
C”B”A”
ABC
Makro-kolinearita vs. mikro-kolinearita
A
B
C
A’
B’
C’
o
t
u
w
x q
n
k
vg
• kolinearita (daná společným původem) se v průběhu evoluce postupně vytrácí
A
B
C
A’
B’
C’
w
t
u
w
x x
u
t
vv
Časně po duplikaci patrnámakro- i mikro-kolinearita:
Postupem času se vytrácejí -makrokolinearita dokládá společný
původ v duplikaci velkých úseků, mikrokolineární úseky mohou být na zcela jiných pozicích
Mikro-kolinearita v NOD lokusu mezi vzdálenými druhy bez zřejmé makro-kolinearity
At – Arabidopsis, Pt – Populus, Lj – Lotus, Mt – Medicago, Os - Oryza
Studium kolinearity
Významné pro:- analýzy původu genů a fylogeneze velkých skupin- analýzy historických změn velikosti a uspořádání genomů (polyploidizace)- identifikace genů odolných vůči eliminaci po duplikaci (zvyšování komplexity, plasticity)- hledání konkrétních genů v genomech nesekvenovaných rostlin- rekonstrukce podoby ancestrálních genomů
Příčiny odlišností příbuzných genomů:- přeskupování mobilními elementy a rekombinací- inverze, delece, duplikace, ….- eliminace a mutageneze duplikovaných sekvencí
Porovnání genetické mapy rajčete a lilku
Kolineární úseky u různých druhů se liší především zastoupením repetitivní DNA
Kolinearita (syntenie) genomů lipnicovitých
Shrnutí• současnou podobu rostlinného genomu utvářejí
opakované cykly celkových (dílčích) duplikací a následných modifikací (funkční diverzifikací) či redukcí duplikovaného→ zvyšování komplexity a plasticity
• není genomů bez redundance
• rostlinné genomy jsou dodnes velice dynamické
• obrovský podíl často tvoří repetitivní DNA
Allopolyploidní tabáky – změny v obsahu DNA
Ukázka zastoupení repetitivní DNA u soji a silenky (klastry sekvenčně příbuzných repetic)
Silene latifolia
LTR/Gypsy, Copia = rodiny retrotranspozónů
clDNA = chloroplastová DNA(částečně i integrována v jádře)