Molekulární genetika rostlin

Preview:

DESCRIPTION

Molekulární genetika rostlin. Rostlinný genom Chromatin a metylace DNA RNA interference Mimojaderné genetické elementy Transpozóny, viry a viroidy Klasické genetické mapování Transgenoze a reverzní genetika Genomika Transkriptomika a proteomika. Členění rostlinného genomu. - PowerPoint PPT Presentation

Citation preview

Molekulární genetika rostlin

• Rostlinný jaderný genom • Chromatin a metylace DNA• RNA interference • Genom plastidů a mitochondrií• Transpozóny, viry a viroidy

• Genetika a genetické mapování• Transgenoze a reverzní genetika• Genomika, transkriptomika a proteomika

Členění rostlinného genomu

• jaderný genom = genom sensu stricto

• plastidy - plastom

• mitochondrie - chondriom

54 Mbp – Cardamine amara 124 852 Mbp - Fritillaria

149 000 Mbp - Paris japonica

- momentálně největší známý genom (mnohobuněčný)

http://data.kew.org/cvalues/

Velikost rostlinného genomu

C-value

• velikost nereplikovaného genomu v gametě

genome size (bp) = (0.910 x 109) x DNA content (pg)

DNA content (pg) = genome size (bp) / (0.910 x 109)

1 pg = cca 910 Mbp; MW (1 bp) = cca 660 Da

Velikosti rostlinných genomů 10 Mb Ostreococcus (jednobuněčná řasa)

54 Mb Cardamine amara

64 Mb Genlisea aurea

125 Mb Arabidopsis

500 Mb Oryza

5 000 Mb Hordeum

17 000 Mb Triticum

84 000 Mb Fritillaria (největší diploidní)

143 000 Mb Paris (oktaploidní)

- u krytosemenných rostlin rozdíly ve velikosti téměř 3 000 x - u nahosemenných velké genomy často kolem 10 000 Mb - rozdíly v počtu genů menší (cca 20 – 200 tis.?)

poměr objemu koulí 3000x

Velikosti rostlinného genomu

Co lze vyčíst?

- genomy v evoluci rostou (původnější jsou menší genomy)

- průměrný nárůst velikostigenomu je vyšší u jednoděložných

C-value paradox

• neexistuje korelace mezi komplexitou organismu a velikostí jeho genomu

• i genomy fylogeneticky blízkých organismů se často výrazně liší velikostí genomu

Příčiny: - duplikace úseků rostlinné DNA či celých genomů

(polyploidizace) - množení invazní DNA (transpozóny) - ale i redukce velikosti rekombinací a delecemi

(př. 2n bavlníky)! - velikost genomu jen částečně koreluje se sekvenční

komplexitou genomu (informační bohatostí)

odbočka: sekvenční komplexita(~ množství nesené informace)

Repetitivní:AAAAAAAAAAAAAAAAAAAAA komplexita 1 (21xA)ATCATCATCATCATCATCATC komplexita 3 (7xATC) (u kódující sekvence je množství informace různé)

Unikátní:ATCGTATCGCGATTTTAACGT komplexita 21 (1xAT…)

- repetitivnost/unikátnost záleží na velikosti posuzovaného „okna“ (= velikosti analyzovaných fragmentů DNA)

Sekvenční komplexita rostlinných genomů

vysoce repetitivní sekvencestředně repetitivní sekvencejedinečné sekvence Sekvenční

komplexita

Reasociační kinetika - měření komplexity genomu

(analýzy genomů nejen v předsekvenační době)

• DNA fragmentována na 300 - 500 bp fragmenty a denaturována

• průběh reasociace sledován v čase (chromatografické oddělení ss a ds DNA)

• analýzou kinetiky (Cot křivek) lze zjistit podíl jedinečných a opakovaných sekvencí:

princip: vzácné sekvence reasociují pomaleji než hojné (nižší pravděpodobnost setkání)

Reasociační kinetika- vliv komplexity DNA

Eukaryotické genomy zpravidla obsahují tři frakce sekvencí lišící se komplexitou

vysoce repetitivní = nízká komplexita

středně repetitivní

unikátní sekvence= vysoká komplexita

Typy sekvencí v jaderném genomu(členění není zcela jednoznačné)

• Jedinečné sekvence – geny i nekódující DNA

• Středně repetitivní DNA– Tandemové repetice rRNA, tRNA a histonových genů (jejichž produkty jsou

potřeba ve větším množství)– Mnohočetné genové rodiny (jen při vysokém % identity nukleotidových

sekvencí – jinak řazeny mezi jedinečné sekvence)– Pohyblivé genetické elementy (transpozóny)

- i vysoké počty repetic (někdy spadají pod vysoce repetitivní)

• Sekvence s nízkou komplexitou (vysoce repetitivní)– Tandemově uspořádané krátké sekvence (SSR)– Centromery (180 bp repeat Arabidopsis) a telomery (TTTAGGG)n

- mohou se chovat jako satelitní DNA (micro-, mini-)

Zastoupení sekvencí s různou kompexitou v genomech se liší!

jedinečné sekvencestředně repetitivní sekvencevysoce repetitivní sekvence

(Westhoff: Molecular plant development, 1998)

Reasociační kinetika malých a velkých genomů

Rozdíly v uspořádání velkých a malých genomů

velké genomy: geny přítomné v „gene-rich“ ostrovech mezi dlouhými úseky nekódující, zpravidla repetitivní DNA

Rekonstrukce postupné kumulace mobilních elementů v několika lokusech genomu kukuřice

Ve sledovaném úseku u prosa nejsou žádné transpozóny (TE), u kukuřice tvoří 60 % délky

Centromerové 180 bp A.th.

45S rDNA Crocus(Heslop-Harrison, Plant Cell 12:617, 2000)

Repetitivní sekvence lze detekovat in situ (FISH)(dnes již i unikátní sekvence)

telomer. rep. žita (TTTAGGG)n

subtelomer. rep. žita

Sekvenování rostlinných genomůhttp://genomevolution.org/wiki/index.php/Sequenced_plant_genomes

Stav k 4/13 – (šedivě méně kompletní genomy)

Sekvenování velkých genomů

- sekvenování po částech (chromozómech)- sekvenování nemetylované DNA (= transkripčně aktivní)- sekvenování ESTs

odbočka – definice pojmů: Expressed Sequence Tags (ESTs)

- krátké sekvenované úseky cDNA (300-600 nt)- úseky transkribovaných genů (primárně z mRNA)

- alternativní zdroj kódujících sekvencí u velkých genomů(rychlé a levné)

- velmi redundantní, ale současně neúplné

Příprava EST knihovny

- mRNA

- RT s oligoT primerem – cDNA

- štěpení heteroduplexu RNázouH

- syntéza 2. vlákna cDNA

- štěpení restriktázou

- ligace adaptorů klonování

sekvenace

- často jen fragmenty genů (někdy lze poskládat celé)- různé hladiny transkriptů (redundance x absence)- genová exprese regulována orgánově, časově, vývojově, environmentálně, …- chybí regulační sekvence (promotory, introny,...)

Výhody: jen transkribované (=aktivní) geny, bez intronů (kombinací s genomovou – identifikace reg. sekvencí), …

Problémy (slabiny) EST knihoven:(v porovnání s genomovou knihovnou)

Arabidopsisthaliana

1 týden 3 týdny

4 týdny 6 týdnů

Genom Arabidopsis: 125 Mbp

genyESTsTE = transposible elements

vysoká hustota nízká hustota

genyESTsTE

genyESTsTE

genyESTsTE

genyESTsTE

Predikce počtu genů v genomu

Feature Value

DNA molecule Chr.1 Chr.2 Chr.3 Chr.4 Chr.5 SUM

Length (bp)Top arm (bp)Bottom arm (bp)

Base composition (%GC) Overall Coding Non-coding

Number of genes Gene density (kb per gene ) Average gene Length (bp) Average peptide Length (bp)

Exons Number Total length (bp) Average per gene Average size (bp)

Number of genesWith ESTs (%) Number of ESTs

29,105,11114,449,21314,655,898

33.444.032.4

6,5434.0

2,078

446

35,4828,772,5595.4247

60.8

30,522

19,646,9453,607,09116,039,854

35.544.032.9

4,0364.9

1,949

421

19,6315,100,2884.9259

56.9

14,989

23,172,61713,590,2689,582,349

35.444.333.0

5,2204.5

1,925

424

26,5706,654,5075.1250

59.8

20,732

17,549,8673,052,10814,497,759

35.544.132.8

3,8254.6

2,138

448

20,0735,150,8835.2256

61.4

16,605

25,53,40911,132,19214,803,217

34.544.132.5

5,8744.4

1,974

429

31,2267,571,0135.3242

61.4

22,885

115,409,949

25,49827,206 protein cod.+ MIR, …

132,98233,249,250

105,773

Genom Arabidopsis - statistika

Většina rostlinných genů tvoří genové rodiny

• genové rodiny jsou často tandemově uspořádané, ale i rozptýlené po genomu

• duplikovány jsou celé úseky chromozómů Arabidopsis (odráží dávné duplikace)

• tandemové repetice (tvořeny z blízkých i vzdálených paralogů)

Počet členů rodiny (paralogů)

Homologie - orthology vs. paralogyOrthologní geny = geny u různých organismů, které jsou přímými potomky genu přítomného u společného předka těchto organismů

Paralogní geny = geny, které se duplikovali u daného druhu

Species A

Species B

AncestralSpecies

Gene A

Gene A”

Gene A’

Species A

Species B

AncestralSpecies

Gene A

Gene A” Gene A’”

Gene A’

Paralogous genes

Mechanismy zmnožení genů(zvýšení počtu paralogů)

• tandemové duplikace• transpozice• segmentální duplikace• celogenomové duplikace

Jak se liší geny v genomech různých druhů?

Geny Genové rodiny

Arabidopsis x Populus – značný překryv (cca 1,5 x více paralogů u topolu)

(Arabidopsis + Populus) x Oryza – mnoho genů specifických pro jednoděložné

i malé genomy obsahují řadu duplicit!

Duplikované úseky chromosómů tvoří 60 % genomu A. thaliana (67.9 Mb)

Polyploidie- polyploidizace výrazně zvyšuje plasticitu genomu - významná role v evoluci (nejen rostlin) - paleopolyploidie x neopolyploidie

- došlo x nedošlo k následné významné diploidizaci

- allopolyploidie x autopolyploidie (triploidní most)- různé či stejné genomy

Výhody polyploidie: vyšší plasticita – i ekologická, neofuncionalizace (hlízkové baktérie, dužnaté plody, ….)

Zmnožení chromozomálních sad - polyploidizace

x x

- splynutím neredukovaných gamet- „triploidní most“ (neredukovaná gameta triploida + redukovaná gameta)

autopolyploidie allopolyploidie

n = x = 4 n = x = 4 n = x = 4 n´ = x´ = 7

2n* = 4x = 16

2n* = 2x + 2x´ = 22

Podobná frekvence obou typů u polyploidních rostlinných druhů

- splynutí neredukovaných g.- spontánní zdvojení (endoreduplikace)

Zdvojení chromozómů je nutné pro meiózu(nejsou-li druhy blízce příbuzné se stejným počtem

chromozómů)

species A

species BX

sterile fertileGenome duplication

Přednostní párování homologních chromozómů

Mohou párovat i homeologní = příbuzné, ale pocházející od různých rodičů (u mezidruhových hybridů)

Příklad allopolyploidních genomůBrassica sp.

Druh Česky Karyotyp Genom

Brassica rapa

Brukev řepák 2n = 2x = 20

A

B. nigra B. černohořčice 2n = 2x = 16

B

B. oleracea B. zelná 2n = 2x = 18

C

B. juncea B. sítinovitá 2n = 4x = 36

AB

B. napus B. řepka 2n = 4x = 38

AC

B. carinata B. kýlnatá 2n = 4x = 34

BC

Brassica nigra

Brassica rapaBrassica olarecea

Brassica carinata Brassica juncea

Brassica napus

BB

AABB

AAAACC

BBCC

CC

allopolyploidi

Polyploidizace v evoluci rostlin

Datování celogenomových duplikacídle počtu synonymních mutací na synonymní místo - Ks

Phe Leu Met ValKs=3/2,66 UUU CUA AUG GUU

UUC UUG AUG GUU0 0 1/3 1/3 0 1 0 0 0 0 0 1

Ks

Počet genů

Fawcet et al. 2013

Porovnání dvojic paralogních genů

Peaky indikují celogenomové duplikace

Polyploidizace v evoluci rostlin• mnoho druhů neopolyploidních, zřejmě všechny paleopolyploidní• aneuploidní varianty - po allopolyploidizaci časté, př. hexaploidní pšenice - existují stabilní linie s chybějícím raménkem chromozómu• většina rostlin (všechny semenné) opakovaně v evoluci polyploidních:

Proč?Jaké jsou výhody?

Osudy zmnožených genů se liší – teorie genové rovnováhy (gene dosage balance)

• geny jejichž produkty přímo interagují (signální dráhy, podjednotky komplexů,.. tzv. „connected genes“) se snáze udrží po celogenomových duplikacích

- ztráta či dílčí zmnožení jedné z komponent vyvolá genovou nerovnováhu (v hladinách produktů!), která snižuje fitness - celý zmnožený komplex pak může být funkčně

specializován a zvyšovat komplexitu organismu(neofunctionalization, subfunctionalization)

- sekundární funkce zřejmě již přítomna u předka, - duplikace umožní adaptivní evoluci obou funkcí

bez selekčních zábran (nutnosti zachování primární funkce)

- Escape from adaptive conflict - EAC model

• u ostatních genů je tomu naopak – tyto geny se častěji ztratí po celogenomových duplikacích a lépe se udrží po případném dílčím zmnožení

Změny bezprostředně po vzniku allopolyploida různé u různých kříženců:- změny v metylaci DNA- ztráty částí či celých chromozómů (aneuploidie – problémy s

fertilitou)- často dochází k aktivaci TE- exprese homeologních genů zpravidla není v hybridu aditivní

- redukce může být asymetrická (vzhledem k rodičům)- transkriptom bývá celkově redukován více než genom- orgánové rozrůznění exprese (vzhledem k rodičovskému původu)- nová místa exprese - nová regulace

- „divergent resolution“ - speciace(ztráty různých kopií duplikovaných genů u různýchjedinců - letalita v F2 generaci (1/16) u esenciálních g.– může být základem reprodukční bariéry, sympatr. sp.

Tvorba haploidních rostlin- přeprogramováním vývoje buněk samčího či samičího gametofytu in vitro – netvoří se gamety, ale dochází k procesu analogickému embryogenezi (ale ne ze zygoty)

- zpravidla z prašníkových kultur (nezralých mikrospor) = androgeneze - možno i ze samičího gametofytu = gynogeneze

- haploidní rostliny jsou sterilní- spontánně či kolchicinem lze navodit endoreduplikaci (replikací bez mitózy) - vznikají dihaploidní kompletně homozygotní jedinci

androgeneze (pylová embryogeneze) u řepky

Počet chromozómů – význam?

• Velikosti chromozómů u rostlin

2,4 Mb Genlisea

30 Mb Arabidopsis

800 Mb Triticum

- jiné vazbové skupiny (možná výhoda?) (rekombinovatelnost genů)

- omezení fertility hybridů, …

Počty chromozómů

• Extrémy: – Haplopappus gracilis: 2n = 4

– Sedum suaveolens: 2n = cca 640

• Vnitrorodové rozdíly:

Luzula sp. (bika): – 2n = 6 až 66– holocentrické chromozómy– průměrná velikost chromozómu se

mezi druhy liší až 60x(Cullis, 2004)

L. pilosa

L. elegans

Počet chromozómů a velikost genomu

1n chromosome number

Poč

et d

ruhů

Poč

et d

ruhů

Genomy rostlin se podobají (i přes rozdílné počty chromozómů)

Paterson et al., Plant Cell 12: 1523-1539, 2000

Kolinearita x syntenie

Syntenie = přítomnost orthologních lokusů u dvou druhů na stejném chromozómu

A’B’Species A

Species B

AncestralSpecies

C’

A”B”C”

ABC

Kolinearita = skupina lokusů je u dvou druhů přítomna ve stejném pořadí

A’C’Species A

Species B

AncestralSpecies

B’

C”B”A”

ABC

Makro-kolinearita vs. mikro-kolinearita

A

B

C

A’

B’

C’

o

t

u

w

x q

n

k

vg

• kolinearita (daná společným původem) se v průběhu evoluce postupně vytrácí

A

B

C

A’

B’

C’

w

t

u

w

x x

u

t

vv

Časně po duplikaci patrnámakro- i mikro-kolinearita:

Postupem času se vytrácejí -makrokolinearita dokládá společný

původ v duplikaci velkých úseků, mikrokolineární úseky mohou být na zcela jiných pozicích

Mikro-kolinearita v NOD lokusu mezi vzdálenými druhy bez zřejmé makro-kolinearity

At – Arabidopsis, Pt – Populus, Lj – Lotus, Mt – Medicago, Os - Oryza

Studium kolinearity

Významné pro:- analýzy původu genů a fylogeneze velkých skupin- analýzy historických změn velikosti a uspořádání genomů (polyploidizace)- identifikace genů odolných vůči eliminaci po duplikaci (zvyšování komplexity, plasticity)- hledání konkrétních genů v genomech nesekvenovaných rostlin- rekonstrukce podoby ancestrálních genomů

Příčiny odlišností příbuzných genomů:- přeskupování mobilními elementy a rekombinací- inverze, delece, duplikace, ….- eliminace a mutageneze duplikovaných sekvencí

Porovnání genetické mapy rajčete a lilku

Kolineární úseky u různých druhů se liší především zastoupením repetitivní DNA

Kolinearita (syntenie) genomů lipnicovitých

Shrnutí• současnou podobu rostlinného genomu utvářejí

opakované cykly celkových (dílčích) duplikací a následných modifikací (funkční diverzifikací) či redukcí duplikovaného→ zvyšování komplexity a plasticity

• není genomů bez redundance

• rostlinné genomy jsou dodnes velice dynamické

• obrovský podíl často tvoří repetitivní DNA

Allopolyploidní tabáky – změny v obsahu DNA

Ukázka zastoupení repetitivní DNA u soji a silenky (klastry sekvenčně příbuzných repetic)

Silene latifolia

LTR/Gypsy, Copia = rodiny retrotranspozónů

clDNA = chloroplastová DNA(částečně i integrována v jádře)

Recommended