Upload
dugan
View
23
Download
3
Embed Size (px)
DESCRIPTION
Metody molekulární biologie v ekologii a systematice rostlin 8 . Mikrosatelity. Petr Koutecký & Jiří Košnar, 2011. Mikrosatelity - úvod. Mikrosatelity (SSR = S imple S equence R epeat; STR = S hort T andem R epeat; SRS = S imple R epetitive S equence) - PowerPoint PPT Presentation
Citation preview
Metody molekulární biologie v ekologii a systematice
rostlin
8. Mikrosatelity
Petr Koutecký & Jiří Košnar, 2011
Mikrosatelity - úvod
Mikrosatelity (SSR = Simple Sequence Repeat; STR = Short Tandem Repeat; SRS = Simple Repetitive Sequence)
jeden z typů tzv. variabilních repetitivních DNA sekvencí (VNTR = Variable Number Tandem Repeat)
jednotkou je opakující se sekvenční motiv = repetice, např. (CA)n:
CTTGGCGAGCACACACACACACACACACACGGTGACATCTCC
• motivem mono-, di- (AT, AG), tri- (GAA, AGT),... až hexanukleotidy
• variabilní počet opakování motivu: ~3-100
• motivy >10 repetic obvykle vysoce variabilní
minisatelit mikrosatelit
Další typy repetitivních sekvencí:
satelity – dlouhé motivy (2-)100-300(-několik tisíc) bp, velký počet opakování motivu (1000-100000 a více); okolí centromér chromozomů, tvoří heterochromatin
minisatelity – středně dlouhé motivy ~10-60bp, menší počet opakování než satelity (~20-50); subtelomerní (koncové) části chromozomů nebo centromery; využití - RFLP genomové DNA a hybridizace s minisatelitní sondou, nebo arbitrární PCR s primery s minisatelitním motivem – obdoba ISSR)
Mikrosatelity - úvod
Charakteristika
u rostlin jsou nejčastější motivy (A)n, (AT)n, (GA)n, (GAA)n
převážně jaderné, A/T motivy i v chloroplastu (ale nižší variabilita) klasifikace repeats:
• simple perfect – čisté opakování motivu, ideální případ (viz výše uvedené příklady)
• imperfect (interrupted) – např. (GT)3A(GT)6
• compound – např. (GA)4N12(CA)8
Mikrosatelity - úvod
Charakteristika
vysoce variabilní → populační genetika, studie blízce příbuzných taxonů
jaderné SSR jsou kodominantní specifický marker pro určitý druh nebo skupinu druhů vysoce reprodukovatelné
Mikrosatelity - úvod
Provedení metody PCR amplifikace konkrétního SSR lokusu: nutné znát primery z
okolí SSR – tzv. flanking regionu:
forward primer ►
◄ reverse primer
možnost tzv. multiplex PCR: do jedné reakce namíchány primerové páry pro více lokusů (každý pár naamplifikuje specificky svůj lokus)
primerové páry se ale nesmí příliš lišit parametry PCR amplifikace (teplota nasedání primerů, délka elongace apod.)
Mikrosatelity – princip metody
Provedení metody délková variabilita výsledného PCR produktu odráží počet
opakování motivu (repetic) je hodnocena pomocí fragmentační analýzy (FA, jeden z primerů
daného lokusu značen fluorescenční barvou), případně denaturačním PAA elektroforézou
FA - 3 barevně odlišené lokusy + size standard (červeně)
PAA (data z 1 lokusu)
Mikrosatelity – princip metody
Odečítání SSR alel: u diploidů (nebo haploidní fáze živ. cyklu) lze přesně odečíst, které
alely (=délkové varianty) jsou v genomu přítomny nutné znát délku repetice (mono-, di-, tri- atd. nukleotid) zohlednit tzv. stutter bands: artefakty PCR, sklouzáváním polymerázy
(polymeráza ale nejčastěji tvoří fragmenty správné délky → převládají nad artefakty); ztěžují interpretaci lokusů s >~20 repeticemi
homozygot je, když: nápadně nejvyšší pík je napravo, reálná alela = nejvyšší pík
ostatní patterny → heterozygot!
(stutter bands)
alely: 161+161
(vzdálenost stutter bands = délka repetice, např. 2bp)
Mikrosatelity – princip metody
Odečítání SSR alel:
heterozygot: reálné alely jsou dva nejvyšší píky
! heterozygot: reálné alely jsou dva nejvyšší píky vpravo (alely se liší o délku depetice – 161 a 163; delší 163 svými stuttery navyšuje píky směrem nalevo)
alely: 152+160
alely: 161+163
Mikrosatelity – princip metody
Odečítání SSR alel: u některých lokusů mohou být A-produkty: terminální transferázová
aktivita Taq polymerázy → na konec PCR produktu přidává A
homozygot
(A-produkty)
152 nemůže být druhou alelou heterozygota: nesedělo by násobkům dinukleotidové repetice!!!
(pro srovnání - heterozygot bez A-produktů) alely: 161+163
alely: 151+151
(vzdálenost A-produktů od alely příp. klasických stutter bands = 1bp)
(2bp)
Mikrosatelity – princip metody
Odečítání SSR alel:
u vyšších ploidií často nemožné přesně odečíst konstituci alel
např. když u tetraploida vidíme 2 alely - 160 a 162, tak může být:
2x(160)+2x(162)
3x(160)+162
160+3x(162)
• skóruje se např. jako dominantní (absence/presence, matice 0/1)
Mikrosatelity – princip metody
z publikací nebo databází:
x předpokladem je, že někdo už s daným organismem pracoval
pokud není dostupné přímo pro náš cílový organismus, můžeme zkusit primery navržené pro příbuzné druhy = cross-species amplification
pokusit se vyvinout vlastní, tzv. izolace SSR
Jak získat sekvence mikrosatelitních primerů?
Cross-species amplification: s rostoucí evol. vzdáleností klesá úspěšnost obvykle nutná optimalizace podmínek PCR, ne všechny lokusy se
podaří naamplifikovat, případně neamplifikují všechny vzorky = tvoří tzv. nulové alely (mutací v místě nasedání primerů)
i pokud primery amplifikují, může mít lokus např. sníženou variabilitu:
primery izolované z mechu Scorpidium cossonii – např. lokus (GT)16:
testován u Hamatocaulis vernicosus – nedostatečná variabilita, pouze 5 repetic:
Jak získat sekvence mikrosatelitních primerů?
Izolace SSR: několik různých protokolů
• tvorba SSR-enriched genomic library (obohacené knihovny)
• pomocí AFLP markerů
• pomocí ISSR markerů
• z EST library – expressed sequence tag:
total mRNA → cDNA → hledání SSR a design primerů
SSR z okolí kódujících oblastí → větší šance na úspěšnou cross-species amplification
možné využít i komerční služby vše většinou relativně finančně náročné (~40 tis. Kč a více)
Jak získat sekvence mikrosatelitních primerů?
Příprava SSR-enriched genomic library1. Izolace většího množství (~10-20 µg) kvalitní genomové DNA
2. Restrikce genomové DNA na fragmenty které lze sekvenovat (~500-1000 bp)
3. Na konce fragmentů navázány ligací krátké dsDNA fragmenty (linkery) s arbitrární sekvencí - umožní pozdější PCR amplifikaci a ligaci při klonování
+ restr. enzym
+ T4 ligáza, linkery
Jak získat sekvence mikrosatelitních primerů?
Příprava SSR-enriched genomic library4. K fragmentům přidána biotinylovaná sonda nesoucí určitý SSR motiv →
naváže se (hybridizuje) na fragmenty s daným SSR motivem
teplotní denaturace
+ sonda
5. Magnetické mikročástice (beads) pokryté streptavidinem → vazbou streptavidin-biotin vychytají fragmenty se SSR → vlastní SSR-enriched library (obohacená knihovna)
separace magnetem
+ roztok streptavidin-coated
beadsodsátí roztoku
Jak získat sekvence mikrosatelitních primerů?
Zpracování SSR-enriched genomic library6. Fragmenty z enriched library se namnoží PCR (sekvence linkerů slouží jako
PCR primery) a zaklonují → separace jednotlivých molekul
7. Klony screenovány sekvenací (případně předběžné ověření Southern blotting s příslušnou SSR sondou)
8. Design primerů, jejich PCR testování - zda netvoří nulové alely, zda jsou dostatečně variabilní…
Jak získat sekvence mikrosatelitních primerů?
Vypadá to (relativně) snadně, ale:
ne všechny SSR sondy na daný organismus fungují... jen zlomek (~5-15%) fragmentů obohacené knihovny nese skutečně
SSR... část SSR nepoužitelných - příliš krátké nebo naopak příliš dlouhé,
případně složité compound motivy... ne pro všechny fragmenty se podaří nadesignovat primery... ne všechny navržené primery skutečně fungují na vzorcích ...
Jak získat sekvence mikrosatelitních primerů?
Komerční služby:
např. osekvenování celého cílového genomu pomocí 454-pyrosekvenování (~45 tis. Kč, ale cena 1 sekvence je ~200x nižší než při klasickém sekvenování Sangerovou metodou):
• získá se velké množství (desítky tisíc) sekvencí o délce ~550 bp, zlomek z nich obsahuje SSR
nebo stejným způsobem osekvenovat vlastní SSR-enriched library (efektivnější než sekvenace genomu - vyšší výtěžek SSR fragmentů)
firmy často poskytnou i navržené primerové kombinace
Jak získat sekvence mikrosatelitních primerů?
Vyhodnocení mikrosatelitových dat
► Kodominantní» základní statistiky viz přednáška allozymy
• počet alel, polymorfní lokusy,…
• podíl heterozygotů, He, HW rovnováha,…
► Nulové alely» mutace v místě nasedání primerů
» nevzniká žádný produkt, jedinec hodnocen jako homozygot
» podhodnocení počtu heterozygotů
» lze odhalit jen při křížení / analýze potomstva
Vyhodnocení mikrosatelitových dat
► U vyšších ploidií problém s určením počtu alel heterozygotů» AAAB vs. AABB vs. ABBB» prakticky nelze z intenzit píků / proužků!
► Co s tím?» kódovat přítomnost / nepřítomnost alely = binární data
• ztráta informace
» za předpokladu allotetraploidie a pokud převažují vzorky s 1-2 alelami kódovat jako diploida
• automaticky předpokládá AABB
• problém, pokud jsou 3- nebo 4-alelické vzorky
• možné zkreslení výsledků
» pravděpodobnostní výpočty, odhady frekvence alel• např. program ATETRA
Mutační modely
► Diferenciace mezi populacemi – analogie FST, výpočet gene- tických vzdáleností,…
► Infinite alleles model (IAM)» všechny alely rovnocenné, stejná rychlost jejich tvorby» stejně dlouhé alely jsou homologické» toto se používá pro isozymy, ISSR, AFLP,…
► Stepwise mutation model (SMM) – nejčastěji používaný» alely vznikají postupně mutacemi o 1 krok (repetici), stejná rychlost v
obou směrech (prodloužení × zkrácení)» alely s podobnou délkou jsou si příbuznější» možná homoplazie (alela vzniká přidáním nebo zkrácením)» koeficient RST, resp. jeho odhad ρST, distance D1, Da, (δμ)2
► Two-phase model (TPM)» změna o jednotku rychlostí p, o více jednotek rychlostí 1-p
Identifikace klonů
► Multilokusové genotypy, shoda = klon (?)» výpočet pravděpodobnosti, že stejný genotyp vznikle nezávisle
pohlavním rozmnožováním
» statistika PSEX (PGEN) (Parks & Werth 1993, Am. J. Bot.)
• počítáno z frekvence alel a polymorfních lokusů a počtu vzorků
• klony = pouze pokud PSEX < 0.05 (nebo jiná hranice)
» clonal diversity: R = (G – 1) / (N – 1) (pro 1 klon pak vyjde 0)
► Různá rozlišovací síla» počet lokusů
» jejich variabilita (počet a frekvence alel)
dvě populace Cymodoce nodosa
Arnaud-Haond et al. 2005J. Heredity 96: 434-440
Populační studie – ochranářská
struktura populace, pole = 10 cm
Betty & Provan 2011, Ann. Bot. 107: 663–670
► Monotropa hypopitis v Sev. Irsku ► 8 lokusů, průměr 14 alel / lokus► F-statist., AMOVA, určení klonů
► překvapivě velký počet klonů, malý podíl vegetativního rozmn.
► FIS: v některých populacích hodně autogamie
► He: ochuzení proti střední Evropě
► mírná diferenciace mezi populacemi → nemíchat materiál, outbreeding depression
Populační studie - invazní
Huotari et al. 2011, Plant Syst. Evol. 294: 27-37► Elodea canadensis ve Finsku► předpoklad: klonální (dvojdomý, v
v Evropě chybí ♂), 1 zavlečení► 7 popul., 10 lokusů, 2-5 alel / lokus► zákl. statistiky, RST, pairwaise FST,
AMOVA, STRUCTURE
► 181 vzorků / 80 multi-locus genotypes► skoro 80% variability uvnitř populací, diferenciace mezi pop.,
potvrzuje i STRUCTURE (2 hlavní skupiny)► rozdíly proti americkým populacím (někt. lokusy se ani
neamplifikují) → možná relativně rychlá evoluce► vícenásobné zavlečení × evoluce somatickými mutacemi ?
Rozmnožovací systém – šíření pylu
Kettle et al. 2011, Persp Plant Ecol. Evol. Syst. 13: 45–51► tři různé Dipterocarpaceae na Borneu na ploše řádu km2
► liší se velikostí květů → velikost opylovačů → vzdálenost roznosu pylu; očekávána korelace genetické struktury a roznosu pylu (roznos semen nehraje roli, těžká)
► 6 lokusů, 5-17 alel / lokus► klasické statistiky; BAPS
+STRUCTURE; prostor. autokorelace; kinship coefficient
kinship coefficient
pravděpodobnost, že alela v daném páru vzorků má stejný původ (rodiče)
sourozenci 0.25, nevlastní s. 0.125
Loiselle et al. 1995, Am. J. Bot. 82: 1420-1425
počítán z frekvencí alel a počtu jedinců
přes všechny páry jedinců a všechny lokusy, korekce na konečnou velikost populace
permutační test
Kettle et al. 2011, Persp Plant Ecol. Evol. Syst. 13: 45–51
► převažuje cizosprášení, FIS ~ 0
► zřetelná autokorelace u 2 druhů s menšími květy → vysvětlitelné doletem opylovačů
► pouze u Parashorella tomentella detekována gen. struktura -klíčí v porostních mezerách, zdroj semen omezený na okolní porost → shluky podobných jedinců
Rozmnožovací systémy – šíření pylu
Klonalita + rozmnožovací systém
Zipperle et al. 2011, Ann. Bot. 107: 127–134
► porost Zostera noltii na pří-livových plošinách v Baltu
► trvalka, ale velký obrat ramet a náhrada ze semen
► hermafrodit, hydrogamní, předpokládáno opylovánív rámci „fleku“ (klonu) → inbreeding
► plocha 100m2, 256 plodných lodyh, analýza dosp. + semena
► 9 lokusů, klonální struktura, F-statist., hetero-zygozita, původ semen (MLTR, Cervus)
Klonalita + rozmnožovací systém
Zipperle et al. 2011, Ann. Bot. 107: 127–134
► vysoká míra cizosprášení (~ 90%), zbytek převážně auto- a geitonogamie, velmi málo biparental imbreeding (opylení od jiného, ale příbuzného jedince)
► semena v rámci květenství většinou mají různé otce
► ale jen 50% vajíček je oplodněno – vysvětlováno obecně nedostatkem pylu (třeba 104-105 zrn na jedno vajíčko)
► efektivní vzdálenost šíření pylu je pouze několik m
► dále je v článku diskutován vliv režimu disturbancí na rozmnožování a přežívání populace…
Hybridizace
Snow et al. 2010, Am. J. Bot. 97: 2061–2067► Typha latifolia (pův.), T. angustifolia (pův?,
zavlečená), T. ×glauca (invaz) v Americe► kříženec údajně sterilní, silně klonální► starší studie 30 druhově specifických RAPD,
nyní 9 SSR primerů, 7 druhově (±) specifické
► FST, STRUCTURE, morfometika
► F1 hybridi kombinují alely od obou rodičů
► existují zpětní hybridi (→ není to sterilní)
► potvrzuje i morfologie
Vývoj areálu / fylogeografie
Kuss et al. 2011, Persp Plant Ecol. Evol. Syst. 13: 101–110► Campanula thyrsoides v Alpách, 2 poddruhy
JV Alpy × zbytek (S obvod Alp)► 51 populací, 5 lokusů► populační variabilita, STRUCTURE, AMOVA,
výpočet hranic v programu Barriershttp://www.mnhn.fr/mnhn/ecoanthropologie/software/barrier.html
► zjištěny 3 významnější zlomy v geneticképodobnostinamapování gen. nepo-dobností sousedů
výběr nejvyšší hodnoty,protažení hranice kokrajům; další kolo,…
bootstrap (100 matic)
Vývoj areálu / fylogeografie
Kuss et al. 2011, Persp. Plant Ecol. Evol. Syst. 13: 101–110► 4 genetické skupiny, 1
výrazně jiná (JV poddruh)► hranice skupin souhlasí
s programem Barriers► asi alopatricky se vyvíje-
jící skupiny + pozdějšíkontakt a tok genů
► souvislost s přežitím zalednění (2 poddruhy, v severním asi více refugií)
► …ale populace z potenciálně refugiálních míst (stanovených podle jiných prací) nejsou geneticky bohatší, rozdíly možná později setřeny genovým tokem
Fylogeneze, vymezení taxonů
► pro fylogenezi používat mikrosatelity opatrně:» relativně málo znaků» homoplazie» neznáme rozmístění lokusů v genomu, lokus je „bodová“ informace
(i méně než 1 sekvenovaný úsek!)
► podmínky použití» velké množství lokusů (→ šance pokrýt různá místa genomu)» ideálně fyzická mapa (většinou nemáme)» hlavně u blízkých druhů a na nižších úrovních
► použití pro vymezení (kryptických) druhů / linií:Ramaiya et al. 2010, Am. J. Bot. 97: 1707–1718» játrovka Frullania asagrayana, sekvenčně zcela uniformní, ale SSR
ukazují na přítomnost 2 linií
Fylogeneze
Bowles et al. 2011, Plant Syst. Evol. 287: 85–97► rod Carthamus, hrubá fylogeneze
a identifikace příbuzných užitkového druhu C. tinctorius
► ITS a 11 nekódujících úseků cpDNA – z těch jen 2 variabilní
► rozlišeny 2 hlavní sekce rodu, vztahy uvnitř nich nejasné
► některé druhy nejsou podlesekvencí monofyletické – asi důsledek hybridizace / introgrese
► někt. druhy také allopolyplodi
C. lanatus
Fylogeneze
Bowles et al. 2011, Plant Syst. Evol. 287: 85–97
Fylogeneze
Bowles et al. 2011, Plant Syst. Evol. 287: 85–97► celkově nedostatečná variabilita
sekvencí► vyvinuto 23 mikrosatelitových lokusů► analýza sekce Carthamus, druh z druhé
sekce jako outgroup► výpočet distanční matice, NJ strom
► druh C. oxyacanthus (jeden zmožných předků) jasně odlišený
► předkem C. tinctorius asi C. palaestinus► pozice C. persicus nejasná (jen 1 vzorek)
C. tinctorius
Fylogeneze
Bowles et al. 2011, Plant Syst. Evol. 287: 85–97
Software► MSA (Microsatellite Analyzer)
http://i122server.vu-wien.ac.at/MSA/MSA_download.html► MICROSAT
http://hpgl.stanford.edu/projects/microsat/
► The Excel Microsatellite Toolkit http://www.animalgenomics.ucd.ie/sdepark/ms-toolkit/kontrola dat, převod do formátů pro Arlequin, Microsat, Fstat,…
► ATETRAhttp://www.vub.ac.be/APNA/ATetra.htmlodhad frekvencí alel a genotypů u tetraploidů
► Cervushttp://www.animalgenomics.ucd.ie/sdepark/ms-toolkit/frekvence alel, parentage analysis (kodominantní data, diploidi)
► Genclonehttp://www.ccmar.ualg.pt/maree/software.php?soft=genclonidentifikace multilokusových genotypů, výpočet Psex, kinship coefficient,…