Transcript
Page 1: Genetyka Czl Ewolucja Cwiczenia

Dobór naturalny w sekwencjach genów

Metody analizy

Page 2: Genetyka Czl Ewolucja Cwiczenia

Podstawy ewolucji molekularnej

Ewolucja sekwencji DNA i białek

Page 3: Genetyka Czl Ewolucja Cwiczenia

Zmiany genetyczne w ewolucji

3

}  Mutacje }  tworzą nowe allele genów

}  Inwersje }  zmieniają układ genów na chromosomach }  mogą uniemożliwić rekombinację na danym odcinku i

doprowadzić do utrwalenia haplotypu }  Duplikacje

}  dotyczą fragmentów DNA, w tym całych genów }  lub całych chromosomów i całych genomów }  główne źródło innowacji ewolucyjnej

}  Transfer horyzontalny }  w tym zdarzenia symbiotyczne

Page 4: Genetyka Czl Ewolucja Cwiczenia

Substytucje

4

}  Tranzycje zachodzą w naturze częściej od transwersji }  mimo tego, że możliwych transwersji jest więcej }  stosunek ts/tv od ~2 (nDNA) do ~15 (mtDNA człowieka) }  wyjątek – mtDNA roślin }  duże różnice ts/tv u różnych grup organizmów

Page 5: Genetyka Czl Ewolucja Cwiczenia

Tranzycje i transwersje

5

}  Dlaczego tranzycje są częstsze? }  Wyjaśnienia selekcyjne (tranzycje rzadziej zmieniają

aminokwas i częściej są neutralne) }  Ale:

}  tranzycje są częstsze też w genach rRNA, pseudogenach i obszarach niekodujących

}  tranzycje są częstsze w pozycjach 4-krotnie zdegenerowanych (kodony typu CUN – Leu)

Page 6: Genetyka Czl Ewolucja Cwiczenia

Tranzycje i transwersje

6

}  Dlaczego tranzycje są częstsze? }  Wyjaśnienia mechanistyczne – mechanizmy

powstawania i naprawy mutacji }  Tranzycje powstają w wyniku m. in.:

}  przejść tautomerycznych }  deaminacji (np. oksydacyjnej)

}  Tranzycje w mniejszym stopniu zaburzają strukturę podwójnej helisy podczas replikacji }  mniejsza wydajność naprawy przez system MMR

}  Korelacje z: }  zawartością par G/C w genomie }  aktywnością transkrypcyjną }  tempem metabolizmu

Page 7: Genetyka Czl Ewolucja Cwiczenia

Modele ewolucji sekwencji

7

}  Badając ewolucję nie dysponujemy z reguły sekwencją przodka

}  Liczbę mutacji musimy oszacować na podstawie różnic między sekwencjami współczesnymi

}  Konieczne jest uwzględnienie wielokrotnych mutacji w tej samej pozycji, zwłaszcza dla bardziej odległych sekwencji

Page 8: Genetyka Czl Ewolucja Cwiczenia

Modele ewolucji sekwencji

8

}  Modele Markova – stan w pokoleniu n +1 zależy tylko od stanu w pokoleniu n i reguł przekształcenia (macierz prawdopodobieństw zmiany stanów)

}  Modele o różnym stopniu skomplikowania }  Mogą uwzględniać:

}  mutacje wielokrotne w tej samej pozycji (poprawka Poissona)

}  różne prawdpodobieństwa zmian nukleotydowych (lub białkowych)

}  różne prawdopodobieństwo mutacji w różnych pozycjach sekwencji

}  różne częstości nukleotydów

Page 9: Genetyka Czl Ewolucja Cwiczenia

Modele ewolucji sekwencji

9

}  Modele Markova – stan w pokoleniu n +1 zależy tylko od stanu w pokoleniu n i reguł przekształcenia (macierz prawdopodobieństw zmiany stanów)

}  Modele o różnym stopniu skomplikowania }  Mogą uwzględniać:

}  mutacje wielokrotne w tej samej pozycji (poprawka Poissona)

}  różne prawdpodobieństwa zmian nukleotydowych (lub białkowych)

}  różne prawdopodobieństwo mutacji w różnych pozycjach sekwencji

}  różne częstości nukleotydów

Page 10: Genetyka Czl Ewolucja Cwiczenia

Modele ewolucji DNA – model Jukesa-Cantora

}  Jednakowe częstości nukleotydów

(f=0,25)

}  Jednakowe prawdopodobieństwo każdej substytucji

}  Odległość po poprawce wynosi:

}  Przykładowo:

DOBS=0.43 => DJC=0.64

A C G T

A 1-3α α α α

C α 1-3α α α

G α α 1-3α α

T α α α 1-3α

10

DJC = −34ln(1− 4

3D)

Page 11: Genetyka Czl Ewolucja Cwiczenia

Inne modele

}  Kimura (K80, dwuparametrowy) - różne prawdopodobieństwo tranzycji i transwersji

}  Felsenstein (F81), Hasegawa-Kishino-Yano (HKY85) - różne częstości nukleotydów (F81) + różne prawd. tranzycji i transwersji (HKY85)

}  GTR (General Time Reversible, Tavare ‘86)

11

Page 12: Genetyka Czl Ewolucja Cwiczenia

Model GTR

}  Różne prawdopodobieństwo każdej substytucji (ale symetrycznie, czyli np. A→T = T→A) - 6 parametrów

}  Różne częstości nukleotydów - 4 parametry

12

Page 13: Genetyka Czl Ewolucja Cwiczenia

}  Proste modele zakładają jednakowe prawdopodobieństwo zmiany w każdej pozycji - nierealistyczne

}  Rozkład prawdopodobieństw zmian w różnych pozycjach – rozkład gamma

Rozkład gamma

13

Page 14: Genetyka Czl Ewolucja Cwiczenia

Mutaje na poziomie kodu

14

}  Mutacje mogą: }  zmienić kodon na inny, ale kodujący ten sam aminokwas

}  mutacje synonimiczne }  zmienić kodon na kodujący inny aminokwas

}  mutacje niesynonimiczne }  zmienić kodon na kodon STOP

}  mutacje nonsens }  spowodować zmianę fazy odczytu }  wpłynąć na ekspresję genu

Page 15: Genetyka Czl Ewolucja Cwiczenia

Mutacje i dobór naturalny

15

}  Efekty działania mutacji obserwujemy pośrednio }  różnice sekwencji między populacjami (gatunkami) }  polimorfizm sekwencji w obrębie populacji

}  Na allele wytworzone przez mutacje może działać dobór

}  Za zmiany częstości powstających alleli może odpowiadać dryf genetyczny

}  Obserwujemy mutacje utrwalone całkowicie lub częściowo (polimorfizmy) w puli genowej

Page 16: Genetyka Czl Ewolucja Cwiczenia

Podstawowe pytanie ewolucji molekularnej

16

}  Jaka jest rola dryfu i doboru w wyjaśnieniu obserwowanego zróżnicowania sekwencji? }  wewnątrzpopulacyjnego (polimorfizmy) }  międzygatunkowego

}  Pytanie dotyczy zróżnicowania ilościowego! }  Nikt nie podaje w wątpliwość tego, że adaptacje w

ewolucji powstają dzięki działaniu doboru!

Page 17: Genetyka Czl Ewolucja Cwiczenia

Dobor czy dryf?

17

}  Selekcjonizm }  większość utrwalonych mutacji została

wyselekcjonowana przed dobór }  większość polimorfizmów jest utrzymywana przez dobór

}  dobór równoważący, naddominacja, dobór zależny od częstości

}  Neutralizm (Kimura, 1968) }  większość utrwalonych mutacji została utrwalona przez

dryf }  za większość polimorfizmów odpowiada dryf }  mutacje utrwalane przez dobór są rzadkie, nie mają

wpływu na ilościową analizę zmienności molekularnej

Page 18: Genetyka Czl Ewolucja Cwiczenia

Mutacje i dobór

18

}  niekorzystne (szkodliwe) }  s < 0 }  eliminowane przez dobór (oczyszczający/negatywny)

}  neutralne }  s ≈ 0 (a konkretniej, s ≤ 1/4N) }  utrwalane przez dryf

}  korzystne }  s > 0 }  utrwalane przez dobór (z udziałem dryfu dla niewielkich

s)

Page 19: Genetyka Czl Ewolucja Cwiczenia

Selekcjonizm i neutralizm

19

}  Selekcjonizm: }  większość mutacji jest niekorzystna }  większość utrwalonych mutacji jest korzystna }  mutacje neutralne są rzadkie (nie częstsze od

korzystnych)

}  Neutralizm }  większość mutacji jest niekorzystna lub neutralna }  większość utrwalonych mutacji jest neutralna }  mutacje korzystne są rzadkie (znacznie rzadsze od

neutralnych)

Page 20: Genetyka Czl Ewolucja Cwiczenia

Selekcjonizm i neutralizm

20

selekcjonizm neutralizm pan-neutralizm

Neutralizm nie oznacza pan-neutralizmu, czyli negowania znaczenia selekcyjnego mutacji!

Page 21: Genetyka Czl Ewolucja Cwiczenia

Przesłanki teorii neutralnej

21

}  Tempo zmian sekwencji i polimorfizm są zbyt duże, by dały się wyjaśnić doborem

}  Stałe tempo ewolucji molekularnej (zegar molekularny)

}  Sekwencje o mniejszym znaczeniu funkcjonalnym (pseudogeny, mniej istotne obszary białek) ewoluują szybciej, niż obszary kluczowe dla funkcji

Page 22: Genetyka Czl Ewolucja Cwiczenia

Stałe tempo ewolucji molekularnej

22

}  Wiele sekwencji ewoluuje w stałym tempie }  Tempo to jest różne dla różnych sekwencji, ale stałe w

czasie ewolucji dla danej sekwencji

}  Tzw. zegar molekularny Różnice sekwencji globin kręgowców

Page 23: Genetyka Czl Ewolucja Cwiczenia

Tempo ewolucji i dryf

23

}  Neutralny dryf jest procesem losowym, ale jego tempo będzie stałe w odpowiednio długim czasie

}  Zależy tylko od częstości mutacji (jedna zmiana na 1/µ pokoleń)

}  Dla doboru stałe tempo zmian oznacza stałe tempo zmian środowiska

}  Tempo zmian adaptacyjnych nie wydaje się być stałe

Page 24: Genetyka Czl Ewolucja Cwiczenia

Zegar molekularny

24

}  Jest konsekwencją neutralnego modelu ewolucji }  Tempo akumulacji zmian w danej sekwencji jest stałe

}  ale różne dla różnych sekwencji }  Weryfikacja – test względnego tempa

}  W rzeczywistości testuje stałość tempa pomiędzy gałęziami, ale nie w czasie

B C A

KAC - KBC = 0

Page 25: Genetyka Czl Ewolucja Cwiczenia

Zegar molekularny - problem

25

}  W modelu neutralnym tempo utrwalania mutacji:

}  Powinno być stałe w przeliczeniu na pokolenie }  Czas generacji jest różny u różnych organizmów }  Czyli nie powinna być obserwowana stałość tempa

w czasie rzeczywistym

}  A często jest (w tych sekwencjach, które zachowują zegar)

2Nµ ⋅ 12N

= µ

Page 26: Genetyka Czl Ewolucja Cwiczenia

Problem czasu generacji

26

}  Czas generacji różnych organizmów jest istotnie różny

}  Dlaczego nie wpływa to na tempo utrwalania mutacji?

~3 pokolenia/rok

~0,03 pokolenia/rok

Page 27: Genetyka Czl Ewolucja Cwiczenia

Zmiany prawie neutralne

27

}  Model Kimury dotyczy zmian neutralnych (s = 0), takie nie są częste

}  Mutacje zachowują się jak neutralne gdy spełnione jest:

}  Mutacje o niewielkim współczynniku doboru s będą zachowywały się jak neutralne w małych populacjach, a w większych populacjach będą podlegały doborowi

s ≤ 14Ne

Page 28: Genetyka Czl Ewolucja Cwiczenia

Zmiany prawie neutralne

28

}  Istnieje odwrotna korelacja między czasem generacji a wielkością populacji

Page 29: Genetyka Czl Ewolucja Cwiczenia

Zmiany prawie neutralne

29

~3 pokolenia/rok

~0,03 pokolenia/rok

Długi czas generacji Krótki czas generacji

Mniej mutacji na rok Więcej mutacji na rok

Populacja nieliczna (małe Ne) Populacja liczna (duże Ne)

Więcej mutacji zachowuje się jak neutralne i utrwala przez dryf

Więcej mutacji podlega doborowi (i jest eliminowane przez dobór oczyszczający)

s ≤ 14Ne

Efekty czasu generacji i wielkości populacji się znosząc, dając stałe tempo w czasie (Ohta

& Kimura, 1971).

Page 30: Genetyka Czl Ewolucja Cwiczenia

Zegar molekularny

30

}  Dla sekwencji białek i zmian niesynonimicznych w DNA zmiany jednostajne w czasie

}  Na poziomie DNA, }  dla mutacji synonimicznych }  pseudogenów }  niektórych sekwencji niekodujących

}  tempo ewolucji zależy od czasu generacji

Page 31: Genetyka Czl Ewolucja Cwiczenia

Tempo ewolucji sekwencji a funkcja

31

Sekwencje o mniejszym znaczeniu funkcjonalnym (pseudogeny, mniej istotne obszary białek) ewoluują szybciej, niż obszary kluczowe dla funkcji

Page 32: Genetyka Czl Ewolucja Cwiczenia

Degeneracja w kodzie

32

miejsce 2-krotnie zdegenerowane

miejsce 4-krotnie zdegenerowane

Page 33: Genetyka Czl Ewolucja Cwiczenia

Tempo ewolucji sekwencji a funkcja

33

Sekwencje o mniejszym znaczeniu funkcjonalnym (pseudogeny, mniej istotne obszary białek) ewoluują szybciej, niż obszary kluczowe dla funkcji

Page 34: Genetyka Czl Ewolucja Cwiczenia

Tempo zmian jednostka: PAM/108 lat Jednostka czasu ewolucyjnego: ile lat (w milionach, 106) potrzeba do utrwalenia 1 mutacji/100 aa (1 PAM)

}  Białka zaangażowane w podstawowe funkcje komórki ewoluują wolniej. }  W sekwencji białka obszary kluczowe dla funkcji ewoluują wolniej.

34

Page 35: Genetyka Czl Ewolucja Cwiczenia

Tempo zmian

35

}  Czynnikiem decydującym o tempie zmian jest dobór oczyszczający (negatywny) }  w “ważniejszych” sekwencjach więcej zmian będzie

niekorzystnych (eliminacja przez dobór) }  w mniej istotnych sekwencjach więcej zmian będzie

neutralnych (utrwalanie przez dryf) }  zmiany bez znaczenia dla funkcji będą neutralne

}  pseudogeny }  niekodujące obszary międzygenowe? }  podstawienia synonimiczne?

Page 36: Genetyka Czl Ewolucja Cwiczenia

Status neutralizmu

36

}  Wyjaśnia wiele zjawisk obserwowanych w ewolucji molekularnej }  wysoki polimorfizm sekwencji DNA i białek }  zegar molekularny

}  ale jest wiele odstępstw, nie istnieje globalny zegar prawdziwy dla wszystkich gałęzi drzewa życia

}  wolniejsza ewolucja sekwencji o kluczowym znaczeniu }  to też można wyjaśnić modelem, w którym większość mutacji jest

albo niekorzystna, albo korzystna, ale niekorzystnych jest więcej

}  Jest bardzo przydatny jako hipoteza zerowa do badania doboru naturalnego na poziomie sekwencji!

Page 37: Genetyka Czl Ewolucja Cwiczenia

Status neutralizmu

37

}  Dane molekularne, zwłaszcza genomowe, pozwoliły ocenić zgodność modelu neutralnego z obserwacją zmienności sekwencji }  Kimura: 1968 – nie były wtedy znane metody

sekwencjonowania DNA!

Page 38: Genetyka Czl Ewolucja Cwiczenia

Status neutralizmu

38

}  Smith & Eyre-Walker 2002 – 45% podstawień aminokwasowych w ewolucji Drosophila sp. utwalonych przez dobór dodatni

}  Andolfatto 2005 – pomiędzy D. melanogaster i D. simulans dobór dodatni odpowiada za utrwalenie: }  20% podstawień w DNA w intronach i obszarach

międzygenowych }  60% podstawień w DNA w sekwencjach UTR

Page 39: Genetyka Czl Ewolucja Cwiczenia

Status neutralizmu

39

}  Głównym i nieprzemijającym osiągnięciem jest stworzenie matematycznego opisu współdziałania dryfu i doboru naturalnego (dodatniego i oczyszczającego) w ewolucji molekularnej

}  Dzięki tym modelom opracowano testy poszukujące śladów doboru w sekwencjach (model neutralny jako hipoteza zerowa)

}  Istnieje znacząca liczba pozycji i sekwencji ewoluujących według modelu neutralnego }  można dobrać sekwencje tak, by uzyskać zegar

molekularny

Page 40: Genetyka Czl Ewolucja Cwiczenia

Status neutralizmu

40

}  Dryf genetyczny ma w ewolucji molekularnej bardzo znaczącą, ale nie wyłączną rolę }  znaczne obszary genomu ewoluują w sposób bliski

neutralnemu

Page 41: Genetyka Czl Ewolucja Cwiczenia

Jak szukać śladów działania doboru

}  Większość sekwencji genów zmienia się jednostajnie, w tempie wyznaczanym przez eliminację mutacji niekorzystnych – “zegar molekularny”

}  Odstępstwa od jednostajnego tempa w określonej gałęzi – dobór specyficzny dla tej gałęzi

Cz!owiek

Szympans

Goryl

Orangutan

Cz!owiek

Szympans

Goryl

Orangutan

Cz!owiek

Szympans

Goryl

Orangutan

Równomierne tempo zmian

Przyspieszone zmiany Spowolnione zmiany

Page 42: Genetyka Czl Ewolucja Cwiczenia

Badanie doboru

}  Założenie: mutacje synonimiczne są neutralne, sekwencje porównywane są parami Ka (dN) – liczba mutacji niesynonimicznych na liczbę możliwych miejsc niesynonimicznych

Ks (dS) – liczba mutacji synonimicznych na liczbę możliwych miejsc synonimicznych

Stosunek Ka/Ks (ω) jest miarą działania doboru

ω=1 – ewolucja neutralna ω<1 – dobór negatywny (oczyszczający) ω>1 – dobór pozytywny

Page 43: Genetyka Czl Ewolucja Cwiczenia

Badanie doboru }  Wartość ω rzadko przekracza 1 dla całej sekwencji

(wyjątek np. geny MHC) }  Średnia wartość ω w porównaniach między

naczelnymi a gryzoniami wynosi 0,2, między człowiekiem a szympansem 0,4

}  Odchylenie ω od średniej dla konkretnego genu w konkretnej linii ewolucyjnej może świadczyć o działaniu doboru

}  W sekwencji mogą występować obszary o różnej wartości ω, wskazując na działanie doboru na poszczególne regiony a nawet pozycje aminokwasowe w białku

Page 44: Genetyka Czl Ewolucja Cwiczenia

Badanie doboru II }  Porównanie zmian synonimicznych i

niesynonimicznych w obrębie populacji danego gatunku i pomiędzy gatunkami.

Page 45: Genetyka Czl Ewolucja Cwiczenia

Test McDonalda-Kreitmana }  Stosunek mutacji synonimicznych do

niesynonimicznych w obrębie populacji vs. taki sam stosunek dla różnic między gatunkami

}  Jeżeli zmiany są neutralne, wówczas stosunek ten powinien być w obu przypadkach taki sam

Page 46: Genetyka Czl Ewolucja Cwiczenia

Przykład: gen ADH u trzech gatunków Drosophila

synonimiczne niesynonimiczne stosunek

wewnątrzpopulacyjne 42 2 ~0,05

międzygatunkowe 17 7 ~0,41

Wniosek: zmiany niesynonimiczne są szybko utrwalane w specjacji – nie są neutralne

Page 47: Genetyka Czl Ewolucja Cwiczenia

Inne testy }  Test HKA (Hudson, Kreitman, Aguadé) –

statystyczna korelacja zmienności wewnątrzpopulacyjnej i międzygatunkowej dla mutacji synonimicznych i niesynonimicznych

}  Test Tajimy – porównuje częstość polimorfizmów wewnątrzpopulacyjnych z przewidywaniami teorii neutralnej

}  Test Fu & Li – podobny do testu Tajimy, wykorzystuje dane filogenetyczne

Page 48: Genetyka Czl Ewolucja Cwiczenia

Testowanie hipotez }  Kryterium wiarygodności }  Program PAML (Phylogenetic Analysis by

Maximum Likelihood) – autor Ziheng Yang

}  http://abacus.gene.ucl.ac.uk/software/paml.html

Page 49: Genetyka Czl Ewolucja Cwiczenia

Wiarygodność (likelihood) }  Wiarygodność=prawdopodobieństwo uzyskania danych przy

założeniach modelu i jego określonych parametrach: P(dane|model)

}  Prawdopodobieństwo dotyczy zdarzenia przyszłego przy znanym modelu -  np. jeżeli rzucam idealną (symetryczną) monetą, to

prawdopodobieństwo uzyskania orła = 1/2 (dwóch orłów 1/4 itd.)

}  Wiarygodność odnosi się do wyjaśnienia zjawiska, które już zaszło -  np. jeżeli przy dużej liczbie rzutów monetą uzyskuje 50%

orłów, to najbardziej wiarygodnym modelem jest ten, w którym moneta jest symetryczna

Page 50: Genetyka Czl Ewolucja Cwiczenia

Test ilorazu wiarygodności

}  LRT (Likelihood Ratio Test) }  Dla porównania dwóch zagnieżdżonych modeli o

różnej liczbie parametrów }  Dla każdego modelu oblicza się wiarygodność

(L1, L2)

}  Istotność LR określa się porównując z wartością χ2 dla df równego różnicy w liczbie parametrów obu modeli

LR = 2×[ln(L1)−ln(L2)]#

Page 51: Genetyka Czl Ewolucja Cwiczenia

Przykład

#1

Model 0 – wartość ω taka sama w całym drzewie: wiarygodność L0

Model 1 – wartość ω w gałęzi #1 inna, niż w pozostałych gałęziach drzewa: wiarygodność L1

Czy ewolucja w gałęzi #1 jest szybsza?

LR = 2×[ln(L1)−ln(L0)]#

Czy LR większe od χ2 dla df=1?

Page 52: Genetyka Czl Ewolucja Cwiczenia

Pliki programu PAML }  Sekwencje: format PHYLIP (np. z Clustal) }  Drzewo: format Newick, ew. z zaznaczanymi

gałęziami }  plik kontrolny: codeml.ctl

Page 53: Genetyka Czl Ewolucja Cwiczenia

Notacja nawiasowa (Newick) dla drzew

(Macaca,Cerco,(Pongo,(Gorilla,(Homo,Chimp))));

(Macaca,Cerco,(Pongo,(Gorilla,(Homo#1,Chimp))));

(Macaca,Cerco,(Pongo,(Gorilla,(Homo,Chimp))$1));

#1

#1 #1 #1

#1 #1

(Macaca,Cerco,(Pongo,(Gorilla,(Homo#2,Chimp))$1));

#2 #1

#1

#1 #1

Page 54: Genetyka Czl Ewolucja Cwiczenia

seqfile = treefile = outfile = noisy = 9 * 0,1,2,3,9: how much rubbish on the screen verbose = 2 * 1: detailed output, 0: concise output runmode = 0 * 0: user tree; 1: semi-automatic; 2: automatic * 3: StepwiseAddition; (4,5):PerturbationNNI seqtype = 1 * 1:codons; 2:AAs; 3:codons-->AAs CodonFreq = 2 * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon table clock = 0 * 0: no clock, unrooted tree, 1: clock, rooted tree model = 0 * models for codons: * 0:one, 1:b, 2:2 or more dN/dS ratios for branches NSsites = 0 * dN/dS among sites. 0:no variation, 1:neutral, 2:positive icode = 0 * 0:standard genetic code; 1:mammalian mt; 2-10:see below fix_kappa = 0 * 1: kappa fixed, 0: kappa to be estimated kappa = 2 * initial or fixed kappa fix_omega = 0 * 1: omega or omega_1 fixed, 0: estimate omega = 1 * initial or fixed omega, for codons or codon-transltd AAs fix_alpha = 1 * 0: estimate gamma shape parameter; 1: fix it at alpha alpha = .0 * initial or fixed alpha, 0:infinity (constant rate) Malpha = 0 * different alphas for genes ncatG = 4 * # of categories in the dG or AdG models of rates getSE = 0 * 0: don't want them, 1: want S.E.s of estimates RateAncestor = 1 * (1/0): rates (alpha>0) or ancestral states (alpha=0) fix_blength = 1 * 0: ignore, -1: random, 1: initial, 2: fixed method = 0 * 0: simultaneous; 1: one branch at a time

Page 55: Genetyka Czl Ewolucja Cwiczenia

Modele

}  Modele gałęzi (branch models) - czy ω w którejś gałęzi drzewa (lub grupie gałęzi) odbiega od pozostałych gałęzi drzewa

}  Modele miejsc (site models) - jakie są klasy miejsc (kodonów) w sekwencji pod względem parametru ω (czy we wszystkich pozycjach tak samo działa dobór)?

}  Modele gałęzi i miejsc (branch and site models) - czy w którejś gałęzi drzewa pojawiają się klasy kodonów, na które inaczej działa dobór?

Page 56: Genetyka Czl Ewolucja Cwiczenia

Modele gałęzi }  Hipoteza zerowa - ω takie samo we wszystkich

gałęziach drzewa }  Hipoteza testowana - istnieją gałęzie o ω innym,

niż w reszcie drzewa }  Model swobodny - każda gałąź ma inną wartość ω

}  df = różnica liczby parametrów (każda wyróżniona gałąź dodaje 1)

Page 57: Genetyka Czl Ewolucja Cwiczenia

Modele gałęzi

seqfile = treefile = outfile = noisy = 9 * 0,1,2,3,9: how much rubbish on the screenverbose = 2 * 1: detailed output, 0: concise outputrunmode = 0 * 0: user tree; 1: semi-automatic; 2: automatic * 3: StepwiseAddition; (4,5):PerturbationNNI seqtype = 1 * 1:codons; 2:AAs; 3:codons-->AAsCodonFreq = 2 * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon tableclock = 0 * 0: no clock, unrooted tree, 1: clock, rooted treemodel = 0 * models for codons: * 0:one, 1:b, 2:2 or more dN/dS ratios for branchesNSsites = 0 * dN/dS among sites. 0:no variation, 1:neutral, 2:positiveicode = 0 * 0:standard genetic code; 1:mammalian mt; 2-10:see belowfix_kappa = 0 * 1: kappa fixed, 0: kappa to be estimatedkappa = 2 * initial or fixed kappafix_omega = 0 * 1: omega or omega_1 fixed, 0: estimate omega = 1 * initial or fixed omega, for codons or codon-transltd AAsfix_alpha = 1 * 0: estimate gamma shape parameter; 1: fix it at alphaalpha = .0 * initial or fixed alpha, 0:infinity (constant rate)Malpha = 0 * different alphas for genesncatG = 4 * # of categories in the dG or AdG models of ratesgetSE = 0 * 0: don't want them, 1: want S.E.s of estimatesRateAncestor = 1 * (1/0): rates (alpha>0) or ancestral states (alpha=0)fix_blength = 1 * 0: ignore, -1: random, 1: initial, 2: fixedmethod = 0 * 0: simultaneous; 1: one branch at a time

Page 58: Genetyka Czl Ewolucja Cwiczenia

Modele miejsc }  Przeprowadzane przy założeniu stałego ω we

wszystkich gałęziach drzewa }  Hipoteza zerowa (M1a): dwie klasy kodonów:

neutralne (ω=1) i selekcjonowane negatywnie (ω<1)

}  Hipoteza testowana (M2a): trzy klasy kodonów: neutralne (ω=1), selekcjonowane negatywnie (ω<1) i selekcjonowane pozytywnie (ω>1)

}  Są też bardziej złożone modele o innej dystrybucji miejsc

Page 59: Genetyka Czl Ewolucja Cwiczenia

Modele miejsc

seqfile = treefile = outfile = noisy = 9 * 0,1,2,3,9: how much rubbish on the screenverbose = 2 * 1: detailed output, 0: concise outputrunmode = 0 * 0: user tree; 1: semi-automatic; 2: automatic * 3: StepwiseAddition; (4,5):PerturbationNNI seqtype = 1 * 1:codons; 2:AAs; 3:codons-->AAsCodonFreq = 2 * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon tableclock = 0 * 0: no clock, unrooted tree, 1: clock, rooted treemodel = 0 * models for codons: * 0:one, 1:b, 2:2 or more dN/dS ratios for branchesNSsites = 0 * dN/dS among sites. 0:no variation, 1:neutral, 2:positiveicode = 0 * 0:standard genetic code; 1:mammalian mt; 2-10:see belowfix_kappa = 0 * 1: kappa fixed, 0: kappa to be estimatedkappa = 2 * initial or fixed kappafix_omega = 0 * 1: omega or omega_1 fixed, 0: estimate omega = 1 * initial or fixed omega, for codons or codon-transltd AAsfix_alpha = 1 * 0: estimate gamma shape parameter; 1: fix it at alphaalpha = .0 * initial or fixed alpha, 0:infinity (constant rate)Malpha = 0 * different alphas for genesncatG = 4 * # of categories in the dG or AdG models of ratesgetSE = 0 * 0: don't want them, 1: want S.E.s of estimatesRateAncestor = 1 * (1/0): rates (alpha>0) or ancestral states (alpha=0)fix_blength = 1 * 0: ignore, -1: random, 1: initial, 2: fixedmethod = 0 * 0: simultaneous; 1: one branch at a time

Page 60: Genetyka Czl Ewolucja Cwiczenia

Modele gałęzi i miejsc }  Zmienna ω w wyróżnionych gałęziach, w gałęziach

tych pojawia się dodatkowa klasa kodonów o ω>1 }  Trzy klasy kodonów neutralne (ω=1),

selekcjonowane negatywnie (ω<1) i selekcjonowane pozytywnie (ω>1)

}  Hipoteza zerowa: w trzeciej klasie ω=1 (brak selekcji pozytywnej)

Page 61: Genetyka Czl Ewolucja Cwiczenia

Modele gałęzi i miejsc

seqfile = treefile = outfile = noisy = 9 * 0,1,2,3,9: how much rubbish on the screenverbose = 2 * 1: detailed output, 0: concise outputrunmode = 0 * 0: user tree; 1: semi-automatic; 2: automatic * 3: StepwiseAddition; (4,5):PerturbationNNI seqtype = 1 * 1:codons; 2:AAs; 3:codons-->AAsCodonFreq = 2 * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon tableclock = 0 * 0: no clock, unrooted tree, 1: clock, rooted treemodel = 2 * models for codons: * 0:one, 1:b, 2:2 or more dN/dS ratios for branchesNSsites = 2 * dN/dS among sites. 0:no variation, 1:neutral, 2:positiveicode = 0 * 0:standard genetic code; 1:mammalian mt; 2-10:see belowfix_kappa = 0 * 1: kappa fixed, 0: kappa to be estimatedkappa = 2 * initial or fixed kappafix_omega = 0 * 1: omega or omega_1 fixed, 0: estimate omega = 1 * initial or fixed omega, for codons or codon-transltd AAsfix_alpha = 1 * 0: estimate gamma shape parameter; 1: fix it at alphaalpha = .0 * initial or fixed alpha, 0:infinity (constant rate)Malpha = 0 * different alphas for genesncatG = 4 * # of categories in the dG or AdG models of ratesgetSE = 0 * 0: don't want them, 1: want S.E.s of estimatesRateAncestor = 1 * (1/0): rates (alpha>0) or ancestral states (alpha=0)fix_blength = 1 * 0: ignore, -1: random, 1: initial, 2: fixedmethod = 0 * 0: simultaneous; 1: one branch at a time