Dobór naturalny w sekwencjach genów
Metody analizy
Podstawy ewolucji molekularnej
Ewolucja sekwencji DNA i białek
Zmiany genetyczne w ewolucji
3
} Mutacje } tworzą nowe allele genów
} Inwersje } zmieniają układ genów na chromosomach } mogą uniemożliwić rekombinację na danym odcinku i
doprowadzić do utrwalenia haplotypu } Duplikacje
} dotyczą fragmentów DNA, w tym całych genów } lub całych chromosomów i całych genomów } główne źródło innowacji ewolucyjnej
} Transfer horyzontalny } w tym zdarzenia symbiotyczne
Substytucje
4
} Tranzycje zachodzą w naturze częściej od transwersji } mimo tego, że możliwych transwersji jest więcej } stosunek ts/tv od ~2 (nDNA) do ~15 (mtDNA człowieka) } wyjątek – mtDNA roślin } duże różnice ts/tv u różnych grup organizmów
Tranzycje i transwersje
5
} Dlaczego tranzycje są częstsze? } Wyjaśnienia selekcyjne (tranzycje rzadziej zmieniają
aminokwas i częściej są neutralne) } Ale:
} tranzycje są częstsze też w genach rRNA, pseudogenach i obszarach niekodujących
} tranzycje są częstsze w pozycjach 4-krotnie zdegenerowanych (kodony typu CUN – Leu)
Tranzycje i transwersje
6
} Dlaczego tranzycje są częstsze? } Wyjaśnienia mechanistyczne – mechanizmy
powstawania i naprawy mutacji } Tranzycje powstają w wyniku m. in.:
} przejść tautomerycznych } deaminacji (np. oksydacyjnej)
} Tranzycje w mniejszym stopniu zaburzają strukturę podwójnej helisy podczas replikacji } mniejsza wydajność naprawy przez system MMR
} Korelacje z: } zawartością par G/C w genomie } aktywnością transkrypcyjną } tempem metabolizmu
Modele ewolucji sekwencji
7
} Badając ewolucję nie dysponujemy z reguły sekwencją przodka
} Liczbę mutacji musimy oszacować na podstawie różnic między sekwencjami współczesnymi
} Konieczne jest uwzględnienie wielokrotnych mutacji w tej samej pozycji, zwłaszcza dla bardziej odległych sekwencji
Modele ewolucji sekwencji
8
} Modele Markova – stan w pokoleniu n +1 zależy tylko od stanu w pokoleniu n i reguł przekształcenia (macierz prawdopodobieństw zmiany stanów)
} Modele o różnym stopniu skomplikowania } Mogą uwzględniać:
} mutacje wielokrotne w tej samej pozycji (poprawka Poissona)
} różne prawdpodobieństwa zmian nukleotydowych (lub białkowych)
} różne prawdopodobieństwo mutacji w różnych pozycjach sekwencji
} różne częstości nukleotydów
Modele ewolucji sekwencji
9
} Modele Markova – stan w pokoleniu n +1 zależy tylko od stanu w pokoleniu n i reguł przekształcenia (macierz prawdopodobieństw zmiany stanów)
} Modele o różnym stopniu skomplikowania } Mogą uwzględniać:
} mutacje wielokrotne w tej samej pozycji (poprawka Poissona)
} różne prawdpodobieństwa zmian nukleotydowych (lub białkowych)
} różne prawdopodobieństwo mutacji w różnych pozycjach sekwencji
} różne częstości nukleotydów
Modele ewolucji DNA – model Jukesa-Cantora
} Jednakowe częstości nukleotydów
(f=0,25)
} Jednakowe prawdopodobieństwo każdej substytucji
} Odległość po poprawce wynosi:
} Przykładowo:
DOBS=0.43 => DJC=0.64
A C G T
A 1-3α α α α
C α 1-3α α α
G α α 1-3α α
T α α α 1-3α
10
DJC = −34ln(1− 4
3D)
Inne modele
} Kimura (K80, dwuparametrowy) - różne prawdopodobieństwo tranzycji i transwersji
} Felsenstein (F81), Hasegawa-Kishino-Yano (HKY85) - różne częstości nukleotydów (F81) + różne prawd. tranzycji i transwersji (HKY85)
} GTR (General Time Reversible, Tavare ‘86)
11
Model GTR
} Różne prawdopodobieństwo każdej substytucji (ale symetrycznie, czyli np. A→T = T→A) - 6 parametrów
} Różne częstości nukleotydów - 4 parametry
12
} Proste modele zakładają jednakowe prawdopodobieństwo zmiany w każdej pozycji - nierealistyczne
} Rozkład prawdopodobieństw zmian w różnych pozycjach – rozkład gamma
Rozkład gamma
13
Mutaje na poziomie kodu
14
} Mutacje mogą: } zmienić kodon na inny, ale kodujący ten sam aminokwas
} mutacje synonimiczne } zmienić kodon na kodujący inny aminokwas
} mutacje niesynonimiczne } zmienić kodon na kodon STOP
} mutacje nonsens } spowodować zmianę fazy odczytu } wpłynąć na ekspresję genu
Mutacje i dobór naturalny
15
} Efekty działania mutacji obserwujemy pośrednio } różnice sekwencji między populacjami (gatunkami) } polimorfizm sekwencji w obrębie populacji
} Na allele wytworzone przez mutacje może działać dobór
} Za zmiany częstości powstających alleli może odpowiadać dryf genetyczny
} Obserwujemy mutacje utrwalone całkowicie lub częściowo (polimorfizmy) w puli genowej
Podstawowe pytanie ewolucji molekularnej
16
} Jaka jest rola dryfu i doboru w wyjaśnieniu obserwowanego zróżnicowania sekwencji? } wewnątrzpopulacyjnego (polimorfizmy) } międzygatunkowego
} Pytanie dotyczy zróżnicowania ilościowego! } Nikt nie podaje w wątpliwość tego, że adaptacje w
ewolucji powstają dzięki działaniu doboru!
Dobor czy dryf?
17
} Selekcjonizm } większość utrwalonych mutacji została
wyselekcjonowana przed dobór } większość polimorfizmów jest utrzymywana przez dobór
} dobór równoważący, naddominacja, dobór zależny od częstości
} Neutralizm (Kimura, 1968) } większość utrwalonych mutacji została utrwalona przez
dryf } za większość polimorfizmów odpowiada dryf } mutacje utrwalane przez dobór są rzadkie, nie mają
wpływu na ilościową analizę zmienności molekularnej
Mutacje i dobór
18
} niekorzystne (szkodliwe) } s < 0 } eliminowane przez dobór (oczyszczający/negatywny)
} neutralne } s ≈ 0 (a konkretniej, s ≤ 1/4N) } utrwalane przez dryf
} korzystne } s > 0 } utrwalane przez dobór (z udziałem dryfu dla niewielkich
s)
Selekcjonizm i neutralizm
19
} Selekcjonizm: } większość mutacji jest niekorzystna } większość utrwalonych mutacji jest korzystna } mutacje neutralne są rzadkie (nie częstsze od
korzystnych)
} Neutralizm } większość mutacji jest niekorzystna lub neutralna } większość utrwalonych mutacji jest neutralna } mutacje korzystne są rzadkie (znacznie rzadsze od
neutralnych)
Selekcjonizm i neutralizm
20
selekcjonizm neutralizm pan-neutralizm
Neutralizm nie oznacza pan-neutralizmu, czyli negowania znaczenia selekcyjnego mutacji!
Przesłanki teorii neutralnej
21
} Tempo zmian sekwencji i polimorfizm są zbyt duże, by dały się wyjaśnić doborem
} Stałe tempo ewolucji molekularnej (zegar molekularny)
} Sekwencje o mniejszym znaczeniu funkcjonalnym (pseudogeny, mniej istotne obszary białek) ewoluują szybciej, niż obszary kluczowe dla funkcji
Stałe tempo ewolucji molekularnej
22
} Wiele sekwencji ewoluuje w stałym tempie } Tempo to jest różne dla różnych sekwencji, ale stałe w
czasie ewolucji dla danej sekwencji
} Tzw. zegar molekularny Różnice sekwencji globin kręgowców
Tempo ewolucji i dryf
23
} Neutralny dryf jest procesem losowym, ale jego tempo będzie stałe w odpowiednio długim czasie
} Zależy tylko od częstości mutacji (jedna zmiana na 1/µ pokoleń)
} Dla doboru stałe tempo zmian oznacza stałe tempo zmian środowiska
} Tempo zmian adaptacyjnych nie wydaje się być stałe
Zegar molekularny
24
} Jest konsekwencją neutralnego modelu ewolucji } Tempo akumulacji zmian w danej sekwencji jest stałe
} ale różne dla różnych sekwencji } Weryfikacja – test względnego tempa
} W rzeczywistości testuje stałość tempa pomiędzy gałęziami, ale nie w czasie
B C A
KAC - KBC = 0
Zegar molekularny - problem
25
} W modelu neutralnym tempo utrwalania mutacji:
} Powinno być stałe w przeliczeniu na pokolenie } Czas generacji jest różny u różnych organizmów } Czyli nie powinna być obserwowana stałość tempa
w czasie rzeczywistym
} A często jest (w tych sekwencjach, które zachowują zegar)
2Nµ ⋅ 12N
= µ
Problem czasu generacji
26
} Czas generacji różnych organizmów jest istotnie różny
} Dlaczego nie wpływa to na tempo utrwalania mutacji?
~3 pokolenia/rok
~0,03 pokolenia/rok
Zmiany prawie neutralne
27
} Model Kimury dotyczy zmian neutralnych (s = 0), takie nie są częste
} Mutacje zachowują się jak neutralne gdy spełnione jest:
} Mutacje o niewielkim współczynniku doboru s będą zachowywały się jak neutralne w małych populacjach, a w większych populacjach będą podlegały doborowi
s ≤ 14Ne
Zmiany prawie neutralne
28
} Istnieje odwrotna korelacja między czasem generacji a wielkością populacji
Zmiany prawie neutralne
29
~3 pokolenia/rok
~0,03 pokolenia/rok
Długi czas generacji Krótki czas generacji
Mniej mutacji na rok Więcej mutacji na rok
Populacja nieliczna (małe Ne) Populacja liczna (duże Ne)
Więcej mutacji zachowuje się jak neutralne i utrwala przez dryf
Więcej mutacji podlega doborowi (i jest eliminowane przez dobór oczyszczający)
s ≤ 14Ne
Efekty czasu generacji i wielkości populacji się znosząc, dając stałe tempo w czasie (Ohta
& Kimura, 1971).
Zegar molekularny
30
} Dla sekwencji białek i zmian niesynonimicznych w DNA zmiany jednostajne w czasie
} Na poziomie DNA, } dla mutacji synonimicznych } pseudogenów } niektórych sekwencji niekodujących
} tempo ewolucji zależy od czasu generacji
Tempo ewolucji sekwencji a funkcja
31
Sekwencje o mniejszym znaczeniu funkcjonalnym (pseudogeny, mniej istotne obszary białek) ewoluują szybciej, niż obszary kluczowe dla funkcji
Degeneracja w kodzie
32
miejsce 2-krotnie zdegenerowane
miejsce 4-krotnie zdegenerowane
Tempo ewolucji sekwencji a funkcja
33
Sekwencje o mniejszym znaczeniu funkcjonalnym (pseudogeny, mniej istotne obszary białek) ewoluują szybciej, niż obszary kluczowe dla funkcji
Tempo zmian jednostka: PAM/108 lat Jednostka czasu ewolucyjnego: ile lat (w milionach, 106) potrzeba do utrwalenia 1 mutacji/100 aa (1 PAM)
} Białka zaangażowane w podstawowe funkcje komórki ewoluują wolniej. } W sekwencji białka obszary kluczowe dla funkcji ewoluują wolniej.
34
Tempo zmian
35
} Czynnikiem decydującym o tempie zmian jest dobór oczyszczający (negatywny) } w “ważniejszych” sekwencjach więcej zmian będzie
niekorzystnych (eliminacja przez dobór) } w mniej istotnych sekwencjach więcej zmian będzie
neutralnych (utrwalanie przez dryf) } zmiany bez znaczenia dla funkcji będą neutralne
} pseudogeny } niekodujące obszary międzygenowe? } podstawienia synonimiczne?
Status neutralizmu
36
} Wyjaśnia wiele zjawisk obserwowanych w ewolucji molekularnej } wysoki polimorfizm sekwencji DNA i białek } zegar molekularny
} ale jest wiele odstępstw, nie istnieje globalny zegar prawdziwy dla wszystkich gałęzi drzewa życia
} wolniejsza ewolucja sekwencji o kluczowym znaczeniu } to też można wyjaśnić modelem, w którym większość mutacji jest
albo niekorzystna, albo korzystna, ale niekorzystnych jest więcej
} Jest bardzo przydatny jako hipoteza zerowa do badania doboru naturalnego na poziomie sekwencji!
Status neutralizmu
37
} Dane molekularne, zwłaszcza genomowe, pozwoliły ocenić zgodność modelu neutralnego z obserwacją zmienności sekwencji } Kimura: 1968 – nie były wtedy znane metody
sekwencjonowania DNA!
Status neutralizmu
38
} Smith & Eyre-Walker 2002 – 45% podstawień aminokwasowych w ewolucji Drosophila sp. utwalonych przez dobór dodatni
} Andolfatto 2005 – pomiędzy D. melanogaster i D. simulans dobór dodatni odpowiada za utrwalenie: } 20% podstawień w DNA w intronach i obszarach
międzygenowych } 60% podstawień w DNA w sekwencjach UTR
Status neutralizmu
39
} Głównym i nieprzemijającym osiągnięciem jest stworzenie matematycznego opisu współdziałania dryfu i doboru naturalnego (dodatniego i oczyszczającego) w ewolucji molekularnej
} Dzięki tym modelom opracowano testy poszukujące śladów doboru w sekwencjach (model neutralny jako hipoteza zerowa)
} Istnieje znacząca liczba pozycji i sekwencji ewoluujących według modelu neutralnego } można dobrać sekwencje tak, by uzyskać zegar
molekularny
Status neutralizmu
40
} Dryf genetyczny ma w ewolucji molekularnej bardzo znaczącą, ale nie wyłączną rolę } znaczne obszary genomu ewoluują w sposób bliski
neutralnemu
Jak szukać śladów działania doboru
} Większość sekwencji genów zmienia się jednostajnie, w tempie wyznaczanym przez eliminację mutacji niekorzystnych – “zegar molekularny”
} Odstępstwa od jednostajnego tempa w określonej gałęzi – dobór specyficzny dla tej gałęzi
Cz!owiek
Szympans
Goryl
Orangutan
Cz!owiek
Szympans
Goryl
Orangutan
Cz!owiek
Szympans
Goryl
Orangutan
Równomierne tempo zmian
Przyspieszone zmiany Spowolnione zmiany
Badanie doboru
} Założenie: mutacje synonimiczne są neutralne, sekwencje porównywane są parami Ka (dN) – liczba mutacji niesynonimicznych na liczbę możliwych miejsc niesynonimicznych
Ks (dS) – liczba mutacji synonimicznych na liczbę możliwych miejsc synonimicznych
Stosunek Ka/Ks (ω) jest miarą działania doboru
ω=1 – ewolucja neutralna ω<1 – dobór negatywny (oczyszczający) ω>1 – dobór pozytywny
Badanie doboru } Wartość ω rzadko przekracza 1 dla całej sekwencji
(wyjątek np. geny MHC) } Średnia wartość ω w porównaniach między
naczelnymi a gryzoniami wynosi 0,2, między człowiekiem a szympansem 0,4
} Odchylenie ω od średniej dla konkretnego genu w konkretnej linii ewolucyjnej może świadczyć o działaniu doboru
} W sekwencji mogą występować obszary o różnej wartości ω, wskazując na działanie doboru na poszczególne regiony a nawet pozycje aminokwasowe w białku
Badanie doboru II } Porównanie zmian synonimicznych i
niesynonimicznych w obrębie populacji danego gatunku i pomiędzy gatunkami.
Test McDonalda-Kreitmana } Stosunek mutacji synonimicznych do
niesynonimicznych w obrębie populacji vs. taki sam stosunek dla różnic między gatunkami
} Jeżeli zmiany są neutralne, wówczas stosunek ten powinien być w obu przypadkach taki sam
Przykład: gen ADH u trzech gatunków Drosophila
synonimiczne niesynonimiczne stosunek
wewnątrzpopulacyjne 42 2 ~0,05
międzygatunkowe 17 7 ~0,41
Wniosek: zmiany niesynonimiczne są szybko utrwalane w specjacji – nie są neutralne
Inne testy } Test HKA (Hudson, Kreitman, Aguadé) –
statystyczna korelacja zmienności wewnątrzpopulacyjnej i międzygatunkowej dla mutacji synonimicznych i niesynonimicznych
} Test Tajimy – porównuje częstość polimorfizmów wewnątrzpopulacyjnych z przewidywaniami teorii neutralnej
} Test Fu & Li – podobny do testu Tajimy, wykorzystuje dane filogenetyczne
Testowanie hipotez } Kryterium wiarygodności } Program PAML (Phylogenetic Analysis by
Maximum Likelihood) – autor Ziheng Yang
} http://abacus.gene.ucl.ac.uk/software/paml.html
Wiarygodność (likelihood) } Wiarygodność=prawdopodobieństwo uzyskania danych przy
założeniach modelu i jego określonych parametrach: P(dane|model)
} Prawdopodobieństwo dotyczy zdarzenia przyszłego przy znanym modelu - np. jeżeli rzucam idealną (symetryczną) monetą, to
prawdopodobieństwo uzyskania orła = 1/2 (dwóch orłów 1/4 itd.)
} Wiarygodność odnosi się do wyjaśnienia zjawiska, które już zaszło - np. jeżeli przy dużej liczbie rzutów monetą uzyskuje 50%
orłów, to najbardziej wiarygodnym modelem jest ten, w którym moneta jest symetryczna
Test ilorazu wiarygodności
} LRT (Likelihood Ratio Test) } Dla porównania dwóch zagnieżdżonych modeli o
różnej liczbie parametrów } Dla każdego modelu oblicza się wiarygodność
(L1, L2)
} Istotność LR określa się porównując z wartością χ2 dla df równego różnicy w liczbie parametrów obu modeli
LR = 2×[ln(L1)−ln(L2)]#
Przykład
#1
Model 0 – wartość ω taka sama w całym drzewie: wiarygodność L0
Model 1 – wartość ω w gałęzi #1 inna, niż w pozostałych gałęziach drzewa: wiarygodność L1
Czy ewolucja w gałęzi #1 jest szybsza?
LR = 2×[ln(L1)−ln(L0)]#
Czy LR większe od χ2 dla df=1?
Pliki programu PAML } Sekwencje: format PHYLIP (np. z Clustal) } Drzewo: format Newick, ew. z zaznaczanymi
gałęziami } plik kontrolny: codeml.ctl
Notacja nawiasowa (Newick) dla drzew
(Macaca,Cerco,(Pongo,(Gorilla,(Homo,Chimp))));
(Macaca,Cerco,(Pongo,(Gorilla,(Homo#1,Chimp))));
(Macaca,Cerco,(Pongo,(Gorilla,(Homo,Chimp))$1));
#1
#1 #1 #1
#1 #1
(Macaca,Cerco,(Pongo,(Gorilla,(Homo#2,Chimp))$1));
#2 #1
#1
#1 #1
seqfile = treefile = outfile = noisy = 9 * 0,1,2,3,9: how much rubbish on the screen verbose = 2 * 1: detailed output, 0: concise output runmode = 0 * 0: user tree; 1: semi-automatic; 2: automatic * 3: StepwiseAddition; (4,5):PerturbationNNI seqtype = 1 * 1:codons; 2:AAs; 3:codons-->AAs CodonFreq = 2 * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon table clock = 0 * 0: no clock, unrooted tree, 1: clock, rooted tree model = 0 * models for codons: * 0:one, 1:b, 2:2 or more dN/dS ratios for branches NSsites = 0 * dN/dS among sites. 0:no variation, 1:neutral, 2:positive icode = 0 * 0:standard genetic code; 1:mammalian mt; 2-10:see below fix_kappa = 0 * 1: kappa fixed, 0: kappa to be estimated kappa = 2 * initial or fixed kappa fix_omega = 0 * 1: omega or omega_1 fixed, 0: estimate omega = 1 * initial or fixed omega, for codons or codon-transltd AAs fix_alpha = 1 * 0: estimate gamma shape parameter; 1: fix it at alpha alpha = .0 * initial or fixed alpha, 0:infinity (constant rate) Malpha = 0 * different alphas for genes ncatG = 4 * # of categories in the dG or AdG models of rates getSE = 0 * 0: don't want them, 1: want S.E.s of estimates RateAncestor = 1 * (1/0): rates (alpha>0) or ancestral states (alpha=0) fix_blength = 1 * 0: ignore, -1: random, 1: initial, 2: fixed method = 0 * 0: simultaneous; 1: one branch at a time
Modele
} Modele gałęzi (branch models) - czy ω w którejś gałęzi drzewa (lub grupie gałęzi) odbiega od pozostałych gałęzi drzewa
} Modele miejsc (site models) - jakie są klasy miejsc (kodonów) w sekwencji pod względem parametru ω (czy we wszystkich pozycjach tak samo działa dobór)?
} Modele gałęzi i miejsc (branch and site models) - czy w którejś gałęzi drzewa pojawiają się klasy kodonów, na które inaczej działa dobór?
Modele gałęzi } Hipoteza zerowa - ω takie samo we wszystkich
gałęziach drzewa } Hipoteza testowana - istnieją gałęzie o ω innym,
niż w reszcie drzewa } Model swobodny - każda gałąź ma inną wartość ω
} df = różnica liczby parametrów (każda wyróżniona gałąź dodaje 1)
Modele gałęzi
seqfile = treefile = outfile = noisy = 9 * 0,1,2,3,9: how much rubbish on the screenverbose = 2 * 1: detailed output, 0: concise outputrunmode = 0 * 0: user tree; 1: semi-automatic; 2: automatic * 3: StepwiseAddition; (4,5):PerturbationNNI seqtype = 1 * 1:codons; 2:AAs; 3:codons-->AAsCodonFreq = 2 * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon tableclock = 0 * 0: no clock, unrooted tree, 1: clock, rooted treemodel = 0 * models for codons: * 0:one, 1:b, 2:2 or more dN/dS ratios for branchesNSsites = 0 * dN/dS among sites. 0:no variation, 1:neutral, 2:positiveicode = 0 * 0:standard genetic code; 1:mammalian mt; 2-10:see belowfix_kappa = 0 * 1: kappa fixed, 0: kappa to be estimatedkappa = 2 * initial or fixed kappafix_omega = 0 * 1: omega or omega_1 fixed, 0: estimate omega = 1 * initial or fixed omega, for codons or codon-transltd AAsfix_alpha = 1 * 0: estimate gamma shape parameter; 1: fix it at alphaalpha = .0 * initial or fixed alpha, 0:infinity (constant rate)Malpha = 0 * different alphas for genesncatG = 4 * # of categories in the dG or AdG models of ratesgetSE = 0 * 0: don't want them, 1: want S.E.s of estimatesRateAncestor = 1 * (1/0): rates (alpha>0) or ancestral states (alpha=0)fix_blength = 1 * 0: ignore, -1: random, 1: initial, 2: fixedmethod = 0 * 0: simultaneous; 1: one branch at a time
Modele miejsc } Przeprowadzane przy założeniu stałego ω we
wszystkich gałęziach drzewa } Hipoteza zerowa (M1a): dwie klasy kodonów:
neutralne (ω=1) i selekcjonowane negatywnie (ω<1)
} Hipoteza testowana (M2a): trzy klasy kodonów: neutralne (ω=1), selekcjonowane negatywnie (ω<1) i selekcjonowane pozytywnie (ω>1)
} Są też bardziej złożone modele o innej dystrybucji miejsc
Modele miejsc
seqfile = treefile = outfile = noisy = 9 * 0,1,2,3,9: how much rubbish on the screenverbose = 2 * 1: detailed output, 0: concise outputrunmode = 0 * 0: user tree; 1: semi-automatic; 2: automatic * 3: StepwiseAddition; (4,5):PerturbationNNI seqtype = 1 * 1:codons; 2:AAs; 3:codons-->AAsCodonFreq = 2 * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon tableclock = 0 * 0: no clock, unrooted tree, 1: clock, rooted treemodel = 0 * models for codons: * 0:one, 1:b, 2:2 or more dN/dS ratios for branchesNSsites = 0 * dN/dS among sites. 0:no variation, 1:neutral, 2:positiveicode = 0 * 0:standard genetic code; 1:mammalian mt; 2-10:see belowfix_kappa = 0 * 1: kappa fixed, 0: kappa to be estimatedkappa = 2 * initial or fixed kappafix_omega = 0 * 1: omega or omega_1 fixed, 0: estimate omega = 1 * initial or fixed omega, for codons or codon-transltd AAsfix_alpha = 1 * 0: estimate gamma shape parameter; 1: fix it at alphaalpha = .0 * initial or fixed alpha, 0:infinity (constant rate)Malpha = 0 * different alphas for genesncatG = 4 * # of categories in the dG or AdG models of ratesgetSE = 0 * 0: don't want them, 1: want S.E.s of estimatesRateAncestor = 1 * (1/0): rates (alpha>0) or ancestral states (alpha=0)fix_blength = 1 * 0: ignore, -1: random, 1: initial, 2: fixedmethod = 0 * 0: simultaneous; 1: one branch at a time
Modele gałęzi i miejsc } Zmienna ω w wyróżnionych gałęziach, w gałęziach
tych pojawia się dodatkowa klasa kodonów o ω>1 } Trzy klasy kodonów neutralne (ω=1),
selekcjonowane negatywnie (ω<1) i selekcjonowane pozytywnie (ω>1)
} Hipoteza zerowa: w trzeciej klasie ω=1 (brak selekcji pozytywnej)
Modele gałęzi i miejsc
seqfile = treefile = outfile = noisy = 9 * 0,1,2,3,9: how much rubbish on the screenverbose = 2 * 1: detailed output, 0: concise outputrunmode = 0 * 0: user tree; 1: semi-automatic; 2: automatic * 3: StepwiseAddition; (4,5):PerturbationNNI seqtype = 1 * 1:codons; 2:AAs; 3:codons-->AAsCodonFreq = 2 * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon tableclock = 0 * 0: no clock, unrooted tree, 1: clock, rooted treemodel = 2 * models for codons: * 0:one, 1:b, 2:2 or more dN/dS ratios for branchesNSsites = 2 * dN/dS among sites. 0:no variation, 1:neutral, 2:positiveicode = 0 * 0:standard genetic code; 1:mammalian mt; 2-10:see belowfix_kappa = 0 * 1: kappa fixed, 0: kappa to be estimatedkappa = 2 * initial or fixed kappafix_omega = 0 * 1: omega or omega_1 fixed, 0: estimate omega = 1 * initial or fixed omega, for codons or codon-transltd AAsfix_alpha = 1 * 0: estimate gamma shape parameter; 1: fix it at alphaalpha = .0 * initial or fixed alpha, 0:infinity (constant rate)Malpha = 0 * different alphas for genesncatG = 4 * # of categories in the dG or AdG models of ratesgetSE = 0 * 0: don't want them, 1: want S.E.s of estimatesRateAncestor = 1 * (1/0): rates (alpha>0) or ancestral states (alpha=0)fix_blength = 1 * 0: ignore, -1: random, 1: initial, 2: fixedmethod = 0 * 0: simultaneous; 1: one branch at a time