Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionChaînes de Markov régulées pour l'analyse deséquen es biologiquesNi olas VergneLaboratoire Statistique et GénomeUMR CNRS 8071 - UMR INRA 1152Université d'Evry Val d'EssonneLe 11 Juillet 2008N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionAvant-Proposggg gg ga t g gggtttt g tatttatgaaaatttt ggtttaagg gttt gtt tt tt gt ataa ttaatgtttttatttaaaata t tgaaaagaaaggaaa ga aggtg tgaaag gagg tttttgg t tgt gttt ttt t tgtttttgt gtggaatgaa aatggaagt aa aaaaag ag tgg tga atttt ggtg gagtat gta att agaa tgg aggaa agggaatg gtt tg gagg ggtgg aagggtaatgaggtg tttatga t tg g gt ataaaatggtatg gaaagggatg tgaaattgagaa gaaaag tg g gggaggttgaagaa tg gg agg ag gagg agat t ag aggaa tattgagta gaa g at ga tta g gtg g agg ga g a aggaa tgaagaatg agaga t g tgaagtggtggaaa g att tgta ttt gtg tgt g ggat g aggtgaaattg agtatt t ga ggg t tgt ggtg ag gg gtttt ggaa tggaaaa ga atgttgattt tgaaa gggatat at aaag atgaa aaag ag g g tggatgaa tgata ggggttg tgagtgaatatat gaa agt aggttaa agg tg gg attttgt g g ggg tt g t a tgtt agg ggag a aga g gttgaatggg ggatg taatta tat t gaaagaat g ata aggaaggg g tgggaaa a tg ttt ag ggg at atgaatg gatggg ag ga ta at gtgaggtgaatgtggtgaagt tg gtgt ggttatt aaaatg tg tgggtgtttatg ta tttatagaN. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionPlan1 Introdu tion2 Dérive polynomialeDérive linéaireDérive de degré d3 Dérive par splines polynomialesEstimation globaleAller retour ave fon tions de baseAller retour sans fon tions de base4 Appli ationsLois stationnairesDérive polynomiale, dérive par splines : omparaisonModèles de Markov : omparaisonOrigine de répli ationMots ex eptionnels N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionPlan1 Introdu tion2 Dérive polynomialeDérive linéaireDérive de degré d3 Dérive par splines polynomialesEstimation globaleAller retour ave fon tions de baseAller retour sans fon tions de base4 Appli ationsLois stationnairesDérive polynomiale, dérive par splines : omparaisonModèles de Markov : omparaisonOrigine de répli ationMots ex eptionnels N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionLes modèles de MarkovChaînes de MarkovHomogénéité des séquen es. Faux ! Exemple : pour entage en g .X = (Xt)t∈J0;nK −→ Π
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionLes modèles de MarkovChaînes de MarkovHomogénéité des séquen es. Faux ! Exemple : pour entage en g .X = (Xt)t∈J0;nK −→ ΠChaînes de Markov a héesDi�érentes plages homogènes. Modélisation d'un ertain nombre de�phénomènes� biologiques. Exemple : omposition di�érente des régions odantes et non- odantes. X = (Xt)t∈J0;nK −→ Π1, Π2, . . .
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionLes modèles de MarkovChaînes de MarkovHomogénéité des séquen es. Faux ! Exemple : pour entage en g .X = (Xt)t∈J0;nK −→ ΠChaînes de Markov a héesDi�érentes plages homogènes. Modélisation d'un ertain nombre de�phénomènes� biologiques. Exemple : omposition di�érente des régions odantes et non- odantes. X = (Xt)t∈J0;nK −→ Π1, Π2, . . .Chaînes de Markov réguléesHétérogénéité ontinue. Modélisation de phénomènes biologiques ontinus.Exemple : transition (parfois brutale) entre deux états d'une haîne de Markov a hée ou pour entage en g . X = (Xt)t∈J0;nK −→ Π t
nN. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionFréquen es des nu léotides : phage Lambda 0.24
0.28
0.32
10000 20000 30000 40000
Fré
quen
ce d
e a
Position dans la séquence
f(a)
0.2
0.24
0.28
10000 20000 30000 40000
Fré
quen
ce d
e c
Position dans la séquence
f(c)
0.2
0.24
0.28
0.32
10000 20000 30000 40000
Fré
quen
ce d
e g
Position dans la séquence
f(g)
0.2
0.24
0.28
0.32
0.36
10000 20000 30000 40000
Fré
quen
ce d
e t
Position dans la séquence
f(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionFréquen es des nu léotides et Markov lassique 0.24
0.28
0.32
0 10000 20000 30000 40000
Fré
quen
ce d
e a
Position dans la séquence
f(a)mu(a)
0.2
0.24
0.28
0 10000 20000 30000 40000
Fré
quen
ce d
e c
Position dans la séquence
f(c)mu(c)
0.2
0.24
0.28
0.32
0 10000 20000 30000 40000
Fré
quen
ce d
e g
Position dans la séquence
f(g)mu(g)
0.2
0.24
0.28
0.32
0.36
0 10000 20000 30000 40000
Fré
quen
ce d
e t
Position dans la séquence
f(t)mu(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionFréquen es des nu léotides et Markov a hé 0.24
0.28
0.32
0 10000 20000 30000 40000
Fré
quen
ce d
e a
Position dans la séquence
f(a)mu(a)
0.2
0.24
0.28
0 10000 20000 30000 40000
Fré
quen
ce d
e c
Position dans la séquence
f(c)mu(c)
0.2
0.24
0.28
0.32
0 10000 20000 30000 40000
Fré
quen
ce d
e g
Position dans la séquence
f(g)mu(g)
0.2
0.24
0.28
0.32
0.36
0 10000 20000 30000 40000
Fré
quen
ce d
e t
Position dans la séquence
f(t)mu(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionFréquen es des nu léotides et Markov régulé 0.24
0.28
0.32
0 10000 20000 30000 40000
Fré
quen
ce d
e a
Position dans la séquence
f(a)mu(a)
0.16
0.2
0.24
0.28
0 10000 20000 30000 40000
Fré
quen
ce d
e c
Position dans la séquence
f(c)mu(c)
0.2
0.24
0.28
0.32
0 10000 20000 30000 40000
Fré
quen
ce d
e g
Position dans la séquence
f(g)mu(g)
0.2
0.24
0.28
0.32
0.36
0 10000 20000 30000 40000
Fré
quen
ce d
e t
Position dans la séquence
f(t)mu(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionIso horesPhénomène biologiqueLe pour entage en g varie le long d'une séquen e.Iso hores Iso hore Pour entage en g L1 g < 38 %L2 38 % < g < 42 %H1 42 % < g < 47 %H2 47 % < g < 52 %H3 52 % < g N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionPour entage en g sur le hromosome 21 de l'homme
0.34
0.36
0.38
0.4
0.42
0.44
0.46
0.48
0.5
0.52
0.54
0 5e+06 1e+07 1.5e+07 2e+07 2.5e+07 3e+07 3.5e+07
Dis
trib
utio
n de
gc
Position dans la sequence
f(gc)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionDé�nition et notationsA est l'alphabet utilisé (par exemple A ={a, ,g,t}).Dé�nition (Chaîne de Markov régulée)Soit X = (Xt)t∈J0;nK une suite de variables aléatoires. Une haîne de Markovrégulée d'ordre k est uniquement dé�nie par sa matri e de transition
Π t
n
(u, v) = P (Xt = v|Xt−k . . . Xt−1 = u)et une loi initiale µ0 ave u = u1u2 . . . uk le passé markovien et(u1, u2, . . . , uk, v) ∈ Ak+1.Ordre k
Π0 ; µ0 Π k
n
Π k+1
n
· · · Π1
X0 . . . Xk−1 Xk Xk+1 · · · XnN. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré dPlan1 Introdu tion2 Dérive polynomialeDérive linéaireDérive de degré d3 Dérive par splines polynomialesEstimation globaleAller retour ave fon tions de baseAller retour sans fon tions de base4 Appli ationsLois stationnairesDérive polynomiale, dérive par splines : omparaisonModèles de Markov : omparaisonOrigine de répli ationMots ex eptionnels N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré dDérive linéaire : le modèleLes haînes de Markov régulées polynomiales ont deux paramètres d'ordre :l'ordre markovien : kle degré de la dérive : dDérive linéaireDeux matri es formant deux points d'appuis : Π0 au début de la séquen e etΠ1 à la �n de la séquen e. On varie linéairement de l'une à l'autre :
Π t
n
(u, v) =
„1 −
t
n
«Π0(u, v) +
„t
n
«Π1(u, v)Estimation de Π0 et Π1Maximum de vraisemblan eRégression matri iellePoint par point N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d
Π0 et Π1 : Maximum de vraisemblan eLa vraisemblan e (à l'ordre 1) :ℓ(X, Π0, Π1) = µ0(X0)
nY
t=1
»„1 −
t
n
«Π0(Xt−1, Xt) +
„t
n
«Π1(Xt−1, Xt)
–.La Log-vraisemblan e :
L(X, Π0, Π1) = ln µ0(X0) +
nX
t=1
X
u∈A
1{Xt−1=u}
X
v∈A
1{Xt=v} ln
„Π t
n
(u, v)
«.Nous posons
Π t
n
(u, u) =
„1 −
t
n
«0@1 −
X
v∈A\{u}
Π0(u, v)
1A +
„t
n
«0@1 −
X
v∈A\{u}
Π1(u, v)
1A ,ainsi L = ln µ0(X0) +
nX
t=1
X
u∈A
1{Xt−1=u}
0@0@ X
v∈A\{u}
1{Xt=v} ln
„Π t
n
(u, v)
«1A + 1{Xt=u} ln
„Π t
n
(u, u)
«1A .N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d
Π0 et Π1 : Maximum de vraisemblan eOn annule la dérivée pour obtenir le système suivant :8
>
>
>
>
>
>
<
>
>
>
>
>
>
:
nX
t=1
„
1 −
t
n
« 1{Xt−1=u,Xt=v}
Π t
n
(u, v)=
nX
t=1
„
1 −
t
n
« 1{Xt−1=u,Xt=u}
Π t
n
(u, u)
nX
t=1
„
t
n
« 1{Xt−1=u,Xt=v}
Π t
n
(u, v)=
nX
t=1
„
t
n
« 1{Xt−1=u,Xt=u}
Π t
n
(u, u)Un système de 2|A|(|A| − 1) équations à 2|A|(|A| − 1) in onnues.En réalité |A| systèmes 2(|A| − 1) équations à 2(|A| − 1) in onnues.N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d
Π0 et Π1 : Maximum de vraisemblan eExemple d'un de es systèmes à l'ordre 1 pour l'alphabet {a, , g, t}
•
n∑
t=1
1{Xt−1=a,Xt=c}
(tn
)(1 − t
n
)Π0(a, c) +
(tn
)Π1(a, c)
=
n∑
t=1
1{Xt−1=a,Xt=a}
(tn
)(1 − t
n
)(1 − Π0(a, c) − Π0(a, g) − Π0(a, t)) +
(tn
)(1 − Π1(a, c) − Π1(a, g) − Π1(a, t))
•
n∑
t=1
1{Xt−1=a,Xt=g}
(tn
)(1 − t
n
)Π0(a, g) +
(tn
)Π1(a, g)
=
n∑
t=1
1{Xt−1=a,Xt=a}
(tn
)(1 − t
n
)(1 − Π0(a, c) − Π0(a, g) − Π0(a, t)) +
(tn
)(1 − Π1(a, c) − Π1(a, g) − Π1(a, t))
•
n∑
t=1
1{Xt−1=a,Xt=t}
(tn
)(1 − t
n
)Π0(a, t) +
(tn
)Π1(a, t)
=
n∑
t=1
1{Xt−1=a,Xt=a}
(tn
)(1 − t
n
)(1 − Π0(a, c) − Π0(a, g) − Π0(a, t)) +
(tn
)(1 − Π1(a, c) − Π1(a, g) − Π1(a, t))
•
n∑
t=1
1{Xt−1=a,Xt=c}
(1 − t
n
)(1 − t
n
)Π0(a, c) +
(tn
)Π1(a, c)
=
n∑
t=1
1{Xt−1=a,Xt=a}
(1 − t
n
)(1 − t
n
)(1 − Π0(a, c) − Π0(a, g) − Π0(a, t)) +
(tn
)(1 − Π1(a, c) − Π1(a, g) − Π1(a, t))
•
n∑
t=1
1{Xt−1=a,Xt=g}
(1 − t
n
)(1 − t
n
)Π0(a, g) +
(tn
)Π1(a, g)
=
n∑
t=1
1{Xt−1=a,Xt=a}
(1 − t
n
)(1 − t
n
)(1 − Π0(a, c) − Π0(a, g) − Π0(a, t)) +
(tn
)(1 − Π1(a, c) − Π1(a, g) − Π1(a, t))
•
n∑
t=1
1{Xt−1=a,Xt=t}
(1 − t
n
)(1 − t
n
)Π0(a, t) +
(tn
)Π1(a, t)
=
n∑
t=1
1{Xt−1=a,Xt=a}
(1 − t
n
)(1 − t
n
)(1 − Π0(a, c) − Π0(a, g) − Π0(a, t)) +
(tn
)(1 − Π1(a, c) − Π1(a, g) − Π1(a, t))N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d
Π0 et Π1 : Régression matri ielleOn divise la séquen e en N segments de tailles m :X0 . . . Xm| {z }
S0
Xm+1 . . . X2m| {z }S1
· · ·X(N−1)m+1 . . . Xn| {z }SN−1Sur haque segment, on estime une matri e de transition :
dΠSℓ(u, v) =
NSℓ(uv)
NSℓ(u+)
=
X
t∈S⋆
ℓ
1{Xt−k . . . Xt−1 = u, Xt = v}
X
j∈S⋆
ℓ
1{Xj−k . . . Xj−1 = u}On minimise la somme X
ℓ∈J0,N−1K
d“dΠSℓ
, (1 − τℓ)Π0 + τℓΠ1
”.N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d
Π0 et Π1 : Régression matri ielleExpression de cΠ0 et cΠ1
8>>>><>>>>:
cΠ0(u, v) =B1C2(u, v) − B2C1(u, v)
A2B1 − A1B2
cΠ1(u, v) =A2C1(u, v) − A1C2(u, v)
A2B1 − A1B2
ave A1 =
N−1X
ℓ=0
1 − τℓ, B1 =
N−1X
ℓ=0
τℓ, C1(u, v) =
N−1X
ℓ=0
dΠSℓ(u, v),
A2 =
N−1X
ℓ=0
τℓ(1 − τℓ), B2 =
N−1X
ℓ=0
τℓ2, C2(u, v) =
N−1X
ℓ=0
τℓdΠSℓ
(u, v).Sto hasti ité de cΠ0 et cΠ1
X
v∈A
cΠ0(u, v) =X
v∈A
cΠ1(u, v) = 1.Mais tous les termes ne sont pas for ément positifs...N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d
Π0 et Π1 : Point par pointRappel : Π t
n
(u, v) =`1 − t
n
´Π0(u, v) + t
nΠ1(u, v)On minimise les �erreurs de prédi tions� :
nX
t=1
24 X
u∈Ak
1{Xt−k . . . Xt−1 = u}
"X
v∈A
“Π t
n
(u, v) − 1{Xt=v}
”2#35
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d
Π0 et Π1 : Point par pointExpression de cΠ0 et cΠ1
8>><>>:
cΠ0(u, v) =B2C1 − B1C2
A1B2 − A2B1
cΠ1(u, v) =A1C2 − A2C1
A1B2 − A2B1
ave A1 = A1(u) = 2
nX
t=1
1u
„1 −
t
n
«2
, A2 = A2(u) = 2nX
t=1
1u
„1 −
t
n
«„t
n
«,
B1 = B1(u) = 2nX
t=1
1u
„1 −
t
n
«„t
n
«, B2 = B2(u) = 2
nX
t=1
1u
„t
n
«2
,
C1 = C1(u, v) = 2nX
t=1
1uv
„1 −
t
n
«, C2 = C2(u, v) = 2
nX
t=1
1uv
„t
n
«.Sto hasti ité de cΠ0 et cΠ1
X
v∈A
cΠ0(u, v) =X
v∈A
cΠ1(u, v) = 1Mais tous les termes ne sont pas for ément positifs...N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré dDérive polynomialeDé�nitionUne dérive polynomiale de degré d né essite d + 1 matri es formant d + 1points d'appuis Π i
d
:Π t
n
(u, v) =dX
i=0
pi(t)Π i
d
(u, v)Les Π i
d
sont réparties uniformément sur la séquen e ;Les pi sont des polyn�mes de degré d tels que∀(i, j) ∈ {0, . . . , d}2, pi
„nj
d
«= 1{i=j};Pour t = ni/d, Π t
n
= Π i
d
;X
v∈A
Π t
n
(u, v) = 1. N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré dDérive polynomiale : Π t
n
(u, v)Chaîne de Markov régulées de degré 2
„2
t2
n2− 3
t
n+ 1
«Π0(u, v)+
„−4
t2
n2+ 4
t
n
«Π 1
2(u, v)+
„2
t2
n2−
t
n
«Π1(u, v).Chaîne de Markov régulées de degré 3
„−
9
2
t3
n3+ 9
t2
n2−
11
2
t
n+ 1
«Π0 +
„27
2
t3
n3−
45
2
t2
n2+ 9
t
n
«Π 1
3
+
„−
27
2
t3
n3+ 18
t2
n2−
9
2
t
n
«Π 2
3+
„9
2
t3
n3−
9
2
t2
n2+
t
n
«Π1.N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d
Π i
d
: Régression matri ielleFon tion à minimiserX
ℓ∈J0,N−1K
X
u∈Ak
X
v∈A
dΠSℓ
(u, v) −dX
i=0
pi(nτℓ)Π i
d
(u, v)
!2Systèmes à résoudrePour haque ouple (u, v), un système de d + 1 équations à d + 1 in onnues :
N−1∑
ℓ=0
A0(nτℓ)A0(nτℓ) · · ·
N−1∑
ℓ=0
A0(nτℓ)Ad(nτℓ)... ...N−1∑
ℓ=0
Ad(nτℓ)A0(nτℓ) · · ·
N−1∑
ℓ=0
Ad(nτℓ)Ad(nτℓ)
Π̂0(u, v)...Π̂1(u, v)
=
N−1∑
ℓ=0
A0(nτℓ)Π̂Sℓ(u, v)...
N−1∑
ℓ=0
Ad(nτℓ)Π̂Sℓ(u, v)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d
Π i
d
: Point par pointFon tion à minimisernX
t=1
24 X
u∈Ak
1u
"X
v∈A
“Π t
n
(u, v) − 1uv
”2#35Systèmes à résoudrePour haque ouple (u, v), un système de d + 1 équations à d + 1 in onnues :
n∑
t=1
1uA0(t)A0(t) · · ·
n∑
t=1
1uA0(t)Ad(t)... ...n∑
t=1
1uAd(t)A0(t) · · ·
n∑
t=1
1uAd(t)Ad(t)
Π̂0(u, v)...Π̂1(u, v)
=
n∑
t=1
A0(t)1uv...n∑
t=1
Ad(t)1uv
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré dLog-vraisemblan e : séquen es simuléesLog-vraisemblan eL(X, Π0, Π1) = ln µ0(X0) +
nX
t=1
X
u∈A
1{Xt−1=u}
X
v∈A
1{Xt=v} ln“Π t
n
(u, v)”
.Degré 0 1 2 3 4 5Ordre Régression −67191 −66999 −66962 −66910 −66909 −669070 Point −67191 −66999 −66962 −66910 −66909 −66907Ordre Régression −66718 −66504 −66448 −66382 −66376 −663681 Point −66710 −66501 −66445 −66380 −66374 −66366Ordre Régression −66706 −66482 −66407 −66321 −66295 −662752 Point −66693 −66477 −66402 −66317 −66290 −66270Ordre Régression −66630 −66331 −66186 −66038 −65938 −658833 Point −66612 −66320 −66169 −66014 −65898 −65817N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré dLog-vraisemblan e : séquen es réellesDegré 0 1 2 3 4 5Ordre Régression −67191 −66973 −66934 −66873 −66760 −666800 Point −67191 −66973 −66934 −66873 66760 −66680Ordre Régression −66743 −66500 −66439 −66362 −66234 −661461 Point −66714 −66483 −66419 −66345 −66220 −66135Ordre Régression −66052 −65657 −65577 −65438 −65281 −651602 Point −66005 −65631 −65544 −65410 −65255 −65139Ordre Régression −65661 −65168 −65033 −64809 −64597 −644323 Point −65579 −65116 −64951 −64746 −64497 −64329Con lusionPar la suite, nous pré onisons la méthode d'estimation point par point.N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesPlan1 Introdu tion2 Dérive polynomialeDérive linéaireDérive de degré d3 Dérive par splines polynomialesEstimation globaleAller retour ave fon tions de baseAller retour sans fon tions de base4 Appli ationsLois stationnairesDérive polynomiale, dérive par splines : omparaisonModèles de Markov : omparaisonOrigine de répli ationMots ex eptionnels N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesSplinesSplines polynomialesPolyn�mes par mor eaux de degré �xé (en général 3 : splines ubiques)Regression polynomialeChoix des noeuds (répartition uniforme)Contraintes de ontinuité aux noeudsPlus �exible que les polyn�mesN. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesSplinesSplines polynomialesPolyn�mes par mor eaux de degré �xé (en général 3 : splines ubiques)Regression polynomialeChoix des noeuds (répartition uniforme)Contraintes de ontinuité aux noeudsPlus �exible que les polyn�mesSplines de matri es : estimationEstimation globale : un unique système linéaireAller retour ave fon tions de base : plusieurs petits sytèmesAller retour sans fon tions de base : plusieurs petits sytèmesN. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesSplines de matri esDé oupage d'une séquen e en 5 mor eauxt
Π1t
n
Π2t
n
Π3t
n
Π4t
n
Π5t
n
α0 = 0 α1 α2 α3 α4 α5 = n
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesSplines de matri esDé oupage d'une séquen e en 5 mor eauxt
Π1t
n
Π2t
n
Π3t
n
Π4t
n
Π5t
n
α0 = 0 α1 α2 α3 α4 α5 = nSplines polynomiales de degré 0 et 1
0
0.1
0.2
0.3
0.4
0 100 200 300 400 500 600 700 800 900t
Π t
n
L'axe des ordonnées �représente� l'espa e des matri es.N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesEstimation globaleLe modèleΠi
t
n
(u, v) = M i0(u, v) +
t
nM i
1(u, v) + · · · +td
ndM i
d(u, v).ContraintesΠi
αi
n
(u, v) = Πi+1αi
n
(u, v) pour i allant de 1 à N − 1 (N − 1 ontraintes)“Πi
αin
”(j)
(u, v) =“Πi+1
αin
”(j)
(u, v) pour i allant de 1 à N − 1 et j allantde 1 à d − 1 ((N − 1)(d − 1) ontraintes)MinimisationPour haque ouple (u, v), (N − 1)d ontraintes et N(d + 1) paramètres :méthode lagrangienne. N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesAller retour ave fon tions de basesLes fon tions de base des polyn�mes de degré 3
0
0.5
1.0
0 0.5 1.0x
a(x)
0
0.25
0 0.5 1.0x
b(x)
0
0.5
1.0
0 0.5 1.0x
c(x)
0
0.25
0 0.5 1.0x
d(x)
a(x) = 2x3 − 3x2 + 1, b(x) = x3 − 2x2 + x,c(x) = −2x3 + 3x2, d(x) = −x3 + x2.N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesAller retour ave fon tions de bases : modèleLe modèleΠ
it
n
= Aia
t − αi−1
αi − αi−1
!+ Bib
t − αi−1
αi − αi−1
!+ Cic
t − αi−1
αi − αi−1
!+ Did
t − αi−1
αi − αi−1
!
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesAller retour ave fon tions de bases : modèleLe modèleΠ
it
n
= Aia
t − αi−1
αi − αi−1
!+ Bib
t − αi−1
αi − αi−1
!+ Cic
t − αi−1
αi − αi−1
!+ Did
t − αi−1
αi − αi−1
!Simpli� ation Πit
nLes ontraintes ainsi que les propriétés des fon tions de bases simpli�ent lemodèleΠi
t
n
= Aia
(t − αi−1
αi − αi−1
)+ Bib
(t − αi−1
αi − αi−1
)+ Ai+1a
(αi − t
αi − αi−1
)+
αi−1 − αi
αi+1 − αi
Bi+1b
(αi − t
αi − αi−1
)MinimisationLes ontraintes sont ette fois intégrées au modèle : méthode lassique.N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesAller retour ave fon tions de bases : algorithmeLe modèle Πit
n
Πit
n
= Aia
(t − αi−1
αi − αi−1
)+ Bib
(t − αi−1
αi − αi−1
)+ Ai+1a
(αi − t
αi − αi−1
)+
αi−1 − αi
αi+1 − αi
Bi+1b
(αi − t
αi − αi−1
)AlgorithmeInitialisation sur les deux premiers segments : A1, B1, A2, B2Aller sur haque segment i de 2 à N : Ai, BiRetour sur haque segment i de N − 1 à 1 : Ai, BiN. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesAller retour sans fon tions de baseLe modèleΠi
t
n
= Hi0 +
t
nHi
1 +t2
n2Hi
2 +t3
n3Hi
3.MinimisationPour haque ouple (u, v), 2(N − 1) ontraintes et 3N paramètres : méthodelagrangienne.AlgorithmeLe prin ipe est le même que pré édemment.N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesLog-vraisemblan es des di�érentes estimationsPhage LambdaNombre de segments 2 3 4 5 10Globale −66753 −66681 −66658 −66661 −66543Ordre 0 Sans base −66665 −67587 −72329 71979 −72680Bases −67439 −68049 −70115 −68473 −83406Globale −66213 −66136 −66110 −66101 −65930Ordre 1 Sans base −66119 −67429 −71213 −72184 −80817Bases −66578 −68377 −76442 −70565 −780727Globale −65244 −65135 −65073 −65047 −64761Ordre 2 Sans base −65112 −66843 −71439 −75769 −82707Bases −67853 −69738 −75917 −72260 −79626Globale −64486 −64319 −64170 −64059 −63406Ordre 3 Sans base −64290 −67234 −72830 −77288 −80974Bases −70331 −70894 −76871 −75301 −80273RemarqueCes log-vraisemblan es sont meilleures que elles obtenues par dérivepolynomiale dans le as d'une estimation globale.N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesGlobale / Aller retourOs illations Estimation globale 0.2
0.24
0.28
0.32
0 10000 20000 30000 40000
Dis
trib
utio
n de
a,c
,g,t
Position dans la sequence
µ(a)µ(g)µ(c)µ(t)
Estimation aller retour 0
0.1
0.2
0.3
0.4
0.5
0 10000 20000 30000 40000
Dis
trib
utio
n de
a,c
,g,t
Position dans la sequence
µ(a)µ(g)µ(c)µ(t)
Con lusionPar la suite, nous pré onisons la méthode d'estimation globale.N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsPlan1 Introdu tion2 Dérive polynomialeDérive linéaireDérive de degré d3 Dérive par splines polynomialesEstimation globaleAller retour ave fon tions de baseAller retour sans fon tions de base4 Appli ationsLois stationnairesDérive polynomiale, dérive par splines : omparaisonModèles de Markov : omparaisonOrigine de répli ationMots ex eptionnels N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 1) sur Chlamydiatra homatis 0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e a
Position dans la sequence
f(a)µ(a)
0.17
0.18
0.19
0.2
0.21
0.22
0.23
0.24
0.25
0 400000 800000
Dis
trib
utio
ns d
e c
Position dans la sequence
f(c)µ(c)
0.17
0.18
0.19
0.2
0.21
0.22
0.23
0.24
0.25
0 400000 800000
Dis
trib
utio
ns d
e g
Position dans la sequence
f(g)µ(g)
0.275
0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e t
Position dans la sequence
f(t)µ(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 2) 0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e a
Position dans la sequence
f(a)µ(a)
0.14 0.15 0.16 0.17 0.18 0.19 0.2
0.21 0.22 0.23 0.24 0.25
0 400000 800000
Dis
trib
utio
ns d
e c
Position dans la sequence
f(c)µ(c)
0.17 0.18 0.19 0.2
0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28
0 400000 800000
Dis
trib
utio
ns d
e g
Position dans la sequence
f(g)µ(g)
0.275
0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e t
Position dans la sequence
f(t)µ(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 3) 0.275
0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e a
Position dans la sequence
f(a)µ(a)
0.15 0.16 0.17 0.18 0.19 0.2
0.21 0.22 0.23 0.24 0.25
0 400000 800000
Dis
trib
utio
ns d
e c
Position dans la sequence
f(c)µ(c)
0.17 0.18 0.19 0.2
0.21 0.22 0.23 0.24 0.25 0.26 0.27
0 400000 800000
Dis
trib
utio
ns d
e g
Position dans la sequence
f(g)µ(g)
0.275
0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e t
Position dans la sequence
f(t)µ(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 4) 0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e a
Position dans la sequence
f(a)µ(a)
0.17
0.18
0.19
0.2
0.21
0.22
0.23
0.24
0.25
0 400000 800000
Dis
trib
utio
ns d
e c
Position dans la sequence
f(c)µ(c)
0.17
0.18
0.19
0.2
0.21
0.22
0.23
0.24
0.25
0 400000 800000
Dis
trib
utio
ns d
e g
Position dans la sequence
f(g)µ(g)
0.275
0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e t
Position dans la sequence
f(t)µ(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 5) 0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e a
Position dans la sequence
f(a)µ(a)
0.17
0.18
0.19
0.2
0.21
0.22
0.23
0.24
0.25
0 400000 800000
Dis
trib
utio
ns d
e c
Position dans la sequence
f(c)µ(c)
0.16
0.17
0.18
0.19
0.2
0.21
0.22
0.23
0.24
0.25
0 400000 800000
Dis
trib
utio
ns d
e g
Position dans la sequence
f(g)µ(g)
0.275
0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e t
Position dans la sequence
f(t)µ(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 6) 0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e a
Position dans la sequence
f(a)µ(a)
0.17
0.18
0.19
0.2
0.21
0.22
0.23
0.24
0.25
0 400000 800000
Dis
trib
utio
ns d
e c
Position dans la sequence
f(c)µ(c)
0.16
0.17
0.18
0.19
0.2
0.21
0.22
0.23
0.24
0.25
0 400000 800000
Dis
trib
utio
ns d
e g
Position dans la sequence
f(g)µ(g)
0.275
0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e t
Position dans la sequence
f(t)µ(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 7) 0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e a
Position dans la sequence
f(a)µ(a)
0.17
0.18
0.19
0.2
0.21
0.22
0.23
0.24
0.25
0 400000 800000
Dis
trib
utio
ns d
e c
Position dans la sequence
f(c)µ(c)
0.17
0.18
0.19
0.2
0.21
0.22
0.23
0.24
0.25
0 400000 800000
Dis
trib
utio
ns d
e g
Position dans la sequence
f(g)µ(g)
0.275
0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e t
Position dans la sequence
f(t)µ(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 8) 0.275
0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e a
Position dans la sequence
f(a)µ(a)
0.17
0.18
0.19
0.2
0.21
0.22
0.23
0.24
0.25
0 400000 800000
Dis
trib
utio
ns d
e c
Position dans la sequence
f(c)µ(c)
0.17 0.18 0.19 0.2
0.21 0.22 0.23 0.24 0.25 0.26 0.27
0 400000 800000
Dis
trib
utio
ns d
e g
Position dans la sequence
f(g)µ(g)
0.275
0.28
0.285
0.29
0.295
0.3
0.305
0.31
0 400000 800000
Dis
trib
utio
ns d
e t
Position dans la sequence
f(t)µ(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDérive polynomiale sur Chlamydia tra homatisDMM degré 1
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
DMM degré 2
0.14
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
DMM degré 3
0.14
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
DMM degré 4
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDérive polynomiale sur Chlamydia tra homatisDMM degré 5
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
DMM degré 6
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
DMM degré 7
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
DMM degré 8
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDérive par splines polynomiales sur Chlamydia tra homatisDMM degré 1
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
DMM degré 2
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
DMM degré 3
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
DMM degré 4
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDérive par splines polynomiales sur Chlamydia tra homatisDMM degré 5
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
DMM degré 6
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
DMM degré 7
0.14
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
DMM degré 8
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDérive polynomiale / Dérive par splines polynomialesRemarqueUne dérive par splines polynomiales de degré 4 ave 4 segments, fournit des ourbes semblables à une dérive de degré 8.Polynomiale degré 8
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
Splines degré 4
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
0 400000 800000
Dis
trib
utio
ns d
e a,
c,g,
t
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDérive polynomiale / Dérive par splines polynomialesMéthodes retenuesDérive polynomiale : estimation point par pointDérive par splines polynomiales : estimation globalePolynomiale degré 8
0.38
0.42
0.46
0.5
0 9e+06 1.8e+07 2.7e+07
Dis
trib
utio
n de
gc
Position dans la sequence
f(gc)Poly
Spline degré 3
0.38
0.42
0.46
0.5
0 9e+06 1.8e+07 2.7e+07
Dis
trib
utio
n de
gc
Position dans la sequence
f(gc)Splines
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDérive polynomiale / Dérive par splines polynomialesAvantage des splinesLa dérive par splines polynomiales permet des os illations ohérentes ave lesfréquen es alors que la dérive polynomiale o�re un tra é plus lisse.Splines / Polynomiale 0.36
0.38
0.4
0.42
0.44
0.46
0.48
0.5
0.52
0 6e+06 1.2e+07 1.8e+07 2.4e+07 3e+07
Dis
trib
utio
n de
gc
Position dans la sequence
f(gc)Poly
Splines
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es des nu léotides 0.24
0.28
0.32
10000 20000 30000 40000
Fré
quen
ce d
e a
Position dans la séquence
f(a)
0.2
0.24
0.28
10000 20000 30000 40000
Fré
quen
ce d
e c
Position dans la séquence
f(c)
0.2
0.24
0.28
0.32
10000 20000 30000 40000
Fré
quen
ce d
e g
Position dans la séquence
f(g)
0.2
0.24
0.28
0.32
0.36
10000 20000 30000 40000
Fré
quen
ce d
e t
Position dans la séquence
f(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es des nu léotides et Markov lassique 0.24
0.28
0.32
0 10000 20000 30000 40000
Fré
quen
ce d
e a
Position dans la séquence
f(a)mu(a)
0.2
0.24
0.28
0 10000 20000 30000 40000
Fré
quen
ce d
e c
Position dans la séquence
f(c)mu(c)
0.2
0.24
0.28
0.32
0 10000 20000 30000 40000
Fré
quen
ce d
e g
Position dans la séquence
f(g)mu(g)
0.2
0.24
0.28
0.32
0.36
0 10000 20000 30000 40000
Fré
quen
ce d
e t
Position dans la séquence
f(t)mu(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es des nu léotides et Markov a hé 0.24
0.28
0.32
0 10000 20000 30000 40000
Fré
quen
ce d
e a
Position dans la séquence
f(a)mu(a)
0.2
0.24
0.28
0 10000 20000 30000 40000
Fré
quen
ce d
e c
Position dans la séquence
f(c)mu(c)
0.2
0.24
0.28
0.32
0 10000 20000 30000 40000
Fré
quen
ce d
e g
Position dans la séquence
f(g)mu(g)
0.2
0.24
0.28
0.32
0.36
0 10000 20000 30000 40000
Fré
quen
ce d
e t
Position dans la séquence
f(t)mu(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es des nu léotides et Markov régulé 0.24
0.28
0.32
0 10000 20000 30000 40000
Fré
quen
ce d
e a
Position dans la séquence
f(a)mu(a)
0.16
0.2
0.24
0.28
0 10000 20000 30000 40000
Fré
quen
ce d
e c
Position dans la séquence
f(c)mu(c)
0.2
0.24
0.28
0.32
0 10000 20000 30000 40000
Fré
quen
ce d
e g
Position dans la séquence
f(g)mu(g)
0.2
0.24
0.28
0.32
0.36
0 10000 20000 30000 40000
Fré
quen
ce d
e t
Position dans la séquence
f(t)mu(t)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDistan es distributions / fréquen esDistan eddf =
X
v∈A
X
t∈P
(ft(v) − µt(v))2.Exemple sur le phage T4HMM à 3 états a hés : ddf = 5.873DMM de degré 3 : ddf = 5.865
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDistan es distributions / fréquen esDistan eddf =
X
v∈A
X
t∈P
(ft(v) − µt(v))2.Exemple sur le phage T4HMM à 3 états a hés : ddf = 5.873DMM de degré 3 : ddf = 5.865DMM de degré 8 : ddf = 3.391Con lusionLes modèles régulés o�re une modélisation plus �exible, plus pro he de laréalité. N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsLois stationnaires / HMMLimite des HMM
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0 5000 10000 15000 20000 25000 30000 35000 40000 45000 50000 0
1
2
Dis
trib
utio
ns
Eta
ts
Position dans la sequence
µ(a)µ(c)µ(g)µ(t)
segmentation HMM
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsChlamydia tra homatis : Origine de répli ation0
0 200000 400000 600000 800000 1e+06 1.2e+06
Cum
ulat
ive
GC
ske
w
Position dans la sequence
ORIGINE
TERMINUS
|||||||||||||||||||||||||||
||
Courbe ORILOCCourbe DMM
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsMots ex eptionnelsIdées basiquesMot sur-représenté : important pour la survie de l'organisme.Mot sous-représenté : nuit à l'organisme.Le ChiVirus
Complexe détruisant un virus Complexe commençant à détruirel’ADN de sa propre bactérie !
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsp-valeursDé�nitionS =
− log10 P(N > Nobs) si N ≥ E(N)+ log10 P(N < Nobs) si N < E(N)
.Le Chi de E. oli : g tggtgg Ordre Degré Espéran e S
1 0 70.10 240.8141 1 70.26 240.3981 2 71.88 238.7661 3 71.87 238.7741 8 71.94 238.6052 0 173.84 88.9022 1 174.03 88.7472 2 175.16 87.8372 3 175.10 87.8812 8 175.31 87.717N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsChoix d'un modèleClassi� ation des mots de taille 5 dans le génome omplet du phage LambdaMM HMM 3 états DMM degré 1Mots Nobs E(N) S Mots Nobs E(N) S Mots Nobs E(N) Saattg 32 88.22 −11.41 aattg 32 83.38 −10.07 aattg 32 86.53 −10.94ttggg 20 65.12 −10.33 a ttg 13 47.59 −8.57 ttgga 21 64.94 −9.76ttgga 21 66.70 −10.29 t tag 2 24.60 −8.19 ttggg 20 62.94 −9.66a ttg 13 50.74 −9.59 ttgga 21 59.47 −8.15 a ttg 13 50.27 −9.44taggg 3 29.60 −9.21 t gag 9 39.01 −8.11 t gag 9 40.69 −8.68g gg 114 53.97 12.13 g tgg 127 65.44 14.23 g tgg 127 64.80 11.77 tgaa 124 61.02 12.16 tgaa 124 61.34 14.90 tgaa 124 60.85 12.21t gg 100 39.98 15.08 gga 112 44.00 20.58 t gg 100 38.81 16.18 gga 112 43.11 17.93 t gg 100 36.50 20.65 gga 112 43.57 18.10g aga 141 57.51 20.20 g aga 141 58.35 22.66 g aga 141 57.59 20.31Que hoisir ?Un modèle re�étant au mieux la réalité.N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionCon lusion et perspe tivesPour on lure :De nouveaux modèles plus pro hes de la réalitéRe her he de mots ex eptionnelsModèles ave ovariables (pour entage en g , hydrophobi ité,...)Combinaison de modèles (Chaines de Markov régulées + Chaines deMarkov a hées)
N. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionPubli ations et logi ielsModèles de Markov régulésN. Vergne. Drifting Markov Models with Polynomial Drift and Appli ations to DNA Sequen es.Statisti al Appli ations in Geneti s and Mole ular Biology, 7(1),http://www.bepress. om/sagmb/vol7/iss1/art6/N. Vergne and G. Nuel. Pattern Statisti s a ording to Drifting Markov Models, in progress.N. Vergne and M. Termier. Drifting Markov Models with Polynomial Splines and Appli ations toDNA sequen es, in progress.Temps de retour et approximation de PoissonM. Abadi and N. Vergne. Sharp error terms for return time statisti s under mixing onditions,a epted in Journal of Theoreti al Probability.M. Abadi and N. Vergne. Sharp error terms for point-wise Poisson approximations under mixing onditions : A new Approa h, submitted in Nonlinearity.N. Vergne and M. Abadi. Poisson approximation for sear h of rare words in DNA sequen es,a epted in ALEA.Logi ielsPANOW (Poisson Approximation for the Number of O urren es of Words) :http://stat.genopole. nrs.fr/software/panowDRIMM (Drifting Markov Models) : http://stat.genopole. nrs.fr/software/drimmN. Vergne Chaînes de Markov régulées
Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionFinVoilà... C'est �ni.N. Vergne Chaînes de Markov régulées