72

expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionChaînes de Markov régulées pour l'analyse deséquen es biologiquesNi olas VergneLaboratoire Statistique et GénomeUMR CNRS 8071 - UMR INRA 1152Université d'Evry Val d'EssonneLe 11 Juillet 2008N. Vergne Chaînes de Markov régulées

Page 2: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionAvant-Proposggg gg ga t g gggtttt g tatttatgaaaatttt ggtttaagg gttt gtt tt tt gt ataa ttaatgtttttatttaaaata t tgaaaagaaaggaaa ga aggtg tgaaag gagg tttttgg t tgt gttt ttt t tgtttttgt gtggaatgaa aatggaagt aa aaaaag ag tgg tga atttt ggtg gagtat gta att agaa tgg aggaa agggaatg gtt tg gagg ggtgg aagggtaatgaggtg tttatga t tg g gt ataaaatggtatg gaaagggatg tgaaattgagaa gaaaag tg g gggaggttgaagaa tg gg agg ag gagg agat t ag aggaa tattgagta gaa g at ga tta g gtg g agg ga g a aggaa tgaagaatg agaga t g tgaagtggtggaaa g att tgta ttt gtg tgt g ggat g aggtgaaattg agtatt t ga ggg t tgt ggtg ag gg gtttt ggaa tggaaaa ga atgttgattt tgaaa gggatat at aaag atgaa aaag ag g g tggatgaa tgata ggggttg tgagtgaatatat gaa agt aggttaa agg tg gg attttgt g g ggg tt g t a tgtt agg ggag a aga g gttgaatggg ggatg taatta tat t gaaagaat g ata aggaaggg g tgggaaa a tg ttt ag ggg at atgaatg gatggg ag ga ta at gtgaggtgaatgtggtgaagt tg gtgt ggttatt aaaatg tg tgggtgtttatg ta tttatagaN. Vergne Chaînes de Markov régulées

Page 3: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionPlan1 Introdu tion2 Dérive polynomialeDérive linéaireDérive de degré d3 Dérive par splines polynomialesEstimation globaleAller retour ave fon tions de baseAller retour sans fon tions de base4 Appli ationsLois stationnairesDérive polynomiale, dérive par splines : omparaisonModèles de Markov : omparaisonOrigine de répli ationMots ex eptionnels N. Vergne Chaînes de Markov régulées

Page 4: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionPlan1 Introdu tion2 Dérive polynomialeDérive linéaireDérive de degré d3 Dérive par splines polynomialesEstimation globaleAller retour ave fon tions de baseAller retour sans fon tions de base4 Appli ationsLois stationnairesDérive polynomiale, dérive par splines : omparaisonModèles de Markov : omparaisonOrigine de répli ationMots ex eptionnels N. Vergne Chaînes de Markov régulées

Page 5: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionLes modèles de MarkovChaînes de MarkovHomogénéité des séquen es. Faux ! Exemple : pour entage en g .X = (Xt)t∈J0;nK −→ Π

N. Vergne Chaînes de Markov régulées

Page 6: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionLes modèles de MarkovChaînes de MarkovHomogénéité des séquen es. Faux ! Exemple : pour entage en g .X = (Xt)t∈J0;nK −→ ΠChaînes de Markov a héesDi�érentes plages homogènes. Modélisation d'un ertain nombre de�phénomènes� biologiques. Exemple : omposition di�érente des régions odantes et non- odantes. X = (Xt)t∈J0;nK −→ Π1, Π2, . . .

N. Vergne Chaînes de Markov régulées

Page 7: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionLes modèles de MarkovChaînes de MarkovHomogénéité des séquen es. Faux ! Exemple : pour entage en g .X = (Xt)t∈J0;nK −→ ΠChaînes de Markov a héesDi�érentes plages homogènes. Modélisation d'un ertain nombre de�phénomènes� biologiques. Exemple : omposition di�érente des régions odantes et non- odantes. X = (Xt)t∈J0;nK −→ Π1, Π2, . . .Chaînes de Markov réguléesHétérogénéité ontinue. Modélisation de phénomènes biologiques ontinus.Exemple : transition (parfois brutale) entre deux états d'une haîne de Markov a hée ou pour entage en g . X = (Xt)t∈J0;nK −→ Π t

nN. Vergne Chaînes de Markov régulées

Page 8: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionFréquen es des nu léotides : phage Lambda 0.24

0.28

0.32

10000 20000 30000 40000

Fré

quen

ce d

e a

Position dans la séquence

f(a)

0.2

0.24

0.28

10000 20000 30000 40000

Fré

quen

ce d

e c

Position dans la séquence

f(c)

0.2

0.24

0.28

0.32

10000 20000 30000 40000

Fré

quen

ce d

e g

Position dans la séquence

f(g)

0.2

0.24

0.28

0.32

0.36

10000 20000 30000 40000

Fré

quen

ce d

e t

Position dans la séquence

f(t)

N. Vergne Chaînes de Markov régulées

Page 9: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionFréquen es des nu léotides et Markov lassique 0.24

0.28

0.32

0 10000 20000 30000 40000

Fré

quen

ce d

e a

Position dans la séquence

f(a)mu(a)

0.2

0.24

0.28

0 10000 20000 30000 40000

Fré

quen

ce d

e c

Position dans la séquence

f(c)mu(c)

0.2

0.24

0.28

0.32

0 10000 20000 30000 40000

Fré

quen

ce d

e g

Position dans la séquence

f(g)mu(g)

0.2

0.24

0.28

0.32

0.36

0 10000 20000 30000 40000

Fré

quen

ce d

e t

Position dans la séquence

f(t)mu(t)

N. Vergne Chaînes de Markov régulées

Page 10: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionFréquen es des nu léotides et Markov a hé 0.24

0.28

0.32

0 10000 20000 30000 40000

Fré

quen

ce d

e a

Position dans la séquence

f(a)mu(a)

0.2

0.24

0.28

0 10000 20000 30000 40000

Fré

quen

ce d

e c

Position dans la séquence

f(c)mu(c)

0.2

0.24

0.28

0.32

0 10000 20000 30000 40000

Fré

quen

ce d

e g

Position dans la séquence

f(g)mu(g)

0.2

0.24

0.28

0.32

0.36

0 10000 20000 30000 40000

Fré

quen

ce d

e t

Position dans la séquence

f(t)mu(t)

N. Vergne Chaînes de Markov régulées

Page 11: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionFréquen es des nu léotides et Markov régulé 0.24

0.28

0.32

0 10000 20000 30000 40000

Fré

quen

ce d

e a

Position dans la séquence

f(a)mu(a)

0.16

0.2

0.24

0.28

0 10000 20000 30000 40000

Fré

quen

ce d

e c

Position dans la séquence

f(c)mu(c)

0.2

0.24

0.28

0.32

0 10000 20000 30000 40000

Fré

quen

ce d

e g

Position dans la séquence

f(g)mu(g)

0.2

0.24

0.28

0.32

0.36

0 10000 20000 30000 40000

Fré

quen

ce d

e t

Position dans la séquence

f(t)mu(t)

N. Vergne Chaînes de Markov régulées

Page 12: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionIso horesPhénomène biologiqueLe pour entage en g varie le long d'une séquen e.Iso hores Iso hore Pour entage en g L1 g < 38 %L2 38 % < g < 42 %H1 42 % < g < 47 %H2 47 % < g < 52 %H3 52 % < g N. Vergne Chaînes de Markov régulées

Page 13: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionPour entage en g sur le hromosome 21 de l'homme

0.34

0.36

0.38

0.4

0.42

0.44

0.46

0.48

0.5

0.52

0.54

0 5e+06 1e+07 1.5e+07 2e+07 2.5e+07 3e+07 3.5e+07

Dis

trib

utio

n de

gc

Position dans la sequence

f(gc)

N. Vergne Chaînes de Markov régulées

Page 14: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionDé�nition et notationsA est l'alphabet utilisé (par exemple A ={a, ,g,t}).Dé�nition (Chaîne de Markov régulée)Soit X = (Xt)t∈J0;nK une suite de variables aléatoires. Une haîne de Markovrégulée d'ordre k est uniquement dé�nie par sa matri e de transition

Π t

n

(u, v) = P (Xt = v|Xt−k . . . Xt−1 = u)et une loi initiale µ0 ave u = u1u2 . . . uk le passé markovien et(u1, u2, . . . , uk, v) ∈ Ak+1.Ordre k

Π0 ; µ0 Π k

n

Π k+1

n

· · · Π1

X0 . . . Xk−1 Xk Xk+1 · · · XnN. Vergne Chaînes de Markov régulées

Page 15: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré dPlan1 Introdu tion2 Dérive polynomialeDérive linéaireDérive de degré d3 Dérive par splines polynomialesEstimation globaleAller retour ave fon tions de baseAller retour sans fon tions de base4 Appli ationsLois stationnairesDérive polynomiale, dérive par splines : omparaisonModèles de Markov : omparaisonOrigine de répli ationMots ex eptionnels N. Vergne Chaînes de Markov régulées

Page 16: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré dDérive linéaire : le modèleLes haînes de Markov régulées polynomiales ont deux paramètres d'ordre :l'ordre markovien : kle degré de la dérive : dDérive linéaireDeux matri es formant deux points d'appuis : Π0 au début de la séquen e etΠ1 à la �n de la séquen e. On varie linéairement de l'une à l'autre :

Π t

n

(u, v) =

„1 −

t

n

«Π0(u, v) +

„t

n

«Π1(u, v)Estimation de Π0 et Π1Maximum de vraisemblan eRégression matri iellePoint par point N. Vergne Chaînes de Markov régulées

Page 17: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d

Π0 et Π1 : Maximum de vraisemblan eLa vraisemblan e (à l'ordre 1) :ℓ(X, Π0, Π1) = µ0(X0)

nY

t=1

»„1 −

t

n

«Π0(Xt−1, Xt) +

„t

n

«Π1(Xt−1, Xt)

–.La Log-vraisemblan e :

L(X, Π0, Π1) = ln µ0(X0) +

nX

t=1

X

u∈A

1{Xt−1=u}

X

v∈A

1{Xt=v} ln

„Π t

n

(u, v)

«.Nous posons

Π t

n

(u, u) =

„1 −

t

n

«0@1 −

X

v∈A\{u}

Π0(u, v)

1A +

„t

n

«0@1 −

X

v∈A\{u}

Π1(u, v)

1A ,ainsi L = ln µ0(X0) +

nX

t=1

X

u∈A

1{Xt−1=u}

0@0@ X

v∈A\{u}

1{Xt=v} ln

„Π t

n

(u, v)

«1A + 1{Xt=u} ln

„Π t

n

(u, u)

«1A .N. Vergne Chaînes de Markov régulées

Page 18: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d

Π0 et Π1 : Maximum de vraisemblan eOn annule la dérivée pour obtenir le système suivant :8

>

>

>

>

>

>

<

>

>

>

>

>

>

:

nX

t=1

1 −

t

n

« 1{Xt−1=u,Xt=v}

Π t

n

(u, v)=

nX

t=1

1 −

t

n

« 1{Xt−1=u,Xt=u}

Π t

n

(u, u)

nX

t=1

t

n

« 1{Xt−1=u,Xt=v}

Π t

n

(u, v)=

nX

t=1

t

n

« 1{Xt−1=u,Xt=u}

Π t

n

(u, u)Un système de 2|A|(|A| − 1) équations à 2|A|(|A| − 1) in onnues.En réalité |A| systèmes 2(|A| − 1) équations à 2(|A| − 1) in onnues.N. Vergne Chaînes de Markov régulées

Page 19: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d

Π0 et Π1 : Maximum de vraisemblan eExemple d'un de es systèmes à l'ordre 1 pour l'alphabet {a, , g, t}

n∑

t=1

1{Xt−1=a,Xt=c}

(tn

)(1 − t

n

)Π0(a, c) +

(tn

)Π1(a, c)

=

n∑

t=1

1{Xt−1=a,Xt=a}

(tn

)(1 − t

n

)(1 − Π0(a, c) − Π0(a, g) − Π0(a, t)) +

(tn

)(1 − Π1(a, c) − Π1(a, g) − Π1(a, t))

n∑

t=1

1{Xt−1=a,Xt=g}

(tn

)(1 − t

n

)Π0(a, g) +

(tn

)Π1(a, g)

=

n∑

t=1

1{Xt−1=a,Xt=a}

(tn

)(1 − t

n

)(1 − Π0(a, c) − Π0(a, g) − Π0(a, t)) +

(tn

)(1 − Π1(a, c) − Π1(a, g) − Π1(a, t))

n∑

t=1

1{Xt−1=a,Xt=t}

(tn

)(1 − t

n

)Π0(a, t) +

(tn

)Π1(a, t)

=

n∑

t=1

1{Xt−1=a,Xt=a}

(tn

)(1 − t

n

)(1 − Π0(a, c) − Π0(a, g) − Π0(a, t)) +

(tn

)(1 − Π1(a, c) − Π1(a, g) − Π1(a, t))

n∑

t=1

1{Xt−1=a,Xt=c}

(1 − t

n

)(1 − t

n

)Π0(a, c) +

(tn

)Π1(a, c)

=

n∑

t=1

1{Xt−1=a,Xt=a}

(1 − t

n

)(1 − t

n

)(1 − Π0(a, c) − Π0(a, g) − Π0(a, t)) +

(tn

)(1 − Π1(a, c) − Π1(a, g) − Π1(a, t))

n∑

t=1

1{Xt−1=a,Xt=g}

(1 − t

n

)(1 − t

n

)Π0(a, g) +

(tn

)Π1(a, g)

=

n∑

t=1

1{Xt−1=a,Xt=a}

(1 − t

n

)(1 − t

n

)(1 − Π0(a, c) − Π0(a, g) − Π0(a, t)) +

(tn

)(1 − Π1(a, c) − Π1(a, g) − Π1(a, t))

n∑

t=1

1{Xt−1=a,Xt=t}

(1 − t

n

)(1 − t

n

)Π0(a, t) +

(tn

)Π1(a, t)

=

n∑

t=1

1{Xt−1=a,Xt=a}

(1 − t

n

)(1 − t

n

)(1 − Π0(a, c) − Π0(a, g) − Π0(a, t)) +

(tn

)(1 − Π1(a, c) − Π1(a, g) − Π1(a, t))N. Vergne Chaînes de Markov régulées

Page 20: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d

Π0 et Π1 : Régression matri ielleOn divise la séquen e en N segments de tailles m :X0 . . . Xm| {z }

S0

Xm+1 . . . X2m| {z }S1

· · ·X(N−1)m+1 . . . Xn| {z }SN−1Sur haque segment, on estime une matri e de transition :

dΠSℓ(u, v) =

NSℓ(uv)

NSℓ(u+)

=

X

t∈S⋆

1{Xt−k . . . Xt−1 = u, Xt = v}

X

j∈S⋆

1{Xj−k . . . Xj−1 = u}On minimise la somme X

ℓ∈J0,N−1K

d“dΠSℓ

, (1 − τℓ)Π0 + τℓΠ1

”.N. Vergne Chaînes de Markov régulées

Page 21: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d

Π0 et Π1 : Régression matri ielleExpression de cΠ0 et cΠ1

8>>>><>>>>:

cΠ0(u, v) =B1C2(u, v) − B2C1(u, v)

A2B1 − A1B2

cΠ1(u, v) =A2C1(u, v) − A1C2(u, v)

A2B1 − A1B2

ave A1 =

N−1X

ℓ=0

1 − τℓ, B1 =

N−1X

ℓ=0

τℓ, C1(u, v) =

N−1X

ℓ=0

dΠSℓ(u, v),

A2 =

N−1X

ℓ=0

τℓ(1 − τℓ), B2 =

N−1X

ℓ=0

τℓ2, C2(u, v) =

N−1X

ℓ=0

τℓdΠSℓ

(u, v).Sto hasti ité de cΠ0 et cΠ1

X

v∈A

cΠ0(u, v) =X

v∈A

cΠ1(u, v) = 1.Mais tous les termes ne sont pas for ément positifs...N. Vergne Chaînes de Markov régulées

Page 22: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d

Π0 et Π1 : Point par pointRappel : Π t

n

(u, v) =`1 − t

n

´Π0(u, v) + t

nΠ1(u, v)On minimise les �erreurs de prédi tions� :

nX

t=1

24 X

u∈Ak

1{Xt−k . . . Xt−1 = u}

"X

v∈A

“Π t

n

(u, v) − 1{Xt=v}

”2#35

N. Vergne Chaînes de Markov régulées

Page 23: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d

Π0 et Π1 : Point par pointExpression de cΠ0 et cΠ1

8>><>>:

cΠ0(u, v) =B2C1 − B1C2

A1B2 − A2B1

cΠ1(u, v) =A1C2 − A2C1

A1B2 − A2B1

ave A1 = A1(u) = 2

nX

t=1

1u

„1 −

t

n

«2

, A2 = A2(u) = 2nX

t=1

1u

„1 −

t

n

«„t

n

«,

B1 = B1(u) = 2nX

t=1

1u

„1 −

t

n

«„t

n

«, B2 = B2(u) = 2

nX

t=1

1u

„t

n

«2

,

C1 = C1(u, v) = 2nX

t=1

1uv

„1 −

t

n

«, C2 = C2(u, v) = 2

nX

t=1

1uv

„t

n

«.Sto hasti ité de cΠ0 et cΠ1

X

v∈A

cΠ0(u, v) =X

v∈A

cΠ1(u, v) = 1Mais tous les termes ne sont pas for ément positifs...N. Vergne Chaînes de Markov régulées

Page 24: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré dDérive polynomialeDé�nitionUne dérive polynomiale de degré d né essite d + 1 matri es formant d + 1points d'appuis Π i

d

:Π t

n

(u, v) =dX

i=0

pi(t)Π i

d

(u, v)Les Π i

d

sont réparties uniformément sur la séquen e ;Les pi sont des polyn�mes de degré d tels que∀(i, j) ∈ {0, . . . , d}2, pi

„nj

d

«= 1{i=j};Pour t = ni/d, Π t

n

= Π i

d

;X

v∈A

Π t

n

(u, v) = 1. N. Vergne Chaînes de Markov régulées

Page 25: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré dDérive polynomiale : Π t

n

(u, v)Chaîne de Markov régulées de degré 2

„2

t2

n2− 3

t

n+ 1

«Π0(u, v)+

„−4

t2

n2+ 4

t

n

«Π 1

2(u, v)+

„2

t2

n2−

t

n

«Π1(u, v).Chaîne de Markov régulées de degré 3

„−

9

2

t3

n3+ 9

t2

n2−

11

2

t

n+ 1

«Π0 +

„27

2

t3

n3−

45

2

t2

n2+ 9

t

n

«Π 1

3

+

„−

27

2

t3

n3+ 18

t2

n2−

9

2

t

n

«Π 2

3+

„9

2

t3

n3−

9

2

t2

n2+

t

n

«Π1.N. Vergne Chaînes de Markov régulées

Page 26: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d

Π i

d

: Régression matri ielleFon tion à minimiserX

ℓ∈J0,N−1K

X

u∈Ak

X

v∈A

dΠSℓ

(u, v) −dX

i=0

pi(nτℓ)Π i

d

(u, v)

!2Systèmes à résoudrePour haque ouple (u, v), un système de d + 1 équations à d + 1 in onnues :

N−1∑

ℓ=0

A0(nτℓ)A0(nτℓ) · · ·

N−1∑

ℓ=0

A0(nτℓ)Ad(nτℓ)... ...N−1∑

ℓ=0

Ad(nτℓ)A0(nτℓ) · · ·

N−1∑

ℓ=0

Ad(nτℓ)Ad(nτℓ)

Π̂0(u, v)...Π̂1(u, v)

=

N−1∑

ℓ=0

A0(nτℓ)Π̂Sℓ(u, v)...

N−1∑

ℓ=0

Ad(nτℓ)Π̂Sℓ(u, v)

N. Vergne Chaînes de Markov régulées

Page 27: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré d

Π i

d

: Point par pointFon tion à minimisernX

t=1

24 X

u∈Ak

1u

"X

v∈A

“Π t

n

(u, v) − 1uv

”2#35Systèmes à résoudrePour haque ouple (u, v), un système de d + 1 équations à d + 1 in onnues :

n∑

t=1

1uA0(t)A0(t) · · ·

n∑

t=1

1uA0(t)Ad(t)... ...n∑

t=1

1uAd(t)A0(t) · · ·

n∑

t=1

1uAd(t)Ad(t)

Π̂0(u, v)...Π̂1(u, v)

=

n∑

t=1

A0(t)1uv...n∑

t=1

Ad(t)1uv

N. Vergne Chaînes de Markov régulées

Page 28: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré dLog-vraisemblan e : séquen es simuléesLog-vraisemblan eL(X, Π0, Π1) = ln µ0(X0) +

nX

t=1

X

u∈A

1{Xt−1=u}

X

v∈A

1{Xt=v} ln“Π t

n

(u, v)”

.Degré 0 1 2 3 4 5Ordre Régression −67191 −66999 −66962 −66910 −66909 −669070 Point −67191 −66999 −66962 −66910 −66909 −66907Ordre Régression −66718 −66504 −66448 −66382 −66376 −663681 Point −66710 −66501 −66445 −66380 −66374 −66366Ordre Régression −66706 −66482 −66407 −66321 −66295 −662752 Point −66693 −66477 −66402 −66317 −66290 −66270Ordre Régression −66630 −66331 −66186 −66038 −65938 −658833 Point −66612 −66320 −66169 −66014 −65898 −65817N. Vergne Chaînes de Markov régulées

Page 29: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Dérive linéaireDérive de degré dLog-vraisemblan e : séquen es réellesDegré 0 1 2 3 4 5Ordre Régression −67191 −66973 −66934 −66873 −66760 −666800 Point −67191 −66973 −66934 −66873 66760 −66680Ordre Régression −66743 −66500 −66439 −66362 −66234 −661461 Point −66714 −66483 −66419 −66345 −66220 −66135Ordre Régression −66052 −65657 −65577 −65438 −65281 −651602 Point −66005 −65631 −65544 −65410 −65255 −65139Ordre Régression −65661 −65168 −65033 −64809 −64597 −644323 Point −65579 −65116 −64951 −64746 −64497 −64329Con lusionPar la suite, nous pré onisons la méthode d'estimation point par point.N. Vergne Chaînes de Markov régulées

Page 30: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesPlan1 Introdu tion2 Dérive polynomialeDérive linéaireDérive de degré d3 Dérive par splines polynomialesEstimation globaleAller retour ave fon tions de baseAller retour sans fon tions de base4 Appli ationsLois stationnairesDérive polynomiale, dérive par splines : omparaisonModèles de Markov : omparaisonOrigine de répli ationMots ex eptionnels N. Vergne Chaînes de Markov régulées

Page 31: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesSplinesSplines polynomialesPolyn�mes par mor eaux de degré �xé (en général 3 : splines ubiques)Regression polynomialeChoix des noeuds (répartition uniforme)Contraintes de ontinuité aux noeudsPlus �exible que les polyn�mesN. Vergne Chaînes de Markov régulées

Page 32: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesSplinesSplines polynomialesPolyn�mes par mor eaux de degré �xé (en général 3 : splines ubiques)Regression polynomialeChoix des noeuds (répartition uniforme)Contraintes de ontinuité aux noeudsPlus �exible que les polyn�mesSplines de matri es : estimationEstimation globale : un unique système linéaireAller retour ave fon tions de base : plusieurs petits sytèmesAller retour sans fon tions de base : plusieurs petits sytèmesN. Vergne Chaînes de Markov régulées

Page 33: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesSplines de matri esDé oupage d'une séquen e en 5 mor eauxt

Π1t

n

Π2t

n

Π3t

n

Π4t

n

Π5t

n

α0 = 0 α1 α2 α3 α4 α5 = n

N. Vergne Chaînes de Markov régulées

Page 34: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesSplines de matri esDé oupage d'une séquen e en 5 mor eauxt

Π1t

n

Π2t

n

Π3t

n

Π4t

n

Π5t

n

α0 = 0 α1 α2 α3 α4 α5 = nSplines polynomiales de degré 0 et 1

0

0.1

0.2

0.3

0.4

0 100 200 300 400 500 600 700 800 900t

Π t

n

L'axe des ordonnées �représente� l'espa e des matri es.N. Vergne Chaînes de Markov régulées

Page 35: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesEstimation globaleLe modèleΠi

t

n

(u, v) = M i0(u, v) +

t

nM i

1(u, v) + · · · +td

ndM i

d(u, v).ContraintesΠi

αi

n

(u, v) = Πi+1αi

n

(u, v) pour i allant de 1 à N − 1 (N − 1 ontraintes)“Πi

αin

”(j)

(u, v) =“Πi+1

αin

”(j)

(u, v) pour i allant de 1 à N − 1 et j allantde 1 à d − 1 ((N − 1)(d − 1) ontraintes)MinimisationPour haque ouple (u, v), (N − 1)d ontraintes et N(d + 1) paramètres :méthode lagrangienne. N. Vergne Chaînes de Markov régulées

Page 36: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesAller retour ave fon tions de basesLes fon tions de base des polyn�mes de degré 3

0

0.5

1.0

0 0.5 1.0x

a(x)

0

0.25

0 0.5 1.0x

b(x)

0

0.5

1.0

0 0.5 1.0x

c(x)

0

0.25

0 0.5 1.0x

d(x)

a(x) = 2x3 − 3x2 + 1, b(x) = x3 − 2x2 + x,c(x) = −2x3 + 3x2, d(x) = −x3 + x2.N. Vergne Chaînes de Markov régulées

Page 37: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesAller retour ave fon tions de bases : modèleLe modèleΠ

it

n

= Aia

t − αi−1

αi − αi−1

!+ Bib

t − αi−1

αi − αi−1

!+ Cic

t − αi−1

αi − αi−1

!+ Did

t − αi−1

αi − αi−1

!

N. Vergne Chaînes de Markov régulées

Page 38: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesAller retour ave fon tions de bases : modèleLe modèleΠ

it

n

= Aia

t − αi−1

αi − αi−1

!+ Bib

t − αi−1

αi − αi−1

!+ Cic

t − αi−1

αi − αi−1

!+ Did

t − αi−1

αi − αi−1

!Simpli� ation Πit

nLes ontraintes ainsi que les propriétés des fon tions de bases simpli�ent lemodèleΠi

t

n

= Aia

(t − αi−1

αi − αi−1

)+ Bib

(t − αi−1

αi − αi−1

)+ Ai+1a

(αi − t

αi − αi−1

)+

αi−1 − αi

αi+1 − αi

Bi+1b

(αi − t

αi − αi−1

)MinimisationLes ontraintes sont ette fois intégrées au modèle : méthode lassique.N. Vergne Chaînes de Markov régulées

Page 39: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesAller retour ave fon tions de bases : algorithmeLe modèle Πit

n

Πit

n

= Aia

(t − αi−1

αi − αi−1

)+ Bib

(t − αi−1

αi − αi−1

)+ Ai+1a

(αi − t

αi − αi−1

)+

αi−1 − αi

αi+1 − αi

Bi+1b

(αi − t

αi − αi−1

)AlgorithmeInitialisation sur les deux premiers segments : A1, B1, A2, B2Aller sur haque segment i de 2 à N : Ai, BiRetour sur haque segment i de N − 1 à 1 : Ai, BiN. Vergne Chaînes de Markov régulées

Page 40: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesAller retour sans fon tions de baseLe modèleΠi

t

n

= Hi0 +

t

nHi

1 +t2

n2Hi

2 +t3

n3Hi

3.MinimisationPour haque ouple (u, v), 2(N − 1) ontraintes et 3N paramètres : méthodelagrangienne.AlgorithmeLe prin ipe est le même que pré édemment.N. Vergne Chaînes de Markov régulées

Page 41: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesLog-vraisemblan es des di�érentes estimationsPhage LambdaNombre de segments 2 3 4 5 10Globale −66753 −66681 −66658 −66661 −66543Ordre 0 Sans base −66665 −67587 −72329 71979 −72680Bases −67439 −68049 −70115 −68473 −83406Globale −66213 −66136 −66110 −66101 −65930Ordre 1 Sans base −66119 −67429 −71213 −72184 −80817Bases −66578 −68377 −76442 −70565 −780727Globale −65244 −65135 −65073 −65047 −64761Ordre 2 Sans base −65112 −66843 −71439 −75769 −82707Bases −67853 −69738 −75917 −72260 −79626Globale −64486 −64319 −64170 −64059 −63406Ordre 3 Sans base −64290 −67234 −72830 −77288 −80974Bases −70331 −70894 −76871 −75301 −80273RemarqueCes log-vraisemblan es sont meilleures que elles obtenues par dérivepolynomiale dans le as d'une estimation globale.N. Vergne Chaînes de Markov régulées

Page 42: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Estimation globaleAller retour ave fon tions de baseAller retour sans fon tions de baseCon lusion sur les splinesGlobale / Aller retourOs illations Estimation globale 0.2

0.24

0.28

0.32

0 10000 20000 30000 40000

Dis

trib

utio

n de

a,c

,g,t

Position dans la sequence

µ(a)µ(g)µ(c)µ(t)

Estimation aller retour 0

0.1

0.2

0.3

0.4

0.5

0 10000 20000 30000 40000

Dis

trib

utio

n de

a,c

,g,t

Position dans la sequence

µ(a)µ(g)µ(c)µ(t)

Con lusionPar la suite, nous pré onisons la méthode d'estimation globale.N. Vergne Chaînes de Markov régulées

Page 43: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsPlan1 Introdu tion2 Dérive polynomialeDérive linéaireDérive de degré d3 Dérive par splines polynomialesEstimation globaleAller retour ave fon tions de baseAller retour sans fon tions de base4 Appli ationsLois stationnairesDérive polynomiale, dérive par splines : omparaisonModèles de Markov : omparaisonOrigine de répli ationMots ex eptionnels N. Vergne Chaînes de Markov régulées

Page 44: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 1) sur Chlamydiatra homatis 0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e a

Position dans la sequence

f(a)µ(a)

0.17

0.18

0.19

0.2

0.21

0.22

0.23

0.24

0.25

0 400000 800000

Dis

trib

utio

ns d

e c

Position dans la sequence

f(c)µ(c)

0.17

0.18

0.19

0.2

0.21

0.22

0.23

0.24

0.25

0 400000 800000

Dis

trib

utio

ns d

e g

Position dans la sequence

f(g)µ(g)

0.275

0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e t

Position dans la sequence

f(t)µ(t)

N. Vergne Chaînes de Markov régulées

Page 45: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 2) 0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e a

Position dans la sequence

f(a)µ(a)

0.14 0.15 0.16 0.17 0.18 0.19 0.2

0.21 0.22 0.23 0.24 0.25

0 400000 800000

Dis

trib

utio

ns d

e c

Position dans la sequence

f(c)µ(c)

0.17 0.18 0.19 0.2

0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28

0 400000 800000

Dis

trib

utio

ns d

e g

Position dans la sequence

f(g)µ(g)

0.275

0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e t

Position dans la sequence

f(t)µ(t)

N. Vergne Chaînes de Markov régulées

Page 46: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 3) 0.275

0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e a

Position dans la sequence

f(a)µ(a)

0.15 0.16 0.17 0.18 0.19 0.2

0.21 0.22 0.23 0.24 0.25

0 400000 800000

Dis

trib

utio

ns d

e c

Position dans la sequence

f(c)µ(c)

0.17 0.18 0.19 0.2

0.21 0.22 0.23 0.24 0.25 0.26 0.27

0 400000 800000

Dis

trib

utio

ns d

e g

Position dans la sequence

f(g)µ(g)

0.275

0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e t

Position dans la sequence

f(t)µ(t)

N. Vergne Chaînes de Markov régulées

Page 47: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 4) 0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e a

Position dans la sequence

f(a)µ(a)

0.17

0.18

0.19

0.2

0.21

0.22

0.23

0.24

0.25

0 400000 800000

Dis

trib

utio

ns d

e c

Position dans la sequence

f(c)µ(c)

0.17

0.18

0.19

0.2

0.21

0.22

0.23

0.24

0.25

0 400000 800000

Dis

trib

utio

ns d

e g

Position dans la sequence

f(g)µ(g)

0.275

0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e t

Position dans la sequence

f(t)µ(t)

N. Vergne Chaînes de Markov régulées

Page 48: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 5) 0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e a

Position dans la sequence

f(a)µ(a)

0.17

0.18

0.19

0.2

0.21

0.22

0.23

0.24

0.25

0 400000 800000

Dis

trib

utio

ns d

e c

Position dans la sequence

f(c)µ(c)

0.16

0.17

0.18

0.19

0.2

0.21

0.22

0.23

0.24

0.25

0 400000 800000

Dis

trib

utio

ns d

e g

Position dans la sequence

f(g)µ(g)

0.275

0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e t

Position dans la sequence

f(t)µ(t)

N. Vergne Chaînes de Markov régulées

Page 49: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 6) 0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e a

Position dans la sequence

f(a)µ(a)

0.17

0.18

0.19

0.2

0.21

0.22

0.23

0.24

0.25

0 400000 800000

Dis

trib

utio

ns d

e c

Position dans la sequence

f(c)µ(c)

0.16

0.17

0.18

0.19

0.2

0.21

0.22

0.23

0.24

0.25

0 400000 800000

Dis

trib

utio

ns d

e g

Position dans la sequence

f(g)µ(g)

0.275

0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e t

Position dans la sequence

f(t)µ(t)

N. Vergne Chaînes de Markov régulées

Page 50: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 7) 0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e a

Position dans la sequence

f(a)µ(a)

0.17

0.18

0.19

0.2

0.21

0.22

0.23

0.24

0.25

0 400000 800000

Dis

trib

utio

ns d

e c

Position dans la sequence

f(c)µ(c)

0.17

0.18

0.19

0.2

0.21

0.22

0.23

0.24

0.25

0 400000 800000

Dis

trib

utio

ns d

e g

Position dans la sequence

f(g)µ(g)

0.275

0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e t

Position dans la sequence

f(t)µ(t)

N. Vergne Chaînes de Markov régulées

Page 51: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es / Lois stationnaires (degré 8) 0.275

0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e a

Position dans la sequence

f(a)µ(a)

0.17

0.18

0.19

0.2

0.21

0.22

0.23

0.24

0.25

0 400000 800000

Dis

trib

utio

ns d

e c

Position dans la sequence

f(c)µ(c)

0.17 0.18 0.19 0.2

0.21 0.22 0.23 0.24 0.25 0.26 0.27

0 400000 800000

Dis

trib

utio

ns d

e g

Position dans la sequence

f(g)µ(g)

0.275

0.28

0.285

0.29

0.295

0.3

0.305

0.31

0 400000 800000

Dis

trib

utio

ns d

e t

Position dans la sequence

f(t)µ(t)

N. Vergne Chaînes de Markov régulées

Page 52: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDérive polynomiale sur Chlamydia tra homatisDMM degré 1

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

DMM degré 2

0.14

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

DMM degré 3

0.14

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

DMM degré 4

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

N. Vergne Chaînes de Markov régulées

Page 53: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDérive polynomiale sur Chlamydia tra homatisDMM degré 5

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

DMM degré 6

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

DMM degré 7

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

DMM degré 8

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

N. Vergne Chaînes de Markov régulées

Page 54: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDérive par splines polynomiales sur Chlamydia tra homatisDMM degré 1

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

DMM degré 2

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

DMM degré 3

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

DMM degré 4

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

N. Vergne Chaînes de Markov régulées

Page 55: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDérive par splines polynomiales sur Chlamydia tra homatisDMM degré 5

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

DMM degré 6

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

DMM degré 7

0.14

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

DMM degré 8

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

N. Vergne Chaînes de Markov régulées

Page 56: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDérive polynomiale / Dérive par splines polynomialesRemarqueUne dérive par splines polynomiales de degré 4 ave 4 segments, fournit des ourbes semblables à une dérive de degré 8.Polynomiale degré 8

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

Splines degré 4

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0 400000 800000

Dis

trib

utio

ns d

e a,

c,g,

t

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

N. Vergne Chaînes de Markov régulées

Page 57: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDérive polynomiale / Dérive par splines polynomialesMéthodes retenuesDérive polynomiale : estimation point par pointDérive par splines polynomiales : estimation globalePolynomiale degré 8

0.38

0.42

0.46

0.5

0 9e+06 1.8e+07 2.7e+07

Dis

trib

utio

n de

gc

Position dans la sequence

f(gc)Poly

Spline degré 3

0.38

0.42

0.46

0.5

0 9e+06 1.8e+07 2.7e+07

Dis

trib

utio

n de

gc

Position dans la sequence

f(gc)Splines

N. Vergne Chaînes de Markov régulées

Page 58: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDérive polynomiale / Dérive par splines polynomialesAvantage des splinesLa dérive par splines polynomiales permet des os illations ohérentes ave lesfréquen es alors que la dérive polynomiale o�re un tra é plus lisse.Splines / Polynomiale 0.36

0.38

0.4

0.42

0.44

0.46

0.48

0.5

0.52

0 6e+06 1.2e+07 1.8e+07 2.4e+07 3e+07

Dis

trib

utio

n de

gc

Position dans la sequence

f(gc)Poly

Splines

N. Vergne Chaînes de Markov régulées

Page 59: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es des nu léotides 0.24

0.28

0.32

10000 20000 30000 40000

Fré

quen

ce d

e a

Position dans la séquence

f(a)

0.2

0.24

0.28

10000 20000 30000 40000

Fré

quen

ce d

e c

Position dans la séquence

f(c)

0.2

0.24

0.28

0.32

10000 20000 30000 40000

Fré

quen

ce d

e g

Position dans la séquence

f(g)

0.2

0.24

0.28

0.32

0.36

10000 20000 30000 40000

Fré

quen

ce d

e t

Position dans la séquence

f(t)

N. Vergne Chaînes de Markov régulées

Page 60: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es des nu léotides et Markov lassique 0.24

0.28

0.32

0 10000 20000 30000 40000

Fré

quen

ce d

e a

Position dans la séquence

f(a)mu(a)

0.2

0.24

0.28

0 10000 20000 30000 40000

Fré

quen

ce d

e c

Position dans la séquence

f(c)mu(c)

0.2

0.24

0.28

0.32

0 10000 20000 30000 40000

Fré

quen

ce d

e g

Position dans la séquence

f(g)mu(g)

0.2

0.24

0.28

0.32

0.36

0 10000 20000 30000 40000

Fré

quen

ce d

e t

Position dans la séquence

f(t)mu(t)

N. Vergne Chaînes de Markov régulées

Page 61: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es des nu léotides et Markov a hé 0.24

0.28

0.32

0 10000 20000 30000 40000

Fré

quen

ce d

e a

Position dans la séquence

f(a)mu(a)

0.2

0.24

0.28

0 10000 20000 30000 40000

Fré

quen

ce d

e c

Position dans la séquence

f(c)mu(c)

0.2

0.24

0.28

0.32

0 10000 20000 30000 40000

Fré

quen

ce d

e g

Position dans la séquence

f(g)mu(g)

0.2

0.24

0.28

0.32

0.36

0 10000 20000 30000 40000

Fré

quen

ce d

e t

Position dans la séquence

f(t)mu(t)

N. Vergne Chaînes de Markov régulées

Page 62: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsFréquen es des nu léotides et Markov régulé 0.24

0.28

0.32

0 10000 20000 30000 40000

Fré

quen

ce d

e a

Position dans la séquence

f(a)mu(a)

0.16

0.2

0.24

0.28

0 10000 20000 30000 40000

Fré

quen

ce d

e c

Position dans la séquence

f(c)mu(c)

0.2

0.24

0.28

0.32

0 10000 20000 30000 40000

Fré

quen

ce d

e g

Position dans la séquence

f(g)mu(g)

0.2

0.24

0.28

0.32

0.36

0 10000 20000 30000 40000

Fré

quen

ce d

e t

Position dans la séquence

f(t)mu(t)

N. Vergne Chaînes de Markov régulées

Page 63: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDistan es distributions / fréquen esDistan eddf =

X

v∈A

X

t∈P

(ft(v) − µt(v))2.Exemple sur le phage T4HMM à 3 états a hés : ddf = 5.873DMM de degré 3 : ddf = 5.865

N. Vergne Chaînes de Markov régulées

Page 64: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsDistan es distributions / fréquen esDistan eddf =

X

v∈A

X

t∈P

(ft(v) − µt(v))2.Exemple sur le phage T4HMM à 3 états a hés : ddf = 5.873DMM de degré 3 : ddf = 5.865DMM de degré 8 : ddf = 3.391Con lusionLes modèles régulés o�re une modélisation plus �exible, plus pro he de laréalité. N. Vergne Chaînes de Markov régulées

Page 65: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsLois stationnaires / HMMLimite des HMM

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0 5000 10000 15000 20000 25000 30000 35000 40000 45000 50000 0

1

2

Dis

trib

utio

ns

Eta

ts

Position dans la sequence

µ(a)µ(c)µ(g)µ(t)

segmentation HMM

N. Vergne Chaînes de Markov régulées

Page 66: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsChlamydia tra homatis : Origine de répli ation0

0 200000 400000 600000 800000 1e+06 1.2e+06

Cum

ulat

ive

GC

ske

w

Position dans la sequence

ORIGINE

TERMINUS

|||||||||||||||||||||||||||

||

Courbe ORILOCCourbe DMM

N. Vergne Chaînes de Markov régulées

Page 67: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsMots ex eptionnelsIdées basiquesMot sur-représenté : important pour la survie de l'organisme.Mot sous-représenté : nuit à l'organisme.Le ChiVirus

Complexe détruisant un virus Complexe commençant à détruirel’ADN de sa propre bactérie !

N. Vergne Chaînes de Markov régulées

Page 68: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsp-valeursDé�nitionS =

− log10 P(N > Nobs) si N ≥ E(N)+ log10 P(N < Nobs) si N < E(N)

.Le Chi de E. oli : g tggtgg Ordre Degré Espéran e S

1 0 70.10 240.8141 1 70.26 240.3981 2 71.88 238.7661 3 71.87 238.7741 8 71.94 238.6052 0 173.84 88.9022 1 174.03 88.7472 2 175.16 87.8372 3 175.10 87.8812 8 175.31 87.717N. Vergne Chaînes de Markov régulées

Page 69: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusion Lois stationnairesOrigine de répli ationMots ex eptionnelsChoix d'un modèleClassi� ation des mots de taille 5 dans le génome omplet du phage LambdaMM HMM 3 états DMM degré 1Mots Nobs E(N) S Mots Nobs E(N) S Mots Nobs E(N) Saattg 32 88.22 −11.41 aattg 32 83.38 −10.07 aattg 32 86.53 −10.94ttggg 20 65.12 −10.33 a ttg 13 47.59 −8.57 ttgga 21 64.94 −9.76ttgga 21 66.70 −10.29 t tag 2 24.60 −8.19 ttggg 20 62.94 −9.66a ttg 13 50.74 −9.59 ttgga 21 59.47 −8.15 a ttg 13 50.27 −9.44taggg 3 29.60 −9.21 t gag 9 39.01 −8.11 t gag 9 40.69 −8.68g gg 114 53.97 12.13 g tgg 127 65.44 14.23 g tgg 127 64.80 11.77 tgaa 124 61.02 12.16 tgaa 124 61.34 14.90 tgaa 124 60.85 12.21t gg 100 39.98 15.08 gga 112 44.00 20.58 t gg 100 38.81 16.18 gga 112 43.11 17.93 t gg 100 36.50 20.65 gga 112 43.57 18.10g aga 141 57.51 20.20 g aga 141 58.35 22.66 g aga 141 57.59 20.31Que hoisir ?Un modèle re�étant au mieux la réalité.N. Vergne Chaînes de Markov régulées

Page 70: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionCon lusion et perspe tivesPour on lure :De nouveaux modèles plus pro hes de la réalitéRe her he de mots ex eptionnelsModèles ave ovariables (pour entage en g , hydrophobi ité,...)Combinaison de modèles (Chaines de Markov régulées + Chaines deMarkov a hées)

N. Vergne Chaînes de Markov régulées

Page 71: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionPubli ations et logi ielsModèles de Markov régulésN. Vergne. Drifting Markov Models with Polynomial Drift and Appli ations to DNA Sequen es.Statisti al Appli ations in Geneti s and Mole ular Biology, 7(1),http://www.bepress. om/sagmb/vol7/iss1/art6/N. Vergne and G. Nuel. Pattern Statisti s a ording to Drifting Markov Models, in progress.N. Vergne and M. Termier. Drifting Markov Models with Polynomial Splines and Appli ations toDNA sequen es, in progress.Temps de retour et approximation de PoissonM. Abadi and N. Vergne. Sharp error terms for return time statisti s under mixing onditions,a epted in Journal of Theoreti al Probability.M. Abadi and N. Vergne. Sharp error terms for point-wise Poisson approximations under mixing onditions : A new Approa h, submitted in Nonlinearity.N. Vergne and M. Abadi. Poisson approximation for sear h of rare words in DNA sequen es,a epted in ALEA.Logi ielsPANOW (Poisson Approximation for the Number of O urren es of Words) :http://stat.genopole. nrs.fr/software/panowDRIMM (Drifting Markov Models) : http://stat.genopole. nrs.fr/software/drimmN. Vergne Chaînes de Markov régulées

Page 72: expose ctrachomatis cg - Raphaël Salemlmrs.math.cnrs.fr/Persopage/Vergne/fichiers/soutenance_these.pdfIntro duction Dérive p olynomiale Dérive pa r splines p olynomiales Applications

Introdu tionDérive polynomialeDérive par splines polynomialesAppli ationsCon lusionFinVoilà... C'est �ni.N. Vergne Chaînes de Markov régulées