Association mapping using local genealogies

Preview:

Citation preview

Association MappingThrough local genealogies

Bioinformatics Research Center

http://www.birc.au.dk/

Thomas Mailund

“Genetic” Diseases

Gunshot w

oundsC

ar accidents

Smoking induced

lung cancer

Cardiovascular

diseaseO

besityD

iabetes 2

Alzheim

erSchizophrenia

BRC

A1

breast cancer

Cystic fibrosis

Haem

ophilia

Disease Mapping...

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Locate disease-affecting polymorphism

Cases (affected)

Controls (unaffected)

Disease Mapping...

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Markers are locally correlated

Disease Mapping...

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Search for indirect signals

Indirect Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

“Tag” markers Unobserved marker

Indirect Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Indirect Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Indirect Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

Indirect Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

IndirectMulti-Marker

Association

--A--------C--------A----G---X----T---C---A------T--------G--------A----G---X----C---C---A------A--------G--------G----G---X----C---C---A------A--------C--------A----G---X----T---C---A------T--------C--------A----G---X----T---C---A------T--------C--------A----T---X----T---A---A----

--A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------A----G---X----T---C---G------T--------C--------A----T---X----T---C---A------A--------C--------A----G---X----T---C---A------A--------C--------G----T---X----C---A---A------A--------C--------A----G---X----C---C---G----

Cases (affected)

Controls (unaffected)

The Ancestral Recombination Graph

Hudson 1990, Griffith and Marjoram 1996

Local PhylogeniesFor each “point” on the chromosome, the ARGdetermines a (local) tree:

Local PhylogeniesFor each “point” on the chromosome, the ARGdetermines a (local) tree:

Local PhylogeniesFor each “point” on the chromosome, the ARGdetermines a (local) tree:

Local PhylogeniesFor each “point” on the chromosome, the ARGdetermines a (local) tree:

Clustering on a Tree

Disease affecting mutation

Clustering on a Tree

Complete penetrance

Incomplete penetrance

Spurious disease

Clustering on a Tree

60%

40%

25%

75%

Case/control clusteringis not random on the tree...

Using “Perfect Phylogenies”Use the four-gamete test to find regions thatcan be explained by a tree with no recurrent mutations

Mailund, Besenbacher & Schierup 2006

Using “Perfect Phylogenies”Build trees for each such region

Mailund, Besenbacher & Schierup 2006

Using “Perfect Phylogenies”Each marker splits a sub-tree in two

Mailund, Besenbacher & Schierup 2006

Using “Perfect Phylogenies”Each marker splits a sub-tree in two

Mailund, Besenbacher & Schierup 2006

Using “Perfect Phylogenies”Each marker splits a sub-tree in two

Mailund, Besenbacher & Schierup 2006

Scoring the Clustering

Red=casesGreen=controls

Are the case chromosomes significantly over-represented in some clusters?

Mutation

We can place “mutations” on the tree edges and partition chromosomes into “mutants” and “wild-types” and test for different distributions of cases and controls

Mutants

Wild-types

Mutation

Use average or maximum to score the tree

Average is kosher Bayesian stats; maximum needs to be corrected for over-fitting.

Mutants

Wild-types

Whole genome breast cancer

A single causal mutationMax BF / min p-value used as point estimate

Localisation Accuracy

Localisation Accuracy

Two causal mutationsMax BF / min p-value used as point estimate

Power to detect association

0.05 0.10 0.15

020

4060

8010

0

power

Susceptibility allelle frequency

Perc

enta

ge

QBlossocStudent's t−test

Blossoc(BLOck aSSOCiation)

Homepage: www.birc.au.dk/~mailund/Blossoc

Command line andgraphical user interface(with limited functionality)

Blossoc(BLOck aSSOCiation)

Homepage: www.birc.au.dk/~mailund/Blossoc

Fast enough to analysetens of thousands of individuals in hundred of thousands of markers in a few days on a desktop computer...

Thank you!

More information athttp://www.birc.au.dk/~mailund/association-mapping/