Transcript
Page 1: BITS - Comparative genomics: the Contra tool

ConTra v2: a tool to identify transcription factor binding 

sites across species, update 2011

Stefan Broos

Page 2: BITS - Comparative genomics: the Contra tool

Prediction of functional regulatory units in non­coding regions

● Look for consensus sequence in certain genomic regions

● Example TATA­Box consensus sequence TATA(T/A)A(A/T)(A/G)

● >chr1:23756967­23757090_hg18_1000_+TTAGTACTTAATGGAGACGGGTGTCATCATATACACAAGTGTTTAAAAATCGTTTATTATGCAAAATGTTAACTTTTATAAAAAGTTTAATATACATCGCATTGTTACAGAAAGTCAC

● Problem: does not take into account the nucleotide frequencies

Page 3: BITS - Comparative genomics: the Contra tool

Prediction of functional regulatory units in non­coding regions

● More advanced way to represent binding sites (and most popular way) is the positional weight matrix (PWM)

● 4xL matrix with L being the length of the binding site

● Each element of the matrix represents the frequency of a certain nucleotide (the 4 rows) at a given position of the binding site

Page 4: BITS - Comparative genomics: the Contra tool

Prediction of functional regulatory units in non­coding regions

● Example of the positional weight matrix of the TATA­Box:

A  [ 61  16 352   3 354 268 360 222 155  56  83  82  82  68  77 ]C  [145  46   0  10   0   0   3   2  44 135 147 127 118 107 101 ]G  [152  18   2   2   5   0  20  44 157 150 128 128 128 139 140 ]T  [ 31 309  35 374  30 121   6 121  33  48  31  52  61  75  71 ]

Page 5: BITS - Comparative genomics: the Contra tool

Prediction of functional regulatory units in non­coding regions

Page 6: BITS - Comparative genomics: the Contra tool

Prediction of functional regulatory units in non­coding regions

● PWMs provide a more natural way to represent and search for binding sites

● Problem: motifs tend to be short and degenerative. No positional dependencies are taken into account...

● Although this is the most popular method, most of the predicted sites are false positive predictions with no known real in vivo functionality (~ Futility theorem) 

Page 7: BITS - Comparative genomics: the Contra tool

Prediction of functional regulatory units in non­coding regions

● Solutions:– Use information of flanking sequences

– Use more complex models (biophysical models)

– Use sequence conservation across species (if a site is conserved across species, there is a higher probability the site is functional)

– ...

Page 8: BITS - Comparative genomics: the Contra tool

Prediction of functional regulatory units in non­coding regions

● Solutions:– Use information of flanking sequences

– Use more complex models (HMMs and biophysical models)

– Use sequence conservation across species (if a site is conserved across species, there is a higher probability the site is functional)

– ...

Page 9: BITS - Comparative genomics: the Contra tool

What is ConTra?● A tool to visualize predicted and conserved 

transcription factor binding sites in a region of interest

● A tool to explore the regulatory potential of a set of binding sites in a region of interest

● Focus on ease of use● Free access to the latests and most up­to­date 

versions of the TRANSFAC and JASPAR PWM libraries

Page 10: BITS - Comparative genomics: the Contra tool

What is ConTra?

Page 11: BITS - Comparative genomics: the Contra tool

First version of ConTra

● Published in 2008 by Hooghe, Hulpiau et al.

● Popular tool, cited 23 times

● Had some limitations

Page 12: BITS - Comparative genomics: the Contra tool

ConTra update

Page 13: BITS - Comparative genomics: the Contra tool

What is new?● Update of PWM libraries● More reference species were added

Page 14: BITS - Comparative genomics: the Contra tool

What is new?● Users are no longer restricted to the promoter 

region. One can search for binding sites in 5'­UTR, 3'­UTR, promoter and intron regions

● Users can upload their own matrices (it is as simple as uploading a multifasta file!)

● Users can upload a custom alignment● Non­coding genes are no longer excluded from 

the analysis

Page 15: BITS - Comparative genomics: the Contra tool

PWM libraries● TRANSFAC version 2010.04● Jaspar update 2010● Phylophacts 2010● All protein binding microarrays from Berger et 

al. Cell, 2008● These PWM libraries are used in combination 

with the match scan tool

Page 16: BITS - Comparative genomics: the Contra tool

Alignments in ConTra● Alignments generated using MULTIZ● Downloaded from UCSC genome browser

Page 17: BITS - Comparative genomics: the Contra tool

How does it work?● The analysis consists of a four step process

Step 1– Select type of analysis: visualization or 

exploration

– Select species 

– Select gene of interest using the gene name or symbol, Ensembl gene ID (ENSG), entrez gene ID, RefSeq (NM_|NR_) or Ensembl transcript ID (ENST)

Page 18: BITS - Comparative genomics: the Contra tool

How does it work?● The analysis consists of a four step process

Step 2– All possible matches with your search term are 

listed. Search term is highlighted

– Select 1 transcript of your gene of interest

Page 19: BITS - Comparative genomics: the Contra tool

How does it work?● The analysis consists of a four step process

Step 3– Select a genomic region of interest (promoter, 5'­

UTR, 3'­UTR, intronic regions)

Page 20: BITS - Comparative genomics: the Contra tool

How does it work?● The analysis consists of a four step process

Step 4– Select up to 20 PWMs from the TRANSFAC 

library, JASPAR library, phylophacts or PBM

– Select a cutoff (to minimize false positive predictions or to minimize false negative predictions)

– Run ConTra ...

Page 21: BITS - Comparative genomics: the Contra tool
Page 22: BITS - Comparative genomics: the Contra tool
Page 23: BITS - Comparative genomics: the Contra tool
Page 24: BITS - Comparative genomics: the Contra tool
Page 25: BITS - Comparative genomics: the Contra tool
Page 26: BITS - Comparative genomics: the Contra tool
Page 27: BITS - Comparative genomics: the Contra tool
Page 28: BITS - Comparative genomics: the Contra tool
Page 29: BITS - Comparative genomics: the Contra tool
Page 30: BITS - Comparative genomics: the Contra tool
Page 31: BITS - Comparative genomics: the Contra tool
Page 32: BITS - Comparative genomics: the Contra tool
Page 33: BITS - Comparative genomics: the Contra tool
Page 34: BITS - Comparative genomics: the Contra tool
Page 35: BITS - Comparative genomics: the Contra tool
Page 36: BITS - Comparative genomics: the Contra tool
Page 37: BITS - Comparative genomics: the Contra tool
Page 38: BITS - Comparative genomics: the Contra tool
Page 39: BITS - Comparative genomics: the Contra tool
Page 40: BITS - Comparative genomics: the Contra tool
Page 41: BITS - Comparative genomics: the Contra tool
Page 42: BITS - Comparative genomics: the Contra tool
Page 43: BITS - Comparative genomics: the Contra tool
Page 44: BITS - Comparative genomics: the Contra tool
Page 45: BITS - Comparative genomics: the Contra tool
Page 46: BITS - Comparative genomics: the Contra tool

Who should use it and where to find it?

● You!● To get an indication how your gene is regulated● To create publication ready graphics● To get a quick and easy visualization of some 

transcription factor binding sites● http://bioit.dmbr.ugent.be/contrav2/index.php

Page 47: BITS - Comparative genomics: the Contra tool

Questions & Examples● Analyse gene of interest● Explore gene of interest● Download and upload own alignment● Make your own PWM● Make beautiful publication graphics using 

ConTra and Jalview


Recommended