Alinhamento mltiplo de seq¼ncias - Portal rdemarco/FFI0760/alinhamento_   alinhamento

  • View
    214

  • Download
    0

Embed Size (px)

Text of Alinhamento mltiplo de seq¼ncias - Portal rdemarco/FFI0760/alinhamento_   alinhamento

  • alinhamento global-alinhamento mltiplo de seqncias

  • Alinhamento mltiplos de seqncias

    Qual a importncia de se realizar alinhamentos mltiplos em oposio a alinhamentos em pares?

  • Alinhamento mltiplos de seqncias

    Usos do alinhamento mltiplo de seqncias

    -Estabelecer relaes filogenticas entre diferentes protenas

    -Predizer domnios conservados, incluindo resduos crticos para a funo da protena

    -Comparar a protena de interesse de forma mais detalhada com membros da mesma famlia de protenas

  • Alinhamento mltiplo de seqncias

    Ao se alinhar 3 seqncias pode-se calcular o alinhamento timo atravs do dynamic programming, entretanto neste caso voc passa a ter que calcular uma matriz tridimensional. Caso mais seqncias fossem adicionada seria necessrio uma matriz N dimensional onde N o numero de seqncias alinhadas Isso cria um problema computacional pois o numero de comparaes a serem feitas ser o numero de aminocidos elevado ao numero de seqncias alinhadas

  • Alinhamento progressivo (Clustal)

    Com a finalidade de solucionar este problema um mtodo heurstico foi desenvolvido de modo a fazer um alinhamento progressivo de seqncias baseado na sua proximidade em uma arvore filogentica baseada em alinhamentos par a par

    Apesar deste tipo de mtodo gerar bons alinhamentos em tempo razovel, ele no garante que o melhor alinhamento possvel ser obtido

  • Alinhamento progressivo (Clustal)

    Figura mostra o principio do alinhamento progressivo. Alinhamentos so realizados seqencialmente baseado na arvore filogentica estimada criada a partir dos alinhamentos par a par realizados.

  • Alinhamento progressivo (Clustal)

    Ao realizar cada alinhamento so gerados pesos para cada seqncias dependendo da sua distancia em relao as outras seqncias do alinhamento. O objetivo deste procedimento evitar a criao de vieses gerados pela escolhas de muitas seqncias prximas em oposio a poucas seqncias divergentes.

  • Alinhamento progressivo (Clustal)

    Exemplo de calculo de escore em alinhamento progressivo a partir de dois pares de seqncias alinhadas. Note que cada seqncia possui um peso especifico mesmo j estando alinhada com uma outra seqncia. Escores de substituio ou identidade entre seqncias j alinhadas (Seq A e B, no exemplo acima) no so computados visto que o alinhamento entre A e B no vai mais variar.

  • Problemas do mtodo de alinhamento progressivo

    Este tipo de algoritmo altamente dependente da qualidade dos alinhamentos iniciais, visto que ao longo do processo eles no sero mais alterados

    Dificuldade maior quando mesmo as seqncias mais prximas so distantemente relacionadas

    Dificuldade em estabelecer parmetro timos de alinhamento

  • Uso de aproximao sucessiva para refinar alinhamentos

    Devido a limitaes impostas devido ao alinhamento progressivo foi implementado nas ultimas verses do clustal um algoritmo utilizando aproximao sucessiva (iteration) para minimizar este tipo de problema

    O algoritmo realiza aps cada alinhamento um procedimento no qual ele seleciona uma seqncia e realinha esta com o resto do alinhamento, caso o escore resultante for melhor que o inicial o novo alinhamento mantido. Isto e realizado sucessivamente com todas as seqncias do alinhamento.

  • ClustalX

    Seqncias em formato multi-fasta ou aln pode ser carregadas no clustalX atravs do comando load sequences

  • ClustalX

    Grfico com Indicao do grau de

    conservao

    Cada linha representa uma

    seqncia

  • Sistema de cores do clustal

    O fundo colorido do clustal tem duas funes: chamar a ateno de regies conservadas e para o carter dos aminocidos

  • Alinhando seqncias no clustalX

    Menu alignment permite acessar diversos comandos incluindo menus de ajuste de parmetros de alinhamentos

  • Alinhando seqncias no clustalX

    Clicando no item multiple aligment parameters possvel acessar um menu onde possivel ajustar os seguintes parametros

    Gap opening- Penalizao de escore para iniciar uma regio de gap

    Gap extension- Penalizao de escore para extender uma regio de gap (normalmente menor que o Gap opening)

    Delay divergent sequences- Atraso de alinhamento de seqncias divergentes que somente sero alinhadas aps as outras sequencias (porcentagem de identidade abaixo da qual que faz a seqncia seja considerada divergente)

  • Alinhando seqncias no clustalX Transition weight (somente DNA)- da a

    transies (AG, TC) um escore diferente de 0.

    Use negative matrix- permite o uso de matrizes negativas, importante quando as seqncias forem relacionadas somente em uma pequena poro. Em condies normais prejudica um pouco o alinhamento

    Protein Weight Matrix- Matriz de substituio a ser utilizada. Note que voce s escolhe a serie de matriz: Blosum, PAM, etc... , o tipo de matriz dentro desta serie (por exemplo Blosum 62, blosum 80) escolhido automaticamente pelo programa

  • Alinhando seqncias no clustalX

    Residue specific penalty- Considera a vizinhana de alguns resduos como mais ou menos favorveis para abertura de gaps

    Hydrophilic penalties- aumentqa a chance de gaps em regies ricas em resduos hidroflicos, que usualmente representam regies menos estruturadas.

    Hydrophilic residues- especifica que residuos so considerados hidrofilicos

    Gap separation distance- numero de resduos de distancia de uma regio com gap na qual penalizada uma nova abertura de gap

    Considera o gap no final da seqncia normalmente para o parmetro acima

  • Alinhando seqncias no clustalX

    Como realiza um alinhamento global o clustal tentar realizar o alinhamento de toda a protena no jogando fora pedaos como ocorre no caso de alinhamento por blast. Em adio no h a gerao de um parmetro de confiana que permita voc avaliar a significncia do seu alinhamento

    Deste modo o clustal uma ferramenta muito pobre para identificao de funo de protenas. O seu principal uso para uma caracterizao mais fina aps a determinao da identidade e domnios presentes na seqncia.

  • Alinhando seqncias no clustalX

    muito importante que haja uma seleo criteriosa de que seqncias e quais regies destas seqncia sero alinhadas

    Muitas vezes ao invs de selecionarmos protenas inteiras, que podem conter um mosaico de regies com diversas origens evolutivas, prefervel alinhar somente regies de domnios em comum

  • Alinhando seqncias no clustalX

    Alinhamento de mltiplas seqncias so bastante influenciados pelas penalizaes de abertura e extenso de gaps e ao fazer alinhamentos o usurio normalmente deve ajustar estes parmetros de modo a obter um bom alinhamento

    Para o alinhamento de seqncias mais divergentes necessrio a utilizao de penalizaes menores para a abertura de gaps

  • Alinhando seqncias no clustalX

    Devido aos problemas do algoritmo de alinhamento progressivo quando alinhamos seqncias distantes sempre recomendvel inserir no alinhamento mltiplo seqncias adicionais que sejam mais prximas das seqncias analisadas

    De modo geral , ter um numero razovel de seqncia ajuda o programa de alinhamento mltiplo e facilita a interpretao dos dados

  • Resultado de alinhamento ClustalX

    Smbolos indicam conservao

    de resduos ou grupos de

    resduos em uma coluna

  • Resultado de alinhamento ClustalX

    Low scoring segments- existe a opo de mostrar em cinza regies com baixo escore e que portanto no seriam muito confiveis

  • Visualizao do resultado de alinhamento ClustalX

    Exporta o alinhamento em formato postscript

  • Visualizao do resultado de alinhamento ClustalX

    Resultado de alinhamento em arquivo postscript

  • Visualizao do resultado de alinhamento ClustalX

    Box shade- ferramenta para visualizao de alinhamentos. Aceita formato aln (clustal). Pode exportar em formato rtf

    http://www.ch.embnet.org/software/BOX_form.html

  • Visualizao do resultado de alinhamento ClustalX