omicas

Embed Size (px)

Citation preview

  • 8/16/2019 omicas

    1/10

  • 8/16/2019 omicas

    2/10

    Biotecnologia Ciência & Desenvolvimento n.32 - janeiro/junho 2004 29

    (Collins et al, 2003; Pennisi, 2003a), onúmero exato de genes codificadospelo genoma é ainda desconhecido epodem ser necessários anos ainda atéque tenhamos uma contagem confiáv-el do número de genes no genomahumano.

    A razão para tanta incerteza é que

    as predições são derivadas a partir dediferentes métodos computacionais eprogramas de predição gênica. Algunsprogramas detectam genesprocurando por parâmetros diferentesque definem onde um gene começae termina (predição “ab initio ”).Outros programas procuram por genespela comparação de segmentos desequência com homologia com genese proteínas conhecidos (prediçãocomparativa). Enquanto a predição ab initio  tende a sobrestimar o número

    de genes pela contagem de qualquer segmento que pareça um gene, ométodo de predição comparativatende a subestimar este número, já queé limitado por reconhecer somente osgenes similares aos já conhecidos. Adefinição de gene é problemáticaporque pequenos genes podem ser difíceis de detectar, um gene podecodificar para vários produtosprotéicos, alguns genes codificam paraRNA, dois genes podem se sobrepor,

    e há muitas outras complicações(Pennisi, 2003b). Sendo assim,métodos computacionais por si só nãosão suficientes para gerar o númeroreal e o conhecimento de todos osgenes de um genoma eucarióticocomplexo; pelo menos com asinformações existentes atualmente.Até que se gere um conjunto de dadosbastante informativo para as prediçõescomparativas, essas precisarão ser verificadas por trabalho intensivo delaboratório antes de se chegar a umconsenso real.As últimas estimativas apartir de programas de predição

    gênica sugerem que no genomahumano devem existir 24500 oumenos genes que codificam paraproteínas (Pennisi, 2003c). Aestimativa do Ensembl (versão20.34c.1, de 08-02-2004) é de 23531genes, incluindo 1744 pseudogenes(http://www.ensembl.org/Homo_sapiens/ )

    (Stalker, 2004). Essa estimativa émuito menor do que aquelas dasanotações iniciais, que contavam maisde 70.000 genes (Write et al, 2001).Considerando que os genes nogenoma humano apresentam umtamanho médio de 3000 pares debases, menos de 2% do genomacodificam para proteínas. Assimmesmo, atualmente é desconhecidaa função de mais de 50% dos genesdescobertos.

    Observando a inesperada

    equidade relativa no número de genesde organismos bastante diferentes emtermos de complexidade (Quadro 1),sugere-se que o fator que determinaa complexidade de um organismo nãoestá no número de genes, mas emcomo as partes gênicas são usadaspara construir diferentes produtos emum processo chamado splicing alternativo. Outra razão para essamaior complexidade são as milharesde modificações químicas pós

    traducionais que ocorrem nas proteínase o repertório de mecanismos deregulação que controlam essesprocessos (Genomics and Its Impacton Science and Society: The HumanGenome Project and Beyond, 2003).A versão 34.00 do banco de dadosRESID (http://pir.georgetown.edu/pirwww/dbinfo/resid.html) (Garavelli,2003) apresenta 339 modificaçõespós ou co-traducionais conhecidas emproteínas, modificações essas que nãopodem ser evidenciadas diretamentea partir da seqüência gênica.

    Informação versus ação

    Em qualquer sistema biológico, seum trabalho é realizado, quase sem-pre a molécula responsável por essaação é uma proteína. A vida dependede milhares de proteínas diferentes,cujas estruturas são ajustadas para quemoléculas individuais de proteínascombinem, numa precisão impressio-

    nante, com outras moléculas. Reaçõesquímicas na célula dependem da com-binação de enzimas com substratos eessas são geralmente controladas por outras moléculas combinando com sí-tios específicos da proteína. Estrutur-as como os músculos dependem dainteração proteína-proteína, o controleda expressão gênica depende dacombinação proteína-DNA, o controlehormonal depende da interação dohormônio com receptores protéicos,o transporte através da membrana

    envolve interações soluto-proteína,proteções imunes requerem a inter-ação antígeno-anticorpo, atividadesneuronais requerem a interação sub-stância transmissora-proteína. Estessão apenas alguns exemplos douniverso quase infindável de inter-ações específicas em que as proteí-nas são envolvidas. Todas essas inter-ações dependem do reconhecimentoexato de estruturas específicas nasmoléculas das proteínas envolvidas

    (Goodsell, 1991). Neste contexto,bancos de dados como o LIGAND(http://www.genome.ad.jp/ligand/)(Goto, 2002) possibilitam visualizar cada uma entre o universo de reaçõesquímicas conhecidas envolvendo ainteração de enzimas com metabóli-tos e outros compostos. Interaçõesproteína-proteína, proteína-DNA eproteína-RNA podem ser encontradasem bancos de dados como BIND – Biomolecular Interaction Network 

    database  (http://www.bind.ca/) (Bad-er et al, 2003), DIP – Database of In- teracting Proteins  (http://dip.doe-

    Organismo Tamanho do Genoma (pares de bases) N°Estimado de Genes

    Homem (Homo sapiens ) 3 bilhões 30.000Rato (M. musculus ) 2,6 bilhões 30.000Mostarda (A. thaliana ) 100 milhões 25.000Roundworm (C. elegans ) 97 milhões 19.000Mosca das frutas (D. melanogaster ) 137 milhões 13.000Levedura (S. cerevisiae ) 12,1 milhões 6.000Bactéria (E. coli ) 4,6 milhões 3.200

    Virus da AIDS (HIV) 9700 9

    Quadro 1 – Tamanho do genoma e número estimado de genes de diferentes organismos.

  • 8/16/2019 omicas

    3/10

    30 Biotecnologia Ciência & Desenvolvimento n.32 - janeiro/junho 2004 

    Fig.5: Fruto de mamão(Carica papaya L. cv tainung1) mostrando aspectos e

    quantidade de sementes por fruto

    mbi.ucla.edu/) (Salwinski et al, 2004)e MINT – Molecular INTeractions (http://cbm.bio.uniroma2.it/mint/)(Zanzoni, et al, 2002). Informaçõessobre interação antígeno-anticorpo sãodisponíveis no IMGT – InternationalImmunogenetics Database(imgt.cines.fr) (Lefranc, 2004).

    Cada vez mais se torna evidenteque a aplicação de dados de seqüên-cias de DNA, utilizando informaçõessobre a relação entre a seqüência deDNA do gene e a função protéica, nãosustenta a atribuição infalível de funçãopara as proteínas. Muitas evidênciasmostram a fragilidade das con-statações feitas puramente a partir deseqüências genômicas, sugerindo que(i) embora a seqüência genômica pos-sa ser usada para predizer “open read-ing frames” (ORFs), tais predições são

    ainda muito grosseiras e passíveis deerro, principalmente em eucariotos.(ii) O processamento do mRNA temuma influência importante no produ-to final da expressão gênica; o pro-teoma. É o caso do splicing alternati-vo, em que, pela montagem de difer-entes combinações de exons, um pré-mRNA dá origem a dois ou mais mR-NAs diferentes, que codificam paraprodutos protéicos diferentes. Comoresultado, as modificações advindas do

    processamento do mRNA permitemque seja produzida uma variedade deproteínas superior ao número de genesdo genoma. (iii) Existe uma enormediversidade de modificações pós-tra-ducionais que uma proteína pode so-frer, influenciando a sua função, loca-lização celular e atividade. A infor-mação da seqüência de DNA ainda nãodá um discernimento claro sobre mod-ificações pós-traducionais a que cadaproduto protéico está sujeito, sendodifícil, se não impossível, estabelecer um número de proteínas produtosque cada gene codifica. (iv) Os mecan-ismos de controle da expressão gêni-ca envolvem uma rede complexa evariável de interações moleculares,cujo entendimento é ainda bastanterudimentar. Esses mecanismos não sãoprontamente evidentes a partir doconhecimento da seqüência de DNAdo genoma, havendo ainda grandeslimitações em se utilizar a informaçãoda seqüência de DNA com o intuito

    de conhecer o conteúdo e a dimani-

    cidade das proteínas codificadas por um determinado genoma.

    Fotografia versus filme

    Certos grupos de proteínas inter-agem entre si para realizar determi-nados trabalhos celulares. Um exem-

    plo bem típico são as proteínas orga-nizadas em vias metabólicas como aglicólise, o ciclo de Krebs, e outras,em que os produtos gênicos chama-dos enzimas precisam trabalhar emharmonia. Outro exemplo bem con-hecido é o caso das proteínas estru-turais que devem estar juntas e orga-nizadas precisamente para exercer asua função, como exemplo, os com-ponentes de uma unidade ribossom-al, as histoproteínas que são essenci-ais para manter a estrutura da croma-

    tina etc. Desse modo, em estudos deexpressão gênica é habitual assumir que grupos de genes cujos modelosde expressão são similares entre si,sejam provavelmente funcionalmenterelacionados.

    Um problema com as técnicas deagrupamento de dados de expressãogênica (ESTs, SAGE, Microarrays), noentanto, é que elas são baseadas nasuposição de que os genes que apre-sentam modelos de expressão simi-

    lares são de fato relacionados funcio-nalmente, isto é, eles têm funções quesão relacionadas. Essa interpretaçãogeralmente leva a erros na tentativade entender a relação real entre osgenes [através dos seus produtos].

    Existem razões para pôr em dúvi-da essa suposição: primeiro, ainda émuito inconsistente o conhecimentode quão discretamente trabalham osgrupamentos funcionais de genes namaquinaria celular. Pode ser queprodutos gênicos individuais tenhamtantos papéis diferentes em diferentescircunstâncias, que vários deles par-ticipem de papéis essenciais em maisde uma função. Por exemplo, os pro-cessos de defesa contra estresses bióti-cos (originados do ataque de agentespatogênicos), ou estresses ambientais,podem ser extremamente complex-os e envolverem diferentes mecanis-mos atuando em conjunto. Segundo,o termo “relacionados funcional-mente” é por si só mal especificado.

    Se o modelo de expressão de um

    gene é similar ao de um outro gene,isso pode significar vários tipos de re-lacionamento, desde “dois genes ten-do produtos que interagem fisica-mente”, “um gene que codifica paraum fator de transcrição para outrogene”, “dois genes ambos com se-qüências promotoras ligadas por re-

    pressores que são liberados quandoum receptor nuclear é ativado, mes-mo que os dois genes tenham funçõesmuito distantes”. É claro que existe umnível de abstração no qual todos osgenes são funcionalmente relaciona-dos no trabalho de manter a célula vivae produzindo todos os componentesnecessários para o organismo como umtodo. Mas abaixo desse nível de ab-stração existem muitos alternativos,pela sua natureza, favorecendo adefinição de agrupamento. Portanto,

    é perfeitamente questionável a atri-buição indistinta de que similaridadeem expressão corresponde à similar-idade em função.

    Além disso, o que constitui real-mente um modelo de expressão si-milar é ainda pouco preciso, ou pelomenos existem múltiplas definiçõesalternativas. Por exemplo, similaridadepoderia significar ter um modelo demudança similar ao longo do tempo.Pode significar também níveis absolu-

    tos de expressão a qualquer dadomomento, ou pode significar a per-feita oposição, mas bem coreografa-da no modelo de expressão. Pensan-do em métodos comparativos, qualmedida de discrepância exatamenteescolhida para medir os modelos deexpressão influenciará o tipo de agru-pamento funcional esperado. Méto-dos confiáveis e exeqüíveis em esca-la genômica para medição absoluta daexpressão gênica precisam ainda ser desenvolvidos.

    Corretamente interpretados ounão, dados de expressão gênica vêmsendo acumulados em volume e var-iedade cada vez maior. Um ensaio iso-lado de hibridação com DNA Microar- rays , por exemplo, fornece na me-lhor das hipóteses uma visão estáticado nível de expressão comparativo en-tre os genes amostrados. Seria comoa fotografia do evento. Mas dificil-mente uma fotografia consegue mos-trar todo o panorama. Uma nova fo-

    tografia, tomada de um outro ângulo,

  • 8/16/2019 omicas

    4/10

    Biotecnologia Ciência & Desenvolvimento n.32 - janeiro/junho 2004 31

    Fig.6: Germinação de sementes de mamão sob condições in vitro , apóster-se retirado a sarcotesta e realizado sua assepsia

    pode mostrar nuances que não havi-am sido captadas anteriormente, eassim por diante. Conhecer asmudanças é diferente de percorrer ocaminho que leva aos estados difer-enciados. Por exemplo, entender atrajetória da ocorrência de vários RNAsmensageiros em vez de conhecer 

    apenas valores absolutos ou compar-ativos em um dado momento, pro-porciona muito mais informação so-bre a operacionalidade do sistema.

    A vida é essencialmente dinâmi-ca. Apenas o filme, isto é, a análisedinâmica do sistema, pode dar supor-te para o entendimento completo dosprocessos biológicos. E aí está ogrande desafio da bioinformática. Aintegração comparativa dos dadosprecisa ser realizada in silico , trans-formando o conjunto de imagens es-

    táticas no filme da vida.

     As ômicas

    Antes da era da bioinformática,somente duas maneiras de fazer ex-perimentação em biologia eram dis-poníveis: utilizando um organismo vivo(também chamado in vivo  ) ou emum sistema artificial (também chama-

    do in vitro  ). Seguindo essa analogia,podemos dizer que a bioinformáticaé de fato a biologia in silico . A bioin-formática veio para facilitar o uso decomputadores no sentido de organizar e analisar integradamente uma mon-tanha de dados complexos e variados,possibilitando enfrentar o desafio dedecifrar componentes importantesdentro de um universo crescente deinformações. Isso somado ao desen-volvimento de equipamentos podero-sos para a miniaturização e automação

    da aquisição de dados biológicos em

    A genômica se caracteriza pelo estudo dos genes e suas funções. A sua chegada, com o projeto genoma humanono final da década de 1980, alavancou toda a revolução atual no campo da biologia. Muitas expectativas e investimentostêm sido empregadas na genômica, visando aplicações nas áreas da indústria farmacêutica, agricultura, produção deenergia e proteção do meio ambiente. Mas a determinação da seqüência completa de vários genomas não é o final dahistória. É apenas o começo, principalmente pelo fato de que mecanismos biológicos não podem ser inferidos simplesmentea partir do conhecimento da seqüência sem o auxílio de outras estratégias de estudo, as ômicas em geral.

    Genômica comparativa. Esse novo ramo da genômica, que vem se tornando cada vez mais comum dada aquantidade de seqüências de genomas sendo produzidas, tem o objetivo de comparar todo o conteúdo de DNA dogenoma de um organismo particular com outros genomas já conhecidos. Através dessa análise pode ser possível

    identificar diferenças, tanto no conteúdo gênico quanto não-gênico, que podem ser responsáveis por importantespropriedades fenotípicas ou evolutivas, como patogenicidade, reações a condições ambientais adversas, proximidadetaxonômica entre grupos e até mesmo a aquisição (ou manifestação?) de determinados comportamentos individuais.

    larga escala, deu campo para o surgi-mento de uma lista de novos termos,que não pára de crescer. Estamos en-trando na era das ômicas (Pals-son,2002). Com centenas de milharesde proteínas para identificar, correla-cionar e entender, por exemplo, nãoé suficiente estudar um gene, um

    produto gênico ou um processo decada vez. Por outro lado, estudar emlarga escala um conjunto de molécu-las com o objetivo de entender mecan-ismos celulares, dificilmente podemresponder questões interessantes sema assistência da informação gerada pelapesquisa tradicional dirigida por hipó-teses. Por isso, os dois tipos de ciên-cia atualmente disponíveis, as ômicase as pesquisas dirigidas por hipóteses(Weinstein, 2001), são sinérgicas edevem ser utilizadas de modo a se

    complementarem.

    O produto inicial da expressão gênica em um organismo é conhecido como transcriptoma e se caracteriza por uma coleção de moléculas de RNA mensageiro cuja informação biológica é requerida pela célula em um determinadomomento. Essas moléculas de mRNA são sintetizadas a partir de genes que codificam proteínas e, assim, direcionam asíntese do produto final da expressão gênica, o proteoma, que especifica a natureza das reações bioquímicas que acélula está apta a realizar. Um ponto importante a notar é que o transcriptoma nunca é sintetizado de novo , isto é, nãocomeça do zero. Cada célula recebe parte de seu transcriptoma materno quando é formada pela divisão celular, edepois é responsável pela manutenção e adaptação do transcriptoma conforme os diferentes estágios de sua vida e otipo de diferenciação tomado.

    Como regra geral, RNAs mensageiros bacterianos têm meias-vidas de não mais de poucos minutos e em eucari-otos a maioria dos mRNAs são degradados poucas horas após a sua síntese. O “turnover” rápido significa que a com-posição do transcriptoma não é fixa e pode ser rapidamente reestruturada pela mudança no nível de síntese de mRNAsespecíficos. Assim, a transcrição não resulta na síntese do transcriptoma, mas apenas o mantém pela reposição demRNAs que foram degradados, e promove mudanças na composição do transcriptoma ligando ou desligando os difer-entes genes ou conjuntos de genes.

    Avanços tecnológicos baseados na PCR, intenso sequenciamento de cDNA e síntese de novo  de ácidos nucléicos,têm contribuído para o desenvolvimento de técnicas de quantificação de mRNA em larga escala, em muitos casos emescala genômica, possibilitando que centenas ou milhares de genes sejam estudados em paralelo em vez de um genede cada vez. Métodos como Differential Display   (DD), Serial Analysis of Gene Expression  (SAGE) e DNA array hibridization  ou DNA microarray , todos trouxeram benefícios significativos em relação ao Northern blotting  emtermos de sensibilidade e número de ensaios. Entre essas tecnologias, a que vem ganhando preferência para estudar a

    composição de um transcriptoma, e fazer comparações entre diferentes transcriptomas, é a técnica de DNA microarray ,

    Transcriptômica (ou genômica funcional)

    Genômica 

  • 8/16/2019 omicas

    5/10

    32 Biotecnologia Ciência & Desenvolvimento n.32 - janeiro/junho 2004 

    que se baseia na hibridação em paralelo de ácidos nucléicos. Experimentos de expressão gênica com DNA microarrays vêm sendo largamente utilizados para explorar o modelo de expressão simultânea e em paralelo de milhares de genes.Isso requer ferramentas poderosas de correlação computacional.

    Um DNA microarray  consiste de uma coleção de sequências parciais de genes (normalmente cDNAs) que sãoespotados individualmente em locais específicos de uma lâmina. Essas sequências geralmente variam de 500 a 4000bases (idealmente 500 a 2000 bases) e podem ser escolhidas a partir de diferentes regiões do gene dependendo doobjetivo do projeto. Uma variação da técnica, chamada DNA chip, é baseada na deposição ou síntese in situ deoligonucleotídeos para a geração de alvos. Esses chips contêm oligômeros curtos variando de 25 a 80 bases comoseqüências-alvo. Enquanto essas sequências curtas podem conferir alta sensibilidade, elas podem apresentar baixaespecificidade de ligação comparada com DNA microarrays , uma vez que as seqüências são curtas e usualmente nãorepresentam genes conhecidos.

    O uso de DNA microarrays para o estudo do modelo de expressão gênica baseia-se em dois princípios. Primeiro,considera-se que cada gene é expresso ou não e as diferenças no seu nível de expressão em uma célula ou tecido, emdeterminado momento, são um reflexo de quais mRNAs estão presentes e a sua abundância, e; segundo, as fitas deDNA podem hibridar-se com seqüências complementares formando uma molécula estável em fita dupla.

    Tipicamente, a primeira face dos dados experimentais de DNA microarrays  é uma lista de genes/sequências ounúmeros de identificação e o seu perfil de expressão. Modelos de correlação dentro do conjunto massivo de dados depontos não são óbvios por uma inspeção visual. Diferentes algoritmos de agrupamento computacional precisam ser usados simultaneamente para reduzir a complexidade dos dados e para encurtar a relação entre genes de acordo como seu nível de expressão ou mudanças nos níveis de expressão. Problemas relacionados com as técnicas de agrupamen-to são considerados na seção anterior.

    Uma das maiores vantagens da utilização da técnica de DNA microarray , comparando-a com outros métodos, éa facilidade da análise simultânea e em paralelo de um grande número de genes e de um grande número de amostras.Deve ser notado, entretanto, que todas essas técnicas usadas para a quantificação de mRNA proporcionam um nível deinformação empírica e não uma condição estável absoluta. Além disso, sabe-se que a detecção de uma diferença naabundância de um mRNA específico entre duas amostras biológicas não é necessariamente refletida por uma diferençaquantitativa equivalente no nível de abundância da proteína, o que muitas vezes está implícito nos estudos.

    Existem, portanto, limitações intrínsecas da técnica, entre as quais (i) a abundância do mRNA nem sempre é bemcorrelacionada com a abundância da proteína, (ii) a sensibilidade e variação dinâmica dos métodos existentes são taisque os mRNAs menos abundantes, potencialmente codificando as proteínas regulatórias mais importantes, não sãofacilmente medidos como acontece com os mRNAs mais abundantes, e (iii) a atividade das proteínas codificadas pelosmRNAs é regulada a vários níveis após a sua expressão. Por exemplo, a localização subcelular e/ou a extensão em queas proteínas são pós-traducionalmente modificadas, não são reveladas pela medição da abundancia do mRNA.

    Para entender a função de todos os genes em um organismo, é necessário conhecer não só quais genes sãoexpressos, quando e onde, mas também quais são os produtos da expressão e em que condições esses produtos(proteínas) são sintetizados em certos tecidos. A proteômica tenta descrever o conjunto completo de proteínas produtoda expressão do genoma (James, 1997), e fornece informações importantes para complementar os estudos de tran-scriptômica e metabolômica.

    Os organismos podem sintetizar muitos milhares de proteínas ao mesmo tempo, e a diversidade potencial detipos de proteínas no proteoma certamente excede o número estimado de genes no genoma. Isso ocorre porque osprodutos de um gene podem diferir devido a splicing  alternativo e uma variedade de modificações pós-traducionaispossíveis, como apresentado acima. O crescente interesse no campo da proteômica vem concentrando esfor ços paraacelerar o desenvolvimento e implementação de estratégias mais apropriadas para a análise de expressão e função deproteínas em escala genômica.

    Esse interesse tem ocorrido, em parte substancial, devido ao sucesso dos projetos de sequenciamentos genômi-cos, considerando que a realização bem sucedida desses projetos tem resultado em uma apreciação mais extensa deque, por si só, eles revelam menos do que se esperava sobre a biologia do organismo. Os dados de sequênciasgenômicas proporcionam uma plataforma essencial para um conhecimento mais amplo das estratégias experimentaiscomplementares que darão suporte à caracterização dos genes contidos nos genomas. A utilização integrada dessasferramentas possibilitará o entendimento de como os produtos desses genes atuam conjuntamente para regular asatividades do organismo.

    A proteômica depende da extração, separação, visualização, identificação e quantificação das proteínas presentesem um organismo ou tecido, em um determinado momento. Todos esses estágios têm limitações. Portanto, atualmente,é impossível descrever o proteoma completo de um organismo.

    Atualmente, o ponto de partida para muitas tentativas na investigação das mudanças na expressão protéicaenvolve a resolução das proteínas de uma mistura complexa por eletroforese 2-D e a sua subsequente identificação

    usando métodos analíticos cada vez mais precisos e poderosos. Eletroforese 2-D, complementada com HPLC, permite

    Proteômica 

  • 8/16/2019 omicas

    6/10

    Biotecnologia Ciência & Desenvolvimento n.32 - janeiro/junho 2004 33

    separar e purificar vários milhares de proteínas extraídas de um tecido ou células, em um determinado momento oucondição. Embora a eletroforese 2-D apresente significantes limitações, parece ser o melhor método até o momentopara resolver um grande número de proteínas de uma mistura, ao mesmo tempo em que permite acessar as mudançasno nível de expressão e a purificação de proteínas chave para subsequente caracterização.

    Avanços relativamente recentes na caracterização de proteínas têm surgido da automatização de métodos comomatrix-assisted laser desortion-ionization  (MALDI) e eletrospray ionization  (ESI) mass spectrocopy  (MS) para seobter o fingerprinting de massa e sequenciamento de peptídeos.

    A metabolômica é uma área da genômica funcional que estuda as mudanças na expressão de pequenas moléculasorgânicas, conhecidas como metabólitos, em sistemas biológicos. Ela promete complementar a genômica por permitir avaliações objetivas do fenótipo (Weckwerth, et al, 2004).

    Grande importância vem sendo dada para a combinação de dados de metabolômica com dados de expressãogênica e proteômica. A metabolômica ajudará na revelação de como os genótipos são associados com os fenótipos efazer simulações de mecanismos celulares em larga escala. Em uma escala maior, o fenomenoma  (Schilling et al, 1999;Palsson, 2000) ajudará a materializar métodos de análise com a melhor tecnologia para estudos [e interpretações] dometaboloma.

    O fenomenoma requer uma organização de descobertas biológicas, quantificando e identificando todos osmetabólitos em um complexo de amostras biológicas, rápida e simultaneamente. Isso deve ser obtido sem qualquer seleção a priori dos metabólitos de interesse, para evitar tendenciosidades. Softwares de bioinformática são necessáriospara organizar e facilitar a visualização dos dados de modo a auxiliar na sua interpretação (Steuer et al, 2003; Covert et

    al, 2004). Os softwares devem combinar dados obtidos por DNA microarrays , proteômica e metabolômica numamesma visualização.Essa tecnologia permitirá, em última instância, a integração e correlação das mudanças globais no metabolismo e

    expressão gênica. Uma análise quantitativa de todos os metabólitos em uma célula pode ajudar no entendimento deproblemas como, por exemplo, os efeitos pleiotrópicos, em que um único gene determina um número de característicasnão relacionadas. Problemas assim podem ser mais bem entendidos se uma alteração detectada no conteúdo de ummetabólito, utilizado em vias metabólicas diferentes, estiver relacionado com uma mutação no gene ou a sua sobre-expressão ou inibição.

    O Quadro 2 mostra a evoluçãodas principais novas áreas da pesquisabiológica no últimos anos, baseada nonúmero de ocorrências de termos re-

    lacionados na literatura científica.Além dessas, uma variedade deômicas vem surgindo e uma sobre-posição de propósito é inevitável.Entre outras tantas, a farmaco-genômica  (Marshall, 1997) visa en-tender a interação da constutuiçãogenética de um indivíduo com a res-posta a drogas.

    A fisiômica  (Sanford et al, 2002)se dedica a fazer uma descrição quan-titativa das funções fisiológicas de umorganismo intacto. É necessário pre-di- zer o fenótipo a partir do genóti-po, mas isso é difícil por causa das in-

    fluências do ambiente e as circunstân-cias do crescimento, desenvolvimen-to e doenças. O objetivo é obter oum discernimento de toda a fisiologia

    de um organismo, incluindo as viasmetabólicas e todas as moléculas esuas interações, que fazem o organis-mo completo. Uma das primeiras ini-ciativas nesse campo é o Projeto Fisi-oma (http://physiome.org/), cujoprincipal objetivo é entender o organ-ismo humano, descrevendo quantita-tivamente a sua fisiologia e patofisio-logia, utilizando inclusive informaçõesprovenientes dos fisiomas de outrosorganismos, para melhorar a saúdehumana (Bassingthwaighte, 2000).

    A regulômica  (Werner, 2004) éo estudo das instruções bioquímicas

    da rede de interação gênica que con-trola os mecanismos de regulação daexpressão dos genes para fazer todosos tipos de célula necessários para

    construir organismos completos (Kon-dro, 2004; Gao et al 2004; Roven &Bussemaker, 2004).

    A peptidômica  se dedica a estu-dar peptídeos pequenos (0,5 a 15kDa), como hormônios, citoquinas,fatores de crescimento, venenos, toxi-nas, peptídeos antimicrobianos etc.Essas moléculas têm papel fundamen-tal em muitos processos biológicos(Schulz-Knappe et al, 2001; Prates &Bloch, 2002).

    A degradômica  é a aplicação dedados gerados pela genômica e pro-teômica para identificar as proteases

    Palavra chave 1988 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 Abril2004“Genomics”    3 12 23 38 52 64 90 130 208 386 678 1263 2081 3104 4199 4660

    “Comparative genomics”   — — — — — — 4 8 18 37 69 126 192 291 427 503

    “Functional genomics”    — — — — — — — — 10 46 131 277 480 736 1016 1127“Transcriptomics”    — — — — — — — — — — 1 3 7 23 41 63

    “Proteomics”    — — — — — — — — 1 20 67 277 631 1254 2022 2444

    “Pharmacogenomics”    — — — — — — — — 1 11 37 136 249 472 702 795

    “Metabolomics”    — — — — — — — — — — — 2 7 28 59 81“Peptidomics”    — — — — — — — — — — — — 5 8 18 23

    “Bioinformatics”    — — — — 3 12 20 44 78 144 230 420 657 1058 1604 1852

    Quadro 2 – Número de ocorrências de referências no PubMed (http://www.ncbi.nlm.nih/) em algumas novas áreas da pesquisabiológica, desde 1998. Busca limitada para os campos Título e Abstract.

    Metabolômica 

  • 8/16/2019 omicas

    7/10

    34 Biotecnologia Ciência & Desenvolvimento n.32 - janeiro/junho 2004 

    PESQUISA

    e os seus substratos em escala genômi-ca, para descobrir novos papéis paraproteases in vivo. O objetivo é facili-tar a identificação de novos alvos parao desenvolvimento de fármacos visan-do o tratamento de doenças (Lopez-Otin & Overall, 2002).

    A epigenômica  busca esclarec-

    er como o genoma funciona como umtodo. Ela combina a genética com oambiente para buscar uma compreen-são dos sistemas biológicos complex-os como a plasticidade do genoma.Embora todas as células nucleadas deum organismo levem o mesmogenoma, elas expressam diferentesgenes em diferentes momentos econdições. Esses mecanismos de reg-ulação da expressão gênica são com-plexos, e um dos principais fatoresenvolvidos são as mudanças epi-

    genéticas resultantes da metilaçãodiferencial do genoma. Daí, diz-se queresultam diferentes epigenomas. Al-guns estudos têm demonstrado o en-volvimento da metilação do DNA numprocesso chamado imprinting genômico, que controla a expressãode alguns genes em mamíferos, po-dendo ter efeito no surgimento dedoenças, especialmente o câncer.Novik et al (2002) apresenta uma re-visão sobre o assunto.

    A toxicogenômica  (Kramer &Kolaja, 2002 e Guerreiro et al, 2003)marca um novo paradigma no desen-volvimento de drogas e análise derisco, que promete gerar uma enormequantidade de informação na direçãode aumentar o entendimento domecanismo molecular que leva à tox-icidade da droga e eficiência. É espe-rado que a toxigenômica seja mais emais integrada com todas as fases doprocesso de desenvolvimento de dro-gas, particularmente na toxicologiamecanística e preditiva, e descobri-mento de biomarcadores, buscandoidentificar polimorfismos no DNA rel-acionados com a suscetibilidade indi-vidual à toxicidade em relação a umadeterminada droga. O objetivo é aseleção de candidatos no sentido deajudar a desenvolver e utilizar drogasque produzam menor toxicidade.

     Antes e depois da genômica:a velha e a nova biologia 

    Depois do descobrimento dadupla fita de DNA, do código genéti-co, enzimas de restrição, PCR e tan-tos avanços na biologia molecular du-rante a segunda metade do séculopassado, na última década experien-ciamos uma nova revolução no cam-po da biologia com a era da genômi-

    ca, e com ela muitas outras ômicas,como apresentado acima. Nesse con-texto, muitas perguntas surgiram epermanecem ainda sem respostassatisfatórias, como: quais os impac-tos da genômica nos projetos depesquisa nas diversas áreas das ciên-cias biológicas? o método científico

    ainda é relevante? a bioinformática éuma disciplina separada? como pode

    ser melhorada a comunicação entreas culturas científicas atuais e a tec-nologia da informação (IT) para solu-cionar a necessidade da integraçãodos dados disponíveis, que apresen-tam-se em fontes e formatos tão vari-ados? perguntas como essas sãochaves para as ações futuras nas bio-ciências.

    Fazendo um paralelo entre avelha biologia e a situação atual, po-demos notar que o predomínio depesquisadores mais ou menos inde-pendentes e profundamente espe-cializados em um domínio estreita-mente focado, não é adequado paraa nova ciência cada vez mais integra-da e ampla. Os estudos voltados paraum gene ou uma função de cada vezdão lugar para a análise quantitativade centenas de milhares de genes, enão mais focalizando apenas uma es-pécie, mas com uma abordagem deintegração comparativa de dados in-terespecíficos. Os grandes investi-

    mentos voltados para enfoques

    científicos muitas vezes poucoabrangentes e hipóteses dirigidas pelapesquisa são substituídos pela au-tomação e miniaturização, reduzindoo custo e aumentando a velocidadeda coleta de dados. A necessidade dabusca de ferramentas computacionaisbásicas e somente para analisar con-

    juntos de dados é suplantada pela rá-pida disponibilidade de bancos de da-dos, grandes demais para um pes-quisador conseguir analisar os dadossozinho. E, assim, onde estão as hipó-teses? poderíamos caracterizar essarevolução como uma grande expe-dição para o acabamento da ciênciada vida? quais são os impactos para asociedade?

    Embora se tenha observado umagrande mudança no tipo e quantidadede dados obtidos, e a validade do

    método científico ser colocado emxeque, o plano clássico no curso daciência continua sendo válido. Os da-dos geram informação, que gera no-vos conhecimentos, que proporcio-nam o caminho para novas descober-tas. No final, algumas vezes, paradig-mas são transpostos (Figura 2). A prin-cipal diferença é que até algumasdécadas atrás, esse processo requeriasomente poder de raciocínio, lápis epapel. Agora requer tecnologia com-

    putacional sofisticada. Para isso, oscentros de pesquisa e universidadescada vez mais terão que ter seus próp-rios grupos de bioinformática, manten-do equipes multidisciplinares com ativ-idades que de um lado promovamuma melhor exploração dos dados bi-ológicos através de ferramentas debioinformática e, por outro lado, asquestões geradas pelos dados biológi-cos obtidos possibilitem melhorar asferramentas de bioinformática. A bio-informática será cada vez mais impor-tante em termos de integração da in-formação, buscando impulsionar aaquisição de conhecimento sobre ossistemas biológicos para a geração denovas saídas para problemas na agri-cultura, medicina, produção de ener-gia e conservação do meio ambiente.

    O papel da bioinformática em expansão

    Os projetos genoma transforma-

    ram a biologia em muitos sentidos, mas

    Figura 2. Ilustração do pro-cesso de obtenção de novasdescobertas nos diversoscampos da ciência.

  • 8/16/2019 omicas

    8/10

    Biotecnologia Ciência & Desenvolvimento n.32 - janeiro/junho 2004 35

    o mais impressionante avanço foi aemergência da bioinformática e o tre-inamento dos cientistas em tecnolo-gias modernas de pesquisa. Inicial-mente a bioinformática teve comoaplicação principal facilitar o manuseioda grande quantidade de dados gera-dos pelos projetos genoma, como a

    montagem de contigs e fechamentode seqüências genômicas, além de dar suporte para outras estratégias exper-imentais no campo da biologia mo-lecular.

    De lá para cá, muitas informaçõesforam disponibilizadas em bancos dedados públicos de seqüências gênicas,proteínas, estruturas de macromolécu-las, perfil metabólico, filogenia e ou-tros, cujo valor ainda não pode sequer ser estimado. Hoje não é mais possí-vel avançar em biotecnologia sem a

    integração da tecnologia da infor-mação com a tecnologia experimen-tal. As abordagens de estudos biotec-nológicos atualmente buscam resol-ver questões específicas, optando-senormalmente por fazer uma análisecomputacional inicial com a utilizaçãodessas informações para direcionar eselecionar as estratégias experimen-tais, com considerável economia finan-ceira e de tempo, sem considerar aefetividade de tais procedimentos na

    aceleração da obtenção dos resultadose descobertas científicas.Além disso, muitas descobertas

    estão sendo feitas simplesmente pelaanálise sistematizada dessas fontes dedados, que não param de crescer tan-to em volume como em complexi-dade e variabilidade. A tendência atu-al é para descobertas científicas e sín-tese sendo dirigidas pela informaçãoemergindo intrinsecamente a partir dabiologia em si e a partir da diversidadee heterogeneidade das observaçõesexperimentais. Um projeto típico depesquisa pode começar com a coleçãode sequências genômicas conhecidasou não conhecidas. Para sequênciasnão conhecidas, pode-se conduzir umabusca em bancos de dados por sequên-cias similares ou usar algoritmos com-putacionais procurando predizer assuas possíveis identidades e funções.

    Isso requer o acesso à versão maisatual da coleção de dados, em bancosde dados mundiais, e as ferramentas

    fundamentais da bioinformática agora

    são cada vez mais parte dos métodosexperimentais. Entretanto, essas infor-mações estão espalhadas em múltiplasfontes, impossibilitando que os cien-tistas obtenham direta e eficiente-mente a informação requerida paraconverter os dados complexos e het-erogêneos em dados úteis, informação

    organizada e sistematizada conformeas linhas de pesquisa específicas.Nesse ambiente, para responder 

    uma simples questão pode ser necessário acessar várias fontes dedados e utilizar ferramentas de aná-lise sofisticadas, como alinhamento desequências, agrupamento, modela-gem molecular etc. Enquanto a inte-gração dos dados é uma área de pes-quisa dinâmica, necessidades especí-ficas dos biocientistas têm levado aodesenvolvimento de numerosos siste-

    mas que acabam desconectando oacesso aos dados em um ambientedirecionado por resultados. O resulta-do é o crescente número de bancosde dados e web sites representandouma coleção confinada de dados, gov-ernada por sistemas próprios de ger-enciamento e formatos particulares deinput e output dos dados, apresen-tações gráficas dos resultados, e pro-blemas sérios de compatibilidade einteroperabilidade com outros siste-

    mas. Uma evidência disso é o núme-ro crescente de novos bancos de da-dos relatados a cada ano na edição dejaneiro da Nucleic Acids Research (http://nar.oupjournals.org/). A ediçãoatual lista 548 bancos de dados, 162 amais em relação ao ano anterior (Gal-perin, 2004). Boa parte desses ban-cos ainda são construídos com en-foques extremamente limitados paraaplicações restritas, sem a preocu-pação com relação à compatibilidadee troca de informações com outrossistemas. Adaptações são lentas emuitas vezes difíceis de implementar quando a filosofia básica do banco pre-cisa ser mantida.

    O acesso a esses dados precisamelhorar em termos de eficiência,velocidade e facilidade. Para facilitar o entendimento dos processos biológi-cos, é necessário fazer novos arranjosaos recursos de dados disponíveis. Por exemplo, o que se faz inicialmenteem uma rota metabólica, uma rede de

    interações moleculares etc., é

    necessário generalizar para outrossistemas biológicos; a partir de E. coli para levedura, e chegar à biologia deorganismos mais complexos, como ohomem, animais e plantas economi-camente importantes. Trabalhar todaessa informação conjuntamente é fun-damental para a geração de novos in-

    sights. O rápido crescimento do vo-lume de dados é um desafio para cadaum, e com a produção de dados maisdiversos e em larga escala (por e-xemplo, dados de DNA microarrays  )esse crescimento está apenascomeçando.

    As atividades de bancos de da-dos e desenvolvimento de algoritmoscomputacionais precisam estar integra-das para produzir uma infra-estruturade informação coesiva delimitandotoda a biologia. Para isso é necessário

    o desenvolvimento de ferramentaspara disseminar e analisar massivasquantidades de dados, inclusive lite-ratura, e a construção de comunidadesde bancos de dados baseadas emprincípios operacionais padronizadose com padrões interoperacionais.

    Muitos dos problemas da bioin-formática são genéricos, por issosoluções em um domínio podem ser naturalmente aplicáveis para outros.O entendimento da informação mo-

    lecular até a célula, órgão e o sistemabiológico do organismo será o maior desafio (fenomenoma). A passagemdo genótipo para o fenótipo requer-erá um novo conjunto de ferramentascomputacionais altamente robustas. Oprincipal enfoque da bioinformáticapara os próximos anos será integrar esses dados de modo a permitir bus-cas transparentes através dos dados.Fazer isso de forma robusta abrangen-do todo o conjunto de dados é umdesafio real.

    Apesar do avanço já feito, énecessário continuar a pesquisa nocampo da genômica, principalmentepara microrganismos associados aplantas economicamente importantes,incluindo fungos, e buscar entender as interações hospedeiro-microrganis-mo ou planta-patógeno. No caso damedicina, a necessidade atual é por dados clínicos bem estruturados e con-sistentes sobre grandes populações.Tais dados, que são difíceis de coletar 

    e caros, serão críticos para ligar os

  • 8/16/2019 omicas

    9/10

    36 Biotecnologia Ciência & Desenvolvimento n.32 - janeiro/junho 2004 

    dados moleculares com o fenótipo.Embora exista um crescente númerode centros de bioinformática, a maior tendência é que ela esteja presentenos centros de pesquisa e nas univer-sidades, em cada departamento debiologia ou biotecnologia, em cadafaculdade na área das ciências biológi-

    cas em todo o mundo. Todos osgrandes centros de pesquisa terão queter profissionais especializados em bio-informática/biologia computacional.Hoje é consenso geral que essas insti-tuições necessitam de pessoas comesse entendimento em seus departa-mentos de biologia e necessitarão for-mar os seus estudantes de graduaçãoem biologia quantitativa em vez desomente biologia experimental. Osexperimentos precisam ser feitos nocontexto do conhecimento corrente,

    e os dados gerados precisam ser ra-pidamente armazenados e exploradoscomputacionalmente juntamente como universo de informação disponível.

    Nunca na história da ciência asinformações foram tão democratica-mente acessíveis como hoje. Especial-mente as informações e ferramentasdisponibilizadas pela bioinformática.Não importa quem e onde. O mesmotipo de informação pode ser acessadapor qualquer pessoa, em qualquer 

    lugar do mundo. Praticamente todasas ferramentas de bioinformática ebancos de dados disponíveis podemser dispostos de modo que possamser acessadas e utilizadas na web. Bastafazer a pergunta correta e buscar aresposta.

    Conclusão

    O debate que está emergindoatualmente é se existe uma pletoraou escassez de dados experimentaisproveitosos derivados pala plataformadas ômicas. O grande desafio, no en-tanto, é o que se pode fazer com es-ses dados. Não há dúvida de que atecnologia da informação precisa ser tomada como parte integral do pro-cesso de descoberta pelos pesquisa-dores no campo da biologia. Este é oproblema fundamental que precisa ser resolvido pela bioinformática, promo-vendo um profundo impacto no pro-cesso de descobertas biológicas. É

    necessário que ocorram discussões

    freqüentes entre todos os especialis-tas participantes de estudos relacio-nados, visando um emprego mais ad-equado da cultura científica dos par-ticipantes, já que, de modo simplifi-cado, os biólogos querem entender como os organismos funcionam e oscientistas da computação querem fazer 

    ferramentas que resolvam problemas.O estabelecimento de uma linguagemcomum entre os especialistas em difer-entes áreas, o monitoramento de quaisferramentas são mais usadas e impor-tantes para o escopo do estudo, umafilosofia orientada para novasdescobertas, não orientada por dog-mas, são recomendações importantespara o sucesso dos empreendimen-tos científicos. Treinamentos cons-tantes e workshops devem fazer partedos investimentos previstos nos pro-

    jetos.O bom entendimento entre os

    pesquisadores de diferentes áreas éfundamental. Por exemplo, os cien-tistas da computação devem ser pa-cientes com o biólogo, já que estegeralmente não sabe exatamenteonde quer chegar ou o que espera dosdados (o que é natural nos estudosbiológicos). Deve ensinar pelo menosos conceitos básicos de computaçãopara estabelecer uma plataforma co-

    mum de comunicação, encorajar osbiólogos a mostrar como eles estãorealmente usando as ferramentas dis-ponibilizadas e buscar sempre propor-cionar o máximo de acesso aos da-dos. A retenção longa dos dados inibeo espírito de comunidade. Por partedo biólogo, espera-se que não esperemuito ou tente fazer as coisas sozi -nho, fale com uma variedade de cien-tistas da computação, encontre aque-les mais interessados no seu proble-ma, encontre aqueles com quem gos-ta de trabalhar, faça perguntas comfreqüência e logo que surjam, use umavariedade de novas ferramentas, fa-zendo comentários/sugestões assimque puder e busque entender os de-safios da computação para solucionar problemas novos. A obtenção de no-vos conhecimentos acelera quandotodos contribuem.

     AgradecimentosAos colegas Dr. Francisco Pros-

    docimi, Dr. Newton Portilho Carneiro

    e Dr. Alexandre Lima Nepomucenopela revisão crítica deste artigo.

    Referências

    Bassingthwaighte JB. Strategies for thephysiome project. Ann BiomedEng. 2000, 28(8):1043-58. PMID:

    11144666Bernal A, Ear U, Kyrpides N. GenomesOnLine Database (GOLD): amonitor of genome projects world-wide. Nucleic Acids Res. 2001,29(1):126-127. PMID: 11125068

    Collins FS, Green ED, Guttmacher AE,Guyer MS; US National HumanGenome Research Institute. A visi-on for the future of genomics rese-arch. Nature. 2003, 422(6934):835-47. PMID: 12695777

    Covert MW, Knight EM, Reed JL,

    Herrgard MJ, Palsson BO.Integrating high-throughput andcomputational data elucidatesbacterial networks. Nature. 2004,429(6987):92-6. PMID: 15129285

    Fleischmann RD, Adams MD, White O,Clayton RA, Kirkness EF, KerlavageAR, Bult CJ, Tomb JF, DoughertyBA, Merrick JM, et al. Whole-genome random sequencing andassembly of Haemophilus influenzae   Rd. Science. 1995,

    269(5223):496-512. PMID:7542800Galperin MY. The Molecular Biology

    Database Collection: 2004 update.Nucleic Acids Res. 2004, 1;32Database issue:D3-22. PMID:14681349

    Gao F, Foat BC, Bussemaker HJ.Defining transcriptional networksthrough integrative modeling of mRNA expression and transcriptionfactor binding data. BMCBioinformatics. 2004, 18;5(1):31.PMID: 15113405

    Garavelli JS. The RESID Database of Protein Modifications: 2003developments. Nucleic Acids Res.2003, 31(1):499-501. PMID:12520062

    Genomics and Its Impact on Scienceand Society: The Human GenomeProject and Beyond. U.S.Department of Energy HumanGenome Program. 2003. Disponí-vel http://www.ornl.gov/sci/

    techresources/Human_Genome/

  • 8/16/2019 omicas

    10/10

    Biotecnologia Ciência & Desenvolvimento n.32 - janeiro/junho 2004 37

    publicat/primer2001/index.shtmlGoodsell DS. Inside a living cell. Tren-

    ds Biochem Sci. 1991, 16(6):203-206. PMID: 1891800

    Goto S, Okuno Y, Hattori M, NishiokaT, Kanehisa M. LIGAND: databaseof chemical compounds and reac-tions in biological pathways. Nu-

    cleic Acids Res. 2002, 30(1):402-4.PMID: 11752349Guerreiro N, Staedtler F, Grenet O,

    Kehren J, Chibout SD. Toxicoge-nomics in drug development. To-xicol Pathol. 2003, 31(5):471-9.PMID: 14692614

    Hoersch S, Leroy C, Brown NP, Andra-de MA, Sander C. The GeneQuizweb server: protein functionalanalysis through the Web. TrendsBiochem Sci. 2000, 25(1):33-35.PMID: 10637611

     James P. Protein identification in thepost-genome era: the rapid rise of proteomics. Q Rev Biophys. 1997,30(4):279-331. PMID: 9634650

    Kanehisa M, Goto S, Kawashima S,Okuno Y, Hattori M. The KEGGresource for deciphering the ge-nome. Nucleic Acids Res. 2004, 32Database issue:D277-D280. PMID:14681412

    Kramer JA, Kolaja KL. Toxicogeno-mics: an opportunity to optimise

    drug development and safety eva-luation. Expert Opin Drug Saf. 2002,1(3):275-86. PMID: 12904143

    Kondro W. MOLECULAR BIOLOGY:Consortium Tackles Mouse Regu-lome. Science. 2004,304(5673):942A. PMID: 15143247

    Lefranc MP. IMGT, The InternationalImMunoGeneTics Information Sys-tem, http://imgt.cines.fr. MethodsMol Biol. 2004, 248:27-49. PMID:14970490

    Lopez-Otin C, Overall CM. Proteasedegradomics: a new challenge for proteomics. Nat Rev Mol Cell Biol.2002, 3(7):509-19. PMID:12094217

    Marshall A. Genset-Abbott deal heraldspharmacogenomics era. Nat Bio-technol. 1997, 15(9):829-30. PMID:9306389

    Mewes HW, Amid C, Arnold R, Frish-man D, Guldener U, MannhauptG, Munsterkotter M, Pagel P, Stra-ck N, Stumpflen V, Warfsmann J,

    Ruepp A. MIPS: analysis and anno-

    tation of proteins from wholegenomes.Nucleic Acids Res. 2004,32 Database issue:D41-D44. PMID:14681354

    Novik KL, Nimmrich I, Genc B, Maier S,Piepenbrock C, Olek A, Beck S.Epigenomics: genome-wide studyof methylation phenomena. Curr 

    Issues Mol Biol. 2002, 4(4):111-28.PMID: 12432963Palsson B. In silico biology through

    “omics”. Nat Biotechnol. 2002,20(7):649-50. PMID: 12089538

    Palsson B. The challenges of in silicobiology. Nat Biotechnol. 2000,18(11):1147-50. PMID: 11062431

    Pennisi E. Human genome. Reachingtheir goal early, sequencing labscelebrate. Science. 2003a,300(5618):409. PMID: 12702850

    Pennisi E. Human genome. A low num-

    ber wins the GeneSweep Pool.Science. 2003b, 300(5625):1484.PMID: 12791949

    Pennisi E. Bioinformatics. Gene coun-ters struggle to get the right answer.Science. 2003c, 301(5636):1040-1. PMID: 12933991

    Prates MV, Bloch C. Peptídeos antimi-crobianos. Biotecnologia Ciência eDesenvolvimento. 2002, 29: 30-36.

    Roven C, Bussemaker HJ. REDUCE:

    An online tool for inferring cis-regulatory elements and transcrip-tional module activities from mi-croarray data. Nucleic Acids Res.2003, 31(13):3487-90. PMID:12824350

    Rubin GM, Yandell MD, Wortman JR,Gabor Miklos GL, Nelson CR, Ha-riharan IK, Fortini ME, Li PW, Apwei-ler R, Fleischmann W, Cherry JM,Henikoff S, Skupski MP, Misra S,Ashburner M, Birney E, BoguskiMS, Brody T, Brokstein P, Celniker SE, Chervitz SA, Coates D, Cra-vchik A, Gabrielian A, Galle RF,Gelbart WM, George RA, Golds-tein LS, Gong F, Guan P, Harris NL,Hay BA, Hoskins RA, Li J, Li Z,Hynes RO, Jones SJ, Kuehl PM,Lemaitre B, Littleton JT, MorrisonDK, Mungall C, O’Farrell PH, Pi-ckeral OK, Shue C, Vosshall LB,Zhang J, Zhao Q, Zheng XH, LewisS. Comparative genomics of theeukaryotes. Science. 2000,

    287(5461):2204-2215. PMID:

    10731134Sanford K, Soucaille P, Whited G, Cho-

    tani G. Genomics to fluxomics andphysiomics - pathway enginee-ring. Curr Opin Microbiol. 2002,5(3):318-22. PMID: 12057688

    Schilling CH, Edwards JS, Palsson BO.Toward metabolic phenomics:

    analysis of genomic data using fluxbalances. Biotechnol Prog. 1999,15(3):288-95. PMID: 10356245

    Schulz-Knappe P, Zucht HD, Heine G, Jurgens M, Hess R, Schrader M.Peptidomics: the comprehensiveanalysis of peptides in complexbiological mixtures. Comb ChemHigh Throughput Screen. 2001,4(2):207-17. PMID: 11281836

    Stalker J, Gibbins B, Meidl P, Smith J,Spooner W, Hotz HR, Cox AV. TheEnsembl web site: mechanics of a

    genome browser. Genome Res.2004, 14(5):951-955. PMID:15123591

    Steuer R, Kurths J, Fiehn O, Weckwer-th W. Observing and interpretingcorrelations in metabolomic ne-tworks. Bioinformatics. 2003,19(8):1019-26. PMID: 12761066

    Weckwerth W, Loureiro ME, WenzelK, Fiehn O. Differential metabolicnetworks unravel the effects of silent plant phenotypes. Proc Natl

    Acad Sci U S A. 2004. PMID:15136733Weinstein JN. Searching for pharmaco-

    genomic markers: the synergybetween omic and hypothesis-dri-ven research. Dis Markers. 2001,17(2):77-88. PMID: 11673654

    Werner T. Proteomics and regulomics:the yin and yang of functionalgenomics. Mass Spectrom Rev.2004, 23(1):25-33. PMID:14625890

    Wright FA, Lemon WJ, Zhao WD, SearsR, Zhuo D, Wang JP, Yang HY,Baer T, Stredney D, Spitzner J,Stutz A, Krahe R, Yuan B. A draftannotation and overview of thehuman genome. Genome Biol.2001, 2(7):RESEARCH0025. PMID:11516338

    Zanzoni A, Montecchi-Palazzi L, Quon-dam M, Ausiello G, Helmer-Citteri-ch M, Cesareni G. MINT: a Molecu-lar INTeraction database. FEBS Lett.2002, 513(1):135-40. PMID:

    11911893