Planejamento e identificação de novos agentes esquistossomicidas a partir de estratégias em
Química Medicinal
Goiânia
2014
UNIVERSIDADE FEDERAL DE GOIÁS
FACULDADE DE FARMÁCIA
Cleber Camilo de Melo Filho
Cleber Camilo de Melo Filho
Planejamento e identificação de novos agentes esquistossomicidas a partir de estratégias em
Química Medicinal
Goiânia
2014
Dissertação apresentada ao Programa de Pós-
Graduação em Ciências Farmacêuticas da
Faculdade de Farmácia da Universidade Federal
de Goiás, como parte dos requisitos para
obtenção do título de Mestre em Ciências
Farmacêuticas.
Área de Concentração: Fármacos e
Medicamentos
Orientadora: Profª. Drª. Carolina Horta Andrade
DEDICATÓRIA
Dedico este trabalho aos meus pais, Cleber
e Judite, exemplos de perseverança e
esforço que me inspiraram na luta pelos
meus sonhos.
AGRADECIMENTOS
Primeiramente a Deus, pela oportunidade de estar aqui hoje, realizando mais um
sonho.
À professora Dra. Carolina Horta Andrade, pelo exemplo de profissionalismo e
competência, pela orientação, paciência e oportunidade de realizar este trabalho.
Aos meus pais, Cleber e Judite, pelo carinho e por me incentivarem, desde a infância,
a buscar o conhecimento e a lutar pelos meus sonhos.
Ao Rodolpho de Campos Braga, pela contribuição, ensinamentos e disposição em
ajudar.
A todos os colegas do LabMol pelos momentos de descontração e troca de
conhecimento.
À minha esposa Wagna, pelo amor, carinho, companheirismo e compreensão.
À OpenEye Scientific Software, pela licença acadêmica de programas utilizados neste
trabalho.
Ao CNPq, CAPES e FAPEG pelo apoio financeiro.
Ao Portal de Periódicos da CAPES.
EPÍGRAFE
“Saber muito não lhe torna inteligente. A
inteligência se traduz na forma que você
recolhe, julga, maneja e, sobretudo, onde e
como aplica esta informação."
Carl Sagan
SUMÁRIO
LISTA DE FIGURAS X
LISTA DE TABELAS XIII
LISTA DE ABREVIATURAS E SIGLAS XV
RESUMO XVIII
ABSTRACT XIX
1. INTRODUÇÃO 20
1.1. Esquistossomose 20
1.1.1. Etiologia e patogenia 20
1.1.2. Ciclo de vida do parasito 21
1.1.3. Distribuição e epidemiologia 23
1.3.3.1. A esquistossomose no Brasil 24
1.1.4. Fármacos utilizados no tratamento da esquistossomose 25
1.1.4.1. Praziquantel 25
1.1.4.2. Oxamniquina 27
1.1.4.3. Novos candidatos ao controle da esquistossomose 28
1.2. Planejamento e descoberta de novos fármacos 30
1.3. Química Medicinal e planejamento de fármacos 33
1.3.1. Relações Quantitativas entre a Estrutura e Atividade (QSAR) 34
1.3.1.1. Holograma QSAR (HQSAR) 36
1.3.1.2. Análise Comparativa de Campos Moleculares (CoMFA) 38
1.3.1.3. Análise Comparativa dos Índices de Similaridade Molecular (CoMSIA) 40
1.4. Bases Moleculares para o planejamento de novos fármacos
esquistossomicidas
42
1.4.1. Tioredoxina Glutationa Redutase de Schistosoma mansoni (SmTGR) 42
1.4.2. Oxadiazóis-2-óxidos 45
2. JUSTIFICATIVA 47
3. OBJETIVOS 48
3.1. Objetivo geral 48
3.2. Objetivos específicos 48
4. MATERIAL E MÉTODOS 49
4.1. Material 49
4.1.1. Computadores e softwares 49
4.1.2. Conjunto de dados 49
4.2. Métodos 51
4.2.1. Construção das estruturas 3D, minimização de energia e cálculo de cargas 51
4.2.2. Divisão do conjunto de dados 52
4.2.3. QSAR-2D 52
4.2.3.1. HQSAR 52
4.2.4. QSAR-3D 53
4.2.4.1. Alinhamento molecular 53
4.2.4.2. CoMFA 54
4.2.4.3. CoMSIA 55
4.2.5. Validação dos modelos de QSAR 55
4.2.5.1. Validação interna 55
4.2.5.2. Validação externa 56
4.2.6. Planejamento de novos inibidores de SmTGR a partir dos estudos de QSAR 58
5. RESULTADOS E DISCUSSÃO 59
5.1. Caracterização do conjunto de dados 59
5.2. QSAR-2D 60
5.2.1. HQSAR 60
5.2.1.1. Identificação de outliers 60
5.2.1.2. Construção dos modelos de HQSAR 63
5.3. QSAR-3D 70
5.3.1. Cálculo de cargas atômicas parciais 70
5.3.2. Alinhamento molecular 70
5.3.3. Análises de CoMFA 74
5.3.3.1. Identificação de outliers 74
5.3.3.2. Modelos de CoMFA utilizando as cargas Gasteiger-Hückel 75
5.3.3.2.1. Modelos obtidos a partir do alinhamento 1 (ROCS) 76
5.3.3.2.2. Modelos obtidos a partir do alinhamento 2 (Surflex-Sim) 76
5.3.3.3. Modelos de CoMFA utilizando as cargas AM1-BCC 77
5.3.3.3.1. Modelos obtidos a partir do alinhamento 1 77
5.3.3.3.2. Modelos obtidos a partir do alinhamento 2 78
5.3.3.4. Melhores modelos de CoMFA 79
5.3.3.5. Mapas de contorno de CoMFA 81
5.3.4. Análises de CoMSIA 84
5.3.4.1. Identificação de outliers 84
5.3.4.2. Modelos de CoMSIA utilizando as cargas Gasteiger-Hückel 84
5.3.4.2.1. Modelos obtidos a partir do alinhamento 1 (ROCS) 84
5.3.4.2.2. Modelos obtidos a partir do alinhamento 2 (Surflex-Sim) 85
5.3.4.3. Modelos de CoMSIA utilizando as cargas AM1-BCC 86
5.3.4.3.1. Modelos obtidos a partir do alinhamento 1 86
5.3.4.3.2. Modelos obtidos a partir do alinhamento 2 87
5.3.4.4. Melhores modelos de CoMSIA 88
5.3.4.5. Mapas de contorno de CoMSIA 89
5.4. Planejamento de novos inibidores de SmTGR a partir dos estudos de
QSAR
91
6. CONCLUSÕES 95
7. PERSPECTIVAS 96
8. REFERÊNCIAS BIBLIOGRÁFICAS 97
X
LISTA DE FIGURAS
Figura 1 Ciclo de vida dos parasitos do gênero Schistosoma. As setas vermelhas
indicam a fase do ciclo que ocorre na água e no hospedeiro intermediário.
As setas azuis indicam a fase do ciclo que ocorre no hospedeiro
definitivo.
22
Figura 2 Distribuição global da esquistossomose em 2011 (Adaptado de WHO,
2013). 24
Figura 3 Estrutura química dos dois enantiômeros do praziquantel. 26
Figura 4 Estrutura química da oxamniquina. 27
Figura 5 Etapas envolvidas na gênese de fármacos (Adaptado de NWAKA,
RIDLEY, 2003).
31
Figura 6 Esquema das etapas envolvidas na geração dos hologramas moleculares e
dos modelos HQSAR. 37
Figura 7 Etapas envolvidas na geração de modelos CoMFA. 40
Figura 8 Comparação entre os potenciais de Lennard-Jones e de Coulomb
(CoMFA) e a função Gaussiana (CoMSIA). Em CoMFA, pequenas
variações na distância (r) podem provocar variações muito grandes de
energia (Adaptado de KUBINYI, 1997).
41
Figura 9 Enzimas tioredoxina redutase e glutationa redutase envolvidas na
proteção contra espécies reativas de oxigênio na maioria dos eucariotos
(A) e a enzima tioredoxina glutationa redutase que desempenha essa
função no Schistosoma mansoni (B) (Adaptado de Kuntz et al., 2007).
43
Figura 10 Estrutura da SmTGR (PDB ID: 2V6O) (ANGELUCCI et al., 2008). A
alça C-terminal flexível de um monômero fornece elétrons para os
domínios Trx e Grx do outro monômero (adaptado de SACCOCCIA et
al., 2012).
45
Figura 11 Estrutura química do furoxano (A) e estrutura do anel 1,2,5-oxadiazol-2-
óxido (anel oxadiazólico) (B) presente em todos compostos da série de
inibidores da tioredoxina glutationa redutase de S. mansoni.
46
Figura 12 Gráfico de dispersão dos valores de pIC50 experimental para os
compostos do conjunto de dados.
49
XI
Figura 13 Curvas de regressão com interceptação em zero (linha pontilhada) e sem
interceptação em zero (linha contínua). O rm2 é obtido sem a inversão dos
eixos (A); O r’m2 é obtido após a inversão dos eixos (B) (Adaptado de
ROY et al., 2013).
57
Figura 14 Estrutura química do anel 1,2,5-oxadiazol-2-óxido. 59
Figura 15 (A) Distribuição dos valores de potência no conjunto de dados total e nos
conjuntos treinamento e teste; (B) Proporção entre compostos do
conjunto treinamento e teste dentro de cada uma das três unidades
logarítmicas de potência.
60
Figura 16 Gráficos de atividade biológica experimental versus predita para os
modelos 2 e 3 (os círculos representam os compostos do conjunto
treinamento e os losangos os compostos do conjunto teste).
66
Figura 17 Mapas de contribuição gerados a partir do modelo 2. (A) Mapa de
contribuição para o composto mais potente do conjunto de dados; (B)
Mapa de contribuição para o composto menos potente do conjunto de
dados. Os fragmentos em azul representam a máxima subestrutura
comum (MCS).
68
Figura 18 Esquema demonstrando a liberação de NO a partir de uma molécula de
oxadiazol-2-óxido em solução fisiológica contendo tióis. O ataque
nucleofílico do grupo tiolato pode ocorrer nos carbonos C4 e C3 do anel
oxadiazólico (Adaptado de GASCO et al., 2004).
69
Figura 19 Alinhamentos moleculares utilizados nos estudos de QSAR-3D. (A)
Alinhamento no ROCS (alinhamento1); (B) alinhamento no Surflex-Sim
(alinhamento 2).
71
Figura 20 Esquema demonstrando o alinhamento realizado pelo programa ROCS.
As moléculas do conjunto de dados são sobrepostas a uma molécula de
referência e em seguida, é realizado um processo de otimização que
maximiza a sobreposição dos volumes moleculares (OPENEYE
SCIENTIFIC SOFTWARE INC., 2011).
72
Figura 21 Esquema demonstrando o alinhamento realizado no Surflex-Sim. (A) A
similaridade entre as moléculas é definida como as diferenças entre
medidas de superfície e pontos de observação; (B) Representação do
procedimento de otimização do alinhamento, o qual utiliza tripletos
constituídos de pontos de observação de duas moléculas (Adaptado de
JAIN, 2004).
73
XII
Figura 22 Gráficos das atividades experimental versus predita construídos a partir
dos dois melhores modelos de CoMFA. Os círculos representam os
compostos do conjunto treinamento e os losangos os compostos do
conjunto teste.
80
Figura 23 Mapas de contorno para o composto mais potente do conjunto de dados
obtidos a partir do modelo I. Mapa de contorno estérico (A); Mapa de
contorno eletrostático (B).
82
Figura 24 Mapas de contorno para o composto mais potente do conjunto de dados
obtidos a partir do modelo II. Mapa de contorno estérico (A); Mapa de
contorno eletrostático (B).
83
Figura 25 Gráficos da atividade experimental versus predita construídos a partir dos
dois melhores modelos de CoMSIA. (A) modelo I, obtido com cálculo de
cargas Gasteiger-Hückel e alinhamento 1; (B) modelo II, obtido com
cálculo de cargas AM1-BCC e alinhamento 1.
89
Figura 26 Mapas de contorno obtidos a partir do modelo II (SEHA). (A) mapa de
contorno estérico; (B) mapa de contorno eletrostático; (C) mapa de
contorno hidrofóbico; (D) mapa de contorno de aceptores de ligação de
hidrogênio.
90
Figura 27 Resumo das informações obtidas através dos estudos de QSAR-2D e
QSAR-3D.
92
XIII
LISTA DE TABELAS
Tabela 1 Candidatos a fármacos esquistossomicidas, fitoterápicos e vacinas em
estudos pré-clínicos e clínicos.
29
Tabela 1
(cont.)
Candidatos a fármacos esquistossomicidas, fitoterápicos e vacinas em
estudos pré-clínicos e clínicos.
30
Tabela 2 Parâmetros de distinção de fragmentos no método HQSAR. 38
Tabela 3 Estruturas químicas, valores de IC50 e pIC50 dos inibidores de SmTGR. 50
Tabela 3
(cont.)
Estruturas químicas, valores de IC50 e pIC50 dos inibidores de SmTGR. 51
Tabela 4 Análises de HQSAR utilizando o conjunto de dados total, várias
distinções de fragmento e tamanho padrão de fragmento (4-7 átomos). 61
Tabela 5 Atividade experimental, predita e resíduos obtidos com modelo de
distinção de fragmento A/B/C/H/DA e tamanho de fragmento padrão (4-
7), utilizando todos os compostos.
62
Tabela 6 Análises de HQSAR utilizando o conjunto treinamento, após a retirada de
dois outliers, utilizando várias distinções de fragmento e tamanho padrão
de fragmento (4-7 átomos).
64
Tabela 7 Modelos de HQSAR com maior preditividade externa após variação do
tamanho de fragmento.
65
Tabela 8 Atividade biológica experimental, predita e valores residuais relacionados
aos dois melhores modelos de HQSAR. 66
Tabela 9 Atividade biológica experimental, predita e valores residuais obtidos a
partir de um modelo de CoMFA utilizando todos os compostos do
conjunto de dados.
74
Tabela 9
(cont.)
Atividade biológica experimental, predita e valores residuais obtidos a
partir de um modelo de CoMFA utilizando todos os compostos do
conjunto de dados.
75
Tabela 10 Melhores modelos de CoMFA obtidos a partir do alinhamento 1. 76
Tabela 11 Melhores modelos de CoMFA obtidos a partir do alinhamento 2. 77
Tabela 12 Melhores modelos de CoMFA obtidos a partir do alinhamento 1. 78
Tabela 13 Melhores modelos de CoMFA obtidos a partir do alinhamento 2. 78
XIV
Tabela 14 Melhores modelos finais de CoMFA e seus resultados de robustez e
preditividade externa. 79
Tabela 15 Atividade biológica experimental, predita e resíduos dos compostos do
conjunto teste preditos pelos dois melhores modelos de CoMFA. 80
Tabela 16 Melhores modelos de CoMSIA obtidos a partir de cargas Gasteiger-
Hückel e alinhamento 1.
85
Tabela 17 Melhores modelos de CoMSIA obtidos a partir de cargas Gasteiger-
Hückel e alinhamento 2.
86
Tabela 18 Melhores modelos de CoMSIA obtidos a partir de cargas AM1-BCC e
alinhamento 1.
87
Tabela 19 Melhores modelos de CoMSIA obtidos a partir de cargas AM1-BCC e
alinhamento 2.
88
Tabela 20 Atividade biológica experimental, predita e resíduos dos compostos dos
conjunto teste após predição a partir dos dois melhores modelos de
CoMSIA.
89
Tabela 21 Estrutura química, valores de pIC50 preditos e valores de IC50 preditos
para os potenciais inibidores de SmTGR e o composto 33.
93
Tabela 21
(cont.)
Estrutura química, valores de pIC50 preditos e valores de IC50 preditos
para os potenciais inibidores de SmTGR e o composto 33.
94
XV
LISTA DE ABREVIATURAS E SIGLAS
4D Quarta dimensão
5D Quinta dimensão
6D Sexta dimensão
ABC Proteína de transporte ABC (ATP-binding cassette)
ADMET Absorção, distribuição, metabolismo, excreção e toxicidade
CADD Planejamento de fármacos auxiliado por computador (Computer-
Aided/Assisted Drug Design)
Cav Canais de cálcio voltagem dependentes
CoMFA Análise Comparativa de Campos Moleculares (Comparative Molecular Field
Analysis)
CoMSIA Análise Comparativa dos Índices de Similaridade Molecular (Comparative
Molecular Similarity Analysis)
Cys Cisteína
DNA Ácido desoxirribonucleico (deoxyribonucleic acid)
DTN Doença tropical negligenciada
FAD Flavina adenina dinucleotídeo
GR Glutationa redutase
GSH Glutationa
GSSG Glutationa dissulfeto
H2O2 Peróxido de hidrogênio
HQSAR Holograma-QSAR
HTS Triagem biológica automatizada em alta escala (High Throughput Screening)
IC Intervalo de confiança
iRNA RNA interferente
IUPAC União Internacional de Química Pura e Aplicada (International Union of Pure
and Applied Chemistry)
LBDD Planejamento de fármacos baseado no ligante (Ligand-Based Drug Design)
LMO Deixe muitos de fora (Leave-Many-Out)
LOO Deixe um de fora (Leave-One-Out)
S-PZQ S-praziquantel
XVI
MIFs Campos de interação moleculares (Molecular Interaction Fields)
NAPDPH Fosfato de dinucleotídeo de nicotinamida e adenina na forma reduzida
NCE Novas entidades químicas (New Chemical Entities)
NO Óxido nítrico
P&D Pesquisa e Desenvolvimento
pIC50 Logaritmo negativo de IC50 (-log IC50)
pKa Logaritmo negativo da constante de acidez (-log Ka)
PLS Regressão por mínimos quadrados parciais (Partial Least Squares)
PZQ praziquantel
q2
LMO Coeficiente de correlação da validação cruzada por LMO
q2
LOO Coeficiente de correlação da validação cruzada por LOO
QSAR Relação quantitativa entre a estrutura e atividade (Quantitative Structure-
Activity Relationships)
QSAR-2D QSAR bidimensional ou QSAR em duas dimensões
QSAR-3D QSAR tridimensional ou QSAR em três dimensões
QSAR-3D-RD QSAR-3D dependente do receptor (Receptor Dependent 3D-QSAR)
QSAR-3D-RI QSAR-3D independente do receptor (Receptor Independent 3D-QSAR)
r2
pred Coeficiente de correlação da predição
rm2 Coeficiente de correlação modificado
RMN Ressonância magnética nuclear
ROCS Rapid Overlay of Chemical Structures
ROS Espécies reativas de oxigênio (Reactive Oxygen Species)
SAR Relação entre a estrutura e atividade (Structure-Activity Relationships)
SBDD Planejamento de fármacos baseado na estrutura (Structure-Based Drug
Design)
SDC Coeficiente do desvio padrão (Standard Deviation Coefficient)
Sec Selenocisteína
SMDR2 Proteína de transporte de múltiplos fármacos (Multidrug transporter protein)
SmMRP1 Proteína associada a resistência a múltiplos fármacos 1 (Multidrug
Resistance-Associated Protein)
SmTGR Tioredoxina glutationa redutase de Schistosoma mansoni
Trx Tioredoxina
Trx-[SH]2 Tioredoxina reduzida
XVII
TrxR Tioredoxina redutase
Trx-S2 Tioredoxina oxidada
VS Triagem virtual (Virtual Screening)
WHO Organização Mundial da Saúde (World Health Organization)
XVIII
RESUMO
A esquistossomose é uma doença tropical negligenciada (DTN) que afeta grande número de
indivíduos, principalmente em áreas tropicais. Esta doença é causada por vermes platelmintos
do gênero Schistosoma, que possuem como hospedeiros intermediários os caramujos do
gênero Biomphalaria. O fármaco mais utilizado no tratamento atualmente é o praziquantel,
que devido à grande disseminação do seu uso, traz preocupações quanto ao desenvolvimento
de resistência. A enzima tioredoxina glutationa redutase de Schistosoma mansoni (SmTGR)
desempenha um papel importante na detoxificação de espécies reativas de oxigênio (ROS),
permitindo a sobrevivência dos parasitos por muito tempo na circulação sanguínea,
protegendo-os do sistema imune do hospedeiro. A dependência do parasito de um único
sistema para detoxificação de ROS, torna a SmTGR um alvo promissor no desenvolvimento
de novos fármacos esquistossomicidas. Frente à necessidade de se desenvolver novos
fármacos contra esquistossomose, foram realizados estudos quantitativos da relação entre
estrutura e atividade (QSAR) para uma série de oxadiazóis-2-óxidos reportados na literatura
como inibidores de SmTGR. Foi realizada análise de holograma-QSAR (HQSAR), que é um
método de QSAR bidimensional (QSAR-2D). Além disso, foram utilizadas a análise
comparativa de campos moleculares (CoMFA) e a análise comparativa dos índices de
similaridade molecular (CoMSIA), que são métodos de QSAR tridimensional (QSAR-3D). Nos
métodos de QSAR-3D foram utilizados dois métodos de cálculo de cargas parciais: o método
empírico Gasteiger-Hückel e o semi-empírico AM1-BCC. Foram também testadas duas
estratégias de alinhamento, uma baseada na sobreposição de volumes moleculares e outra
baseada em uma função de similaridade morfológica. Os modelos de QSAR gerados
demonstraram boa robustez e preditividade externa e foram usados para predição da atividade
biológica de novos compostos inibidores de SmTGR. Os mapas de contribuição e de contorno
obtidos forneceram informações estruturais importantes a respeito dos oxadizóis-2-óxidos,
que foram utilizadas no planejamento de novos inibidores da SmTGR.
Palavras-chave: Esquistossomose, Schistosoma mansoni, tratamento, SmTGR, HQSAR,
CoMFA, CoMSIA, planejamento de fármacos.
XIX
ABSTRACT
Schistosomiasis is a neglected tropical disease (NTD) that affects many individuals, mainly in
tropical areas. This disease is caused by blood flukes of the genus Schistosoma, which have
the snails of the genus Biomphalaria as their intermediate hosts. The most used drug in
schistosomiasis treatment is praziquantel, which because of its widespread use, brings
concerns about the development of resistance. The enzyme Thioredoxin Glutathione
Reductase of Schistosoma mansoni (SmTGR) has an important function in reactive oxygen
species (ROS) detoxification, allowing the survival of parasites for a very long time in blood
stream, protecting them against the host immune system. The dependence of the parasite on a
single system for ROS detoxification, makes the SmTGR a promissing target in the
development of new schistosomicidal drugs. Facing the need for development of new drugs
against schistosomiasis, quantitative structure activity relationships (QSAR) studies were
carried out for a series of oxadiazoles-2-oxides reported in literature as SmTGR inhibitors.
Hologram-QSAR (HQSAR) analysis, a two-dimensional QSAR method (2D-QSAR), was
performed. Furthermore comparative molecular field analysis (CoMFA) and comparative
similarity indices analysis (CoMSIA), that are three-dimensional QSAR (3D-QSAR), were
also carried out. In 3D-QSAR methods, two partial charge calculation methods were used: the
empirical method Gasteiger-Hückel and the semiempirical method AM1-BCC. Two
alignment strategies were also tested, one based on molecular volume superposition and the
other based on a morphological similarity function. The QSAR models generated showed
great robustness and external predictivity and can be used to predict the biological activity of
new compounds inhibitors of SmTGR. The contribution and contour maps showed important
structural information about oxadiazoles-2-oxides that was used for the design of new
SmTGR inhibitors.
Keywords: Schistosomiasis, Schistosoma mansoni, treatment, SmTGR, HQSAR, CoMFA,
CoMSIA, drug design.
20
1. INTRODUÇÃO
1.1. Esquistossomose
A esquistossomose é uma doença tropical negligenciada (DTN), termo usado para
descrever um grupo de doenças, infecciosas e parasitárias, que afetam um grande número
de indivíduos, principalmente em áreas tropicais, cuja ocorrência está associada a
condições de pobreza e falta de acesso a condições sanitárias adequadas. São doenças que
por muito tempo foram esquecidas pela comunidade internacional e receberam pouco
investimento da indústria farmacêutica (NWAKA; RIDLEY, 2003). Outros exemplos de
DTNs são: a tripanossomíase africana, a doença de Chagas, as leishmanioses, úlcera de
Buruli, hanseníase, tracoma, ascaridíase, tricuríase, filariose linfática, oncocercose e
dranculíase (FENWICK, 2012).
A esquistossomose apresenta grande impacto social, uma vez que a infecção
crônica pode debilitar os indivíduos, levando à má nutrição, anemia, baixa performance
escolar de crianças, baixa produtividade no trabalho e manutenção da pobreza (KING,
2010; KLOOS et al., 2008).
1.1.1. Etiologia e patogenia
A esquistossomose é uma doença parasitária, causada por vermes do gênero
Schistosoma, pertencentes ao filo dos platelmintos e à classe Trematoda, os quais são
parasitos do sistema circulatório humano e de animais. Na circulação, os parasitos se
alimentam de células sanguíneas, globulinas, realizam seu metabolismo anaeróbio e se
reproduzem sexuadamente. Dentre as espécies mais comuns destacam-se: S. mansoni e S.
japonicum, que se instalam nas veias mesentéricas causando a forma intestinal da doença;
S. haematobium, que se instala nas veias perivesicais causando a esquistossomose do trato
urinário. As espécies S. intercalatum, S. mekongi e S. malayensis ocorrem com menor
frequência. O ser humano é o hospedeiro definitivo, no qual ocorre a reprodução sexuada.
Os hospedeiros intermediários, nos quais ocorre a reprodução assexuada do parasito, são
encontrados em coleções de água doce com pouca correnteza. Exemplos de hospedeiros
intermediários são os caramujos dos gêneros Biomphalaria (S. mansoni), Bulinus (S.
haematobium) e Oncomelania (S. japonicum) (GRYSEELS, 2012).
21
A fase aguda da doença se inicia após a penetração de cercárias na pele do
hospedeiro definitivo, o qual entra em contato com a água contendo cercárias provenientes
do hospedeiro intermediário. Os sintomas de fase aguda, que se manifestam
principalmente em indivíduos infectados pela primeira vez, consistem em lesões urticárias
na pele penetrada pelas cercárias, que podem persistir por horas ou até mesmo dias. Uma a
quatro semanas após a infecção, pode ser desenvolvida hipersensibilidade sistêmica,
causada pela migração e maturação de esquistossômulos, que representam a fase juvenil
do verme adulto. O diagnóstico nessa fase só é possível através de sorologia e histórico
recente de exposição a reservatórios aquáticos contendo caramujos (GRAY et al., 2011;
GRYSEELS, 2012).
A fase crônica da doença é caracterizada por morbidade causada principalmente
pelos vários anos de infecção crônica. Essa fase é diagnosticada observando-se a presença
de ovos nas fezes (forma intestinal, S. mansoni) ou na urina, acompanhada de hematúria
(forma urinária, S. haematobium). Episódios de anemia e diarréia sanguinolenta podem
ser observados como consequência da espoliação sanguínea. A maior parte dos sintomas
dessa fase está relacionada à migração dos ovos para diversos tecidos, onde os ovos ficam
presos e ocorrem reações inflamatórias e imunes do hospedeiro (formação de
granulomas). Infecções duradouras podem levar a lesões irreversíveis, caracterizadas por
fibrose. Os ovos podem ficar presos em órgãos próximos ao trato intestinal ou sistema
urinário. O fígado e o baço são dois órgãos onde os ovos comumente se depositam. A
presença desses ovos, em grande quantidade, estimula a resposta imune do hospedeiro em
larga escala, o que pode obstruir a veia porta, causando hipertensão e aumento do volume
desses órgãos (hepato-esplenomegalia). Além das formas intestinais e urinárias, pode
ocorrer esquistossomose ectópica, na qual o sistema nervoso central é afetado, além de
pulmões e órgãos genitais (BEZERRA et al., 1996; CONLON, 2005; GRYSEELS, 2012;
GRYSEELS et al., 2006).
1.1.2. Ciclo de vida do parasito
As fêmeas de Schistosoma podem produzir centenas ou até milhares de ovos por
dia (Figura 1). Cada ovo contém uma larva ciliada, o miracídio, o qual secreta enzimas
que auxiliam na migração dos ovos pelos vasos sanguíneos, através dos tecidos, chegando
até o lúmen do intestino (S. mansoni e S. japonicum) ou da bexiga (S. haematobium). A
22
maioria dos ovos é levada pela corrente sanguínea ou presa em tecidos durante essa
jornada. Aproximadamente um terço desses ovos é excretado nas fezes ou na urina.
Quando o ovo entra em contato com a água, este libera o miracídio que utiliza seus cílios
para nadar à procura de um hospedeiro intermediário susceptível (caramujo). O miracídio
penetra o caramujo e se transforma, por um período de 4 a 6 semanas, em um esporocisto
multicelular, que se divide em várias larvas secundárias (reprodução assexuada),
denominadas cercárias. Sob o estímulo da luz, centenas de cercárias deixam o caramujo.
Figura 1 – Ciclo de vida dos parasitos do gênero Schistosoma. As setas vermelhas
indicam a fase do ciclo que ocorre na água e no hospedeiro intermediário. As setas azuis
indicam a fase do ciclo que ocorre no hospedeiro definitivo. (1) os ovos são eliminados
nas fezes (S. mansoni e S. japonicum) ou urina (S. haematobium). (2) sob condições
favoráveis os ovos eclodem e liberam miracídios. (3) os miracídios nadam e penetram os
hospedeiros intermediários. (4) os estágios no hospedeiro intermediário incluem duas
gerações de esporocistos e a produção de cercárias. (5) as cercárias são liberadas do
hospedeiro intermediário e nadam. (6) as cercárias penetram a pele do hospedeiro
definitivo. (7) as cercárias perdem a cauda bifurcada, tornando-se esquistossômulos. (8, 9)
23
Os esquistossômulos migram através de vários tecidos e chegam ao sangue portal. (10) Os
vermes adultos se instalam nas veias mesentéricas (Adaptado de: CDC, 2013).
As cercárias se movimentam na água por até 72 horas. Quando entram em contato
com a pele humana, as cercárias penetram a derme, perdem a cauda, o glicocálix e
adquirem aspecto vermiforme, sendo a partir dessa fase denominadas esquistossômulos .
Os esquistossômulos, os quais representam a fase juvenil do verme adulto, migram através
da corrente sanguínea até o coração, atravessam os pulmões e vão para o fígado e veias
portais. Nesse local, os esquistossômulos amadurecem entre 4 a 6 semanas, se tornando
vermes adultos. Os vermes adultos se acasalam e migram para as veias mesentéricas, onde
a fêmea libera os ovos, que podem atingir a circulação sanguínea ou ser eliminados pelas
fezes ou urina do hospedeiro, dependendo da espécie em questão.
1.1.3. Distribuição e epidemiologia
A esquistossomose está presente em 78 países, mas dentre eles 19 não
apresentaram casos reportados recentemente, indicando que a transmissão da doença pode
ter sido interrompida nesses países. Estima-se que 52 países apresentem transmissão da
doença com intensidade que justifique a quimioterapia em grande escala. A situação atual
dos 7 países restantes ainda não foi determinada. A figura 2 representa a distribuição
mundial da esquistossomose em 2011 (WHO, 2013a).
Atualmente, estima-se que pelo menos 237 milhões de pessoas necessitem de
quimioterapia preventiva para esquistossomose. Destas, 90% vivem na África
Subsaariana. Mais de 70 % dos casos de infecção estão concentrados em apenas 10 países
africanos. Entretanto, resultados animadores têm sido observados em outras regiões do
planeta, como por exemplo, nas ilhas do Caribe e no Suriname, onde a transmissão é baixa
ou não foi detectada nos últimos anos. Na América do Sul, ainda são observadas baixas
taxas de transmissão no Brasil e na Venezuela, onde algumas áreas já poderiam ter
interrompido a transmissão se os esforços fossem aumentados. O controle da doença foi
alcançado na região leste do Mediterrâneo.
24
Figura 2 – Distribuição global da esquistossomose em 2011 (Adaptado de WHO, 2013).
Na região oeste do Pacífico, o controle de S. japonicum tem sido promissor. Como já
mencionado, o quadro é preocupante no continente africano, em que a endemicidade
continua alta em países como a Somália, o Sudão e o Yêmen. (WHO, 2013b).
1.3.3.1. A esquistossomose no Brasil
No Brasil, a espécie de interesse é o Schistosoma mansoni, cujos hospedeiros
intermediários são os caramujos do gênero Biomphalaria. O S.mansoni é também
encontrada na África, Arábia e em outras regiões da América do Sul (GRYSEELS, 2012).
A introdução da esquistossomose no Brasil ocorreu durante a chegada de escravos
africanos, portadores da doença, à região nordeste do país durante o período colonial. A
esquistossomose foi descrita pela primeira vez no Brasil pelo médico Manoel Augusto
Pirajá da Silva, em 1908, com uma publicação na revista “Brazil Médico”, em que
levantou a hipótese pela primeira vez, de que o verme causador da doença, no Brasil, não
era o mesmo responsável pela forma urinária da doença, observada em outros países
(KATZ, 2008).
25
A desigualdade social, os aspectos socioeconômicos e os movimentos migratórios
contribuíram para a disseminação da doença no nordeste e demais regiões do país. A
agricultura e atividade de pesca parecem estar significativamente relacionadas com a
prevalência da doença em comunidades rurais. Somados a esses fatores, destacam-se a
falta de condições adequadas de saneamento, o acesso e contato com fontes de água não
confiáveis e a educação sanitária da população. O grande movimento migratório de
indivíduos de regiões endêmicas para grandes centros urbanos contribuiu para o
aparecimento de casos nas periferias de metrópoles, como Belo Horizonte, São Paulo e
Rio de Janeiro (KLOOS et al., 2008).
1.1.4. Fármacos utilizados no tratamento da esquistossomose
O controle da esquistossomose consiste na integração de estratégias como o
tratamento através de fármacos esquistossomicidas, controle do hospedeiro intermediário,
educação e implementação de saneamento básico. O controle do hospedeiro intermediário
através de molusquicidas é realizado, mas a toxicidade dos compostos disponíveis afeta
outros organismos aquáticos, como pequenos peixes e anfíbios (GRYSEELS et al., 2006).
Os dois fármacos de escolha para tratamento da esquistossomose são o praziquantel e a
oxamniquina, sendo o primeiro mais utilizado devido à eficácia, baixo custo e poucos
efeitos adversos (ABDUL-GHANI et al., 2009; GRYSEELS et al., 2006).
1.1.4.1. Praziquantel
O praziquantel (PZQ) é um derivado pirazino-isoquinolínico com baixa toxicidade,
o qual foi sintetizado e testado em meados dos anos 70 (Figura 3). É um fármaco eficaz
contra as cinco espécies do parasito que infectam humanos. Ele está disponível como
mistura racêmica, na qual o isômero óptico (S)-praziquantel foi identificado como
provável composto ativo (ABDUL-GHANI et al., 2009). O PZQ apresenta baixa eficácia
contra parasitos imaturos. Os esquistossômulos são suscetíveis apenas nos primeiros 7
dias de vida. Nas semanas seguintes, os parasitos apresentam baixa resposta ao tratamento
com PZQ, tornando a ser sensíveis apenas 40 dias após a infecção. Portanto, em
indivíduos com alta carga parasitária, a presença de vermes imaturos diminui a capacidade
do PZQ de erradicar o parasito do organismo, exigindo-se repetição da quimioterapia
(CAFFREY; SECOR, 2011; CAFFREY, 2007; HAGAN et al., 2004).
26
Figura 3 – Estrutura química dos dois enantiômeros do praziquantel.
O PZQ age sobre o parasito induzindo um influxo de cálcio, causando contrações
na sua musculatura e alterações estruturais no tegumento. Essas alterações causam danos à
superfície do parasito, que acaba expondo antígenos que o tornam suscetível ao ataque por
anticorpos do hospedeiro. Essa exposição dos antígenos, induzida pelo fármaco, explica o
sinergismo entre PZQ e sistema imune na morte de parasitos, como já foi demonstrado em
estudos in vivo (DOENHOFF et al., 2009). O mecanismo de ação proposto para esse
fármaco consiste na ligação do fármaco a subunidades (beta) de canais de cálcio
voltagem dependentes (Cav, além da ligação do fármaco às cadeias leves de miosina,
induzindo a paralisação do parasito. Entretanto, o mecanismo não está completamente
elucidado (CAFFREY; SECOR, 2011; SALVADOR-RECATALÀ; GREENBERG,
2012).
Apesar dos bons resultados obtidos pelo PZQ no tratamento da esquistossomose, a
terapia em grande escala tem levantado preocupações quanto ao desenvolvimento de
resistência ao fármaco por parte do parasito. Essas preocupações aumentam quando se
observa a grande frequência de casos de reinfecção em que o indivíduo, após ser tratado,
retoma o contato com coleções de água contaminada. O potencial de desenvolver
resistência da espécie S. mansoni foi avaliado experimentalmente em ratos em que os
parasitos foram submetidos a doses sub-terapêuticas. Após várias gerações do parasito,
foram observadas algumas com menor sensibilidade ao fármaco (ABDUL-GHANI et al.,
2009). Um isolado de S. mansoni no Senegal demonstrou ser menos suscetível ao PZQ,
quando comparado a isolados mantidos em laboratório. Algo semelhante foi reportado no
27
Egito, em uma região de alta transmissão do parasito (ABDUL-GHANI et al., 2009;
CAFFREY, 2007; DOENHOFF et al., 2009). No Brasil, Bonesso-Sabadini & Dias
realizaram estudos de susceptibilidade ao PZQ em camundongos utilizando a cepa
humana (Ouh) de S. mansoni isolada de pacientes. Observou-se susceptibilidade reduzida
do parasito adulto ao PZQ acompanhada de retomada da liberação de ovos pelos
helmintos sobreviventes (BONESSO-SABADINI; DIAS, 2002).
Duas proteínas no S. mansoni podem estar envolvidas no mecanismo de resistência
ao PZQ, a SmMRP1 e SMDR2. Evidências indicam que há um aumento da expressão
dessas duas proteínas em resposta ao PZQ. Elas são homólogas de proteínas de transporte
ABC (do inglês, ATP-binding cassette), que constituem uma grande família de proteínas
de membrana que possuem várias funções celulares em animais, plantas e bactérias,
incluindo o transporte e peptídeos, hormônios, colesterol e ferro. Várias proteínas dessa
família podem estar envolvidas na resistência de parasitos a fármacos. Níveis mais altos
de SMDR2 são encontrados em fêmeas do parasito, enquanto a SmMRP1 é encontrada em
maior quantidade em machos. A SMDR2 parece ser modulada pelo PZQ e evidências
indicam que o PZQ é também um substrato de SMDR2 (WANG; WANG; LIANG, 2012).
1.1.4.2. Oxamniquina
A oxamniquina é um derivado tetrahidroquinolínico, descrito e sintetizado no final
dos anos 60 (Figura 4). É um fármaco utilizado principalmente no Brasil e países da
América do Sul. Ao contrário do PZQ, a oxamniquina é ativa somente contra S. mansoni.
De forma semelhante ao PZQ, a oxamniquina afeta de forma mais significativa os
parasitos adultos, sendo menos efetiva contra as formas mais jovens (esquistossômulos e
formas jovens no fígado) (ABDUL-GHANI et al., 2009).
Figura 4 - Estrutura química da oxamniquina.
O mecanismo de ação da oxamniquina está associado com a inibição irreversível
da síntese de ácidos nucléicos no parasito. O fármaco é ativado por uma enzima do
parasito, com características de sulfotransferase, através de esterificação. O éster formado
28
se dissocia espontaneamente e o eletrófilo resultante é capaz de alquilar o DNA do
Schistosoma mansoni (ABDUL-GHANI et al., 2009; DOENHOFF et al., 2009).
Em 1973, as primeiras cepas de S. mansoni resistentes a oxamniquina foram
isoladas no Brasil. Nessas cepas, a inibição da síntese de ácidos nucléicos nos parasitos,
após tratamento, era reversível, ao contrário do que ocorre em parasitos sensíveis, nos
quais a inibição é irreversível (ABDUL-GHANI et al., 2009). Além disso, em cepas
resistentes é observada a ausência de atividade da enzima sulfotransferase, impedindo a
ativação do fármaco (DOENHOFF et al., 2009).
1.1.4.3. Novos candidatos ao controle da esquistossomose
O uso disseminado de PZQ no tratamento de esquistossomose associado aos casos
frequentes de reinfecção traz preocupações quanto ao desenvolvimento de resistência do
parasito à terapia, como já foi observado em certas regiões endêmicas. Tal fato tem
impulsionado a busca e o desenvolvimento de novos fármacos esquistossomicidas
(LOUKAS; BETHONY, 2008). Atualmente, há uma variedade de fármacos em fase pré-
clínica (Tabela 1) como os 1,2,4-trioxolanos, o antimalárico cloroquina, derivados do
PZQ, antimaláricos derivados da artemisinina combinados com PZQ (trioxaquantéis), os
ácidos aminoalcanoetilsulfúricos, os oxadiazóis e o composto K11777 (MÜLLNER et al.,
2011). Há compostos em estudos clínicos (Tabela 1) como os derivados da artemisinina
(artesunato, arteméter) (UTZINGER et al., 2007), a mefloquina (estudos de fase II
concluídos) e Mirazid® (fitoterápico, desenvolvido no Egito, em estudos de fase III)
(NIH, 2012a, 2013).
Atualmente, duas vacinas estão em fase de estudos clínicos (Tabela 1): Bilhvax1a,
cujos estudos de fase I estão concluídos e sm14, em que estudos de fase I serão iniciados
(NIH, 2012b, 2012c). A vacina Bilhvax1a, desenvolvida para esquistossomose urinária, é
baseada na glutationa S-transferase recombinante de S. haematobium. Recentemente, esta
vacina foi testada por Riveau e colaboladores em 24 voluntários sadios do sexo
masculino. Os resultados indicaram que a vacina é capaz de gerar resposta imune e
apresenta bom perfil de segurança e tolerabilidade (RIVEAU et al., 2012). No Brasil,
pesquisadores da Fundação Oswaldo Cruz realizarão estudos clínicos de fase I para a
vacina sm14, desenvolvida contra S. mansoni. Atualmente, aguarda-se o início do
29
recrutamento de voluntários sadios para avaliação da imunogenicidade e segurança da
sm14 (NIH, 2012c).
Tabela 1 - Candidatos a fármacos esquistossomicidas, fitoterápicos e vacinas em estudos pré-
clínicos e clínicos.
Compostos Estrutura Química Fase Referência
1,2,4-trioxolanos
Pré-clínica
(XIAO et al.,
2007)
cloroquina
Pré-clínica
(OLIVEIRA et
al., 2004)
derivados do PZQ
Pré-clínica
(RONKETTI et
al., 2007)
trioxaquantéis
Pré-clínica
(LAURENT et
al., 2008)
ácidos
aminoalcanoetilsulfúricos
Pré-clínica
(MOREIRA et
al., 2007)
oxadiazóis
Pré-clínica
(SAYED et al.,
2008)
K11777
Pré-clínica
(ABDULLA et
al., 2007)
30
Tabela 1 (cont.) - Candidatos a fármacos esquistossomicidas, fitoterápicos e vacinas em
estudos pré-clínicos e clínicos.
Adaptado de MÜLLNER et al., 2011; NIH, 2012a-c; NIH, 2013.
1.2. Planejamento e descoberta de novos fármacos
A descoberta e o desenvolvimento de novos fármacos é um processo longo e
complexo que compreende várias etapas e custos elevados. Esse processo envolve a
integração de várias áreas estratégicas relacionadas à inovação, conhecimento, tecnologia,
gerenciamento e altos investimentos em Pesquisa e Desenvolvimento (P&D). (DIMASI;
HANSEN; GRABOWSKI, 2003; FERREIRA; OLIVA; ANDRICOPULO, 2011;
LOMBARDINO; LOWE, 2004). Os custos envolvidos em todas as etapas de
desenvolvimento de novos fármacos, na última década, variaram de US$ 200 milhões a
US$ 880 milhões, em alguns casos ultrapassando US$ 1 bilhão. Esse processo requer um
tempo médio de 13,5 anos de investimento em P&D (ADAMS; BRANTNER, 2006;
MORGAN et al., 2011; PAUL et al., 2010).
Compostos Estrutura Química Fase Referência
derivados da
artemisinina
Fase II
(UTZINGER et al.,
2007)
mefloquina
Fase II concluída
(VAN NASSAUW
et al., 2008)
Mirazid®
Fitoterápico
Fase III em
andamento
(NIH, 2012a)
Bilhvax1a
Vacina
Fase I concluída
(RIVEAU et al.,
2012)
sm14
Vacina
Fase I
(NIH, 2012c)
31
A gênese de fármacos pode ser dividida em duas grandes etapas: a descoberta
(pesquisa básica) e o desenvolvimento (ensaios pré-clínicos e clínicos) (Figura 5)
(ELEBRING; GILL; PLOWRIGHT, 2012; LOMBARDINO; LOWE, 2004).
Figura 5 - Etapas envolvidas na gênese de fármacos (Adaptado de NWAKA, RIDLEY,
2003).
A etapa de descoberta se inicia com a identificação de um potencial alvo
relacionado a determinado quadro clínico ou doença. Tal alvo geralmente consiste em
uma proteína (macromolécula), por exemplo, uma enzima, receptor ou transportador. É
importante que esse alvo seja validado, ou seja, que ele demonstre um papel importante no
processo fisiopatológico estudado. A validação de um alvo pode ser feita, por exemplo,
através de técnicas que bloqueiam a expressão de genes que o codificam (knock out),
observando a influência, no processo fisiopatológico, da não expressão desses genes. Em
doenças infecciosas e parasitárias a validação do alvo consiste em se avaliar o impacto da
não expressão de determinado gene na sobrevivência do agente etiológico (ELEBRING;
GILL; PLOWRIGHT, 2012; GASHAW et al., 2011; HUGHES et al., 2011; NWAKA;
HUDSON, 2006).
Uma vez definido o alvo, estudos são realizados para se buscar novos compostos
ligantes (hits) que sejam capazes de modular in vitro a atividade do alvo selecionado. Os
hits, que podem ser de origem natural ou sintética, podem ser identificados a partir de
triagens experimentais (biológicas, bioquímicas), virtuais (computacionais) ou por meio
de planejamento racional. Um exemplo de triagem experimental é a triagem biológica
automatizada em alta escala (HTS, do inglês High Throughput Screening). Nos estudos
computacionais destacam-se as estratégias de organização de bases de dados, aplicação de
filtros para seleção dos compostos mais promissores e triagem virtual (VS, do inglês
Virtual Screening). Os hits devem ser otimizados em relação às propriedades
farmacodinâmicas (potência, afinidade, seletividade) e farmacocinéticas (absorção,
metabolismo, biodisponibilidade). Os compostos otimizados são então selecionados como
compostos líderes (DUFFY et al., 2012; GUIDO; OLIVA; ANDRICOPULO, 2008).
Durante a otimização de compostos líderes, estudos da relação entre a estrutura e
32
atividade (SAR, do inglês Structure-Activity Relationships) e da relação quantitativa entre
a estrutura e atividade (QSAR, do inglês Quantitative Structure-Activity Relationships) são
realizados com o intuito de se obter informações que possam guiar o desenvolvimento de
análogos com propriedades otimizadas. Além disso, a potência e as propriedades ADMET
(absorção, distribuição, metabolismo, excreção e toxicidade) são aprimoradas através da
modulação de certas propriedades físico-químicas importantes (lipofilicidade,
solubilidade, permeabilidade). Finalmente são obtidas novas entidades químicas (NCE, do
inglês New Chemical Entities), ou seja, novos candidatos a fármacos que serão
submetidos a estudos pré-clinicos e clínicos (CRAMER, 2012; ELEBRING; GILL;
PLOWRIGHT, 2012; NWAKA; RIDLEY, 2003).
A etapa de desenvolvimento compreende os estudos pré-clínicos e clínicos. Nos
estudos pré-clínicos, são realizados estudos in vivo em animais com objetivo de se avaliar
a segurança dos novos candidatos a fármacos. Além disso, estudos de formulação são
conduzidos. Os estudos clínicos compreendem os testes em seres humanos e podem ser
divididos em três fases. Na fase I, os candidatos a fármacos, que apresentaram resultados
promissores nos estudos pré-clínicos, são testados em um pequeno grupo de voluntários
sadios. O objetivo dessa fase é estabelecer doses seguras e obter mais informações a
respeito do perfil de ADMET dos compostos. Os estudos de fase II são realizados em
indivíduos portadores da doença ou quadro clínico investigado. O objetivo dos estudos é
obter informações sobre a segurança e resultados preliminares de eficácia. Nessa fase, é
recrutado um número maior de indivíduos que na fase I. Os estudos de fase III consistem
em testes em larga escala, utilizando um número ainda maior de indivíduos. Nesse
momento, a eficácia do candidato a fármaco é estabelecida e os efeitos adversos menos
comuns são observados. Uma vez que informações suficientes a respeito da potência e
eficácia do novo candidato a fármaco são obtidas, os resultados são submetidos a um
órgão regulador para que o novo fármaco possa ser aprovado e comercializado. Uma vez
no mercado, estudos de farmacovigilância, ou estudos de fase IV, são realizados para
monitoramento do novo fármaco na população geral. Uma vez que a amostragem de
indivíduos é muito mais ampla nessa fase e o tempo de estudo é maior, possíveis
problemas não detectados em fases anteriores podem aparecer, o que pode culminar com a
retirada do fármaco do mercado ou proscrição (DIMASI; HANSEN; GRABOWSKI,
2003; LOMBARDINO; LOWE, 2004).
33
1.3. Química Medicinal e planejamento de fármacos
Segundo a União Internacional de Química Pura e Aplicada (IUPAC, do inglês
International Union of Pure and Applied Chemistry), a Química Medicinal é uma
disciplina baseada na química e que integra diversas áreas do conhecimento, envolvendo
aspectos das ciências biológicas, médicas e farmacêuticas, cujo objetivo é a invenção,
descoberta, planejamento, identificação e preparação de compostos biologicamente ativos,
além do estudo e interpretação do seu modo de interação a nível molecular, seu
metabolismo e das relações entre a estrutura química e atividade biológica (WERMUTH
et al., 1998).
A Química Medicinal está inserida em praticamente todo o processo de descoberta
e desenvolvimento de novos fármacos, desde o projeto inicial até a aprovação de um novo
fármaco (LOMBARDINO; LOWE, 2004). Diversas estratégias da Química Medicinal
podem ser utilizadas nesse processo, dentre elas destaca-se o planejamento de fármacos
auxiliado por computador (CADD, do inglês Computer-Aided/Assisted Drug Design). O
uso de métodos computacionais, atualmente, permeia todos os aspectos da descoberta de
fármacos e apresenta a vantagem de auxiliar na identificação de candidatos a fármacos de
forma mais rápida e com custos reduzidos. Tal expansão se deve aos grandes avanços
obtidos, nas últimas décadas, nas áreas de software e hardware. Somados a esses avanços,
também se destaca o crescimento experimentado pelas áreas de genômica e proteômica,
que permitiu o acesso a um grande número de informações estruturais de alvos biológicos.
Estima-se que, em 2006, houve um aumento de aproximadamente 7% no número de
estruturas únicas de proteínas depositadas no PDB (do inglês Protein Data Bank) e que
1000 novas estruturas sejam depositadas a cada ano (BAJORATH, 2012; DUFFY et al.,
2012; GUIDO; OLIVA; ANDRICOPULO, 2011; JORGENSEN, 2004; KAPETANOVIC,
2008; TALELE; KHEDKAR; RIGBY, 2010; WEIGELT et al., 2008).
Diferentes abordagens podem ser utilizadas para o planejamento de novos
candidatos a fármacos, dependendo do nível de conhecimento que se tem do alvo
terapêutico escolhido. Quando a estrutura do alvo macromolecular ou do complexo
ligante-receptor estão disponíveis, pode ser usada a estratégia de planejamento de
fármacos baseada na estrutura (SBDD, do inglês Structure-Based Drug Design).
Entretanto, quando a estrutura do alvo não é conhecida, métodos de planejamento
baseados no ligante (LBDD, do inglês Ligand-Based Drug Design) são utilizados. Em
muitos casos, o uso combinado das duas estratégias SBDD e LBDD, pode ser útil no
34
processo de descoberta de novos fármacos, gerando informações adicionais fruto do
sinergismo entre as duas abordagens (COHEN, 1996; GUIDO; ANDRICOPULO;
OLIVA, 2010; GUIDO; OLIVA; ANDRICOPULO, 2011; JORGENSEN, 2004).
1.3.1. Relações Quantitativas entre a Estrutura e Atividade (QSAR)
A estratégia de QSAR é baseada no conceito de que diferenças observadas na
atividade biológica de compostos podem ser correlacionadas quantitativamente com
mudanças na estrutura molecular e parâmetros físico-químicos. Em um estudo de QSAR, a
atividade biológica ou a propriedade que se deseja modelar é tratada como variável
dependente e é correlacionada com descritores moleculares, que são as variáveis
independentes, através de métodos de regressão. O objetivo é a obtenção de modelos
capazes de predizer a atividade biológica de compostos relacionados, os quais não foram
usados na construção dos modelos. Além disso, os resultados de QSAR trazem
informações que podem guiar posteriores modificações moleculares em compostos
protótipos, com intuito de se obter análogos mais potentes e com propriedades físico-
químicas otimizadas (ALBUQUERQUE et al., 2007; DUDEK; ARODZ; GÁLVEZ, 2006;
KUBINYI, 1993).
Em estudos de QSAR, alguns critérios devem ser observados para se obter
resultados confiáveis e reprodutíveis. Um aspecto importante é a qualidade dos dados
experimentais utilizados na construção dos modelos. Os compostos devem ser testados
sob as mesmas condições experimentais, em um mesmo local, permitindo a comparação
direta dos dados obtidos. O conhecimento da origem e da forma como os dados foram
obtidos é importante em QSAR. Os dados de atividade biológica podem ser apresentados
como média de diversas medidas repetidas (replicatas), as quais devem apresentar sinais
de uma distribuição normal, indicando a ausência de erro sistemático durante as medidas.
A diferença entre a maior e menor medida de atividade biológica deve estar no mínimo
entre 3 ou 4 ordens de grandeza em escala logarítmica. Além disso, as moléculas devem
cobrir toda a faixa de atividade biológica e apresentar um esqueleto comum (DEARDEN;
CRONIN; KAISER, 2009; SCIOR et al., 2009).
Um estudo de QSAR deve atender aos seguintes critérios: (i) possuir um endpoint
(dado biológico) definido; (ii) utilizar algoritmos não ambíguos; (iii) possuir um domínio
35
de aplicabilidade definido; (iv) ser validado utilizando medidas apropriadas de robustez e
preditividade; (v) permitir uma interpretação mecanística, se possível (OECD, 2007).
Desde as contribuições de Hansch e Fujita, nos anos 60, diferentes abordagens de
QSAR foram desenvolvidas e atualmente há uma grande variedade de métodos de QSAR
aplicados à descoberta deNCEs. De acordo com o número de dimensões consideradas no
cálculo dos descritores moleculares, os métodos de QSAR podem ser divididos em QSAR
clássico (2D), QSAR tridimensional (QSAR-3D) e QSAR multidimensional (4D, 5D, 6D).
No QSAR clássico, são calculados descritores relacionados a parâmetros físico-
químicos e descritores derivados de estruturas moleculares bidimensionais (QSAR-2D), ou
seja, que não dependem da orientação tridimensional dos compostos (HANSCH; FUJITA,
1964). Em contrapartida, os métodos de QSAR-3D utilizam descritores que dependem da
conformação tridimensional dos compostos. Os estudos de QSAR-3D podem ser
dependentes do receptor (QSAR-3D-RD, do inglês Receptor Dependent) ou indepententes
do receptor (QSAR-3D-RI, do inglês Receptor Independent). Métodos de QSAR-3D-RD
são baseados na estrutura tridimensional do complexo ligante-receptor. Métodos de
QSAR-3D-RI são baseados apenas na estrutura tridimensional dos compostos. Dentre os
métodos de QSAR-3D-RI, se destacam os baseados em farmacóforos, os baseados na
forma (shape-based) e aqueles baseados em campos moleculares (ALBUQUERQUE et
al., 2007; CLARK, 2009; HOPFINGER et al., 1997; VERMA; KHEDKAR; COUTINHO,
2010). Os avanços em hardware e software, nos anos 80, permitiram que diversos
métodos de QSAR-3D fossem desenvolvidos (COHEN, 1996). Um exemplo é o método
de Análise Comparativa de Campos Moleculares (CoMFA, do inglês Comparative
Molecular Field Analysis) (CRAMER; PATTERSON; BUNCE, 1988). Nas décadas
seguintes, métodos que adicionaram outras dimensões ao QSAR-3D foram desenvolvidos,
como o método proposto por Hopfinger e colaboradores que inclui, além das três
dimensões, múltiplas conformações dos ligantes como a quarta dimensão (4D)
(HOPFINGER et al., 1997). Outros exemplos são os métodos desenvolvidos por Vedani e
colaboradores, com os múltiplos confôrmeros, orientações e estados de protonação
considerados como a quarta dimensão (4D) (VEDANI et al., 2000), modelos de encaixe
induzido como a quinta dimensão (5D) (VEDANI et al., 2005) e múltiplos modelos de
solvatação como a sexta dimensão (6D) (VEDANI; DOBLER; LILL, 2005).
36
1.3.1.1. Holograma QSAR (HQSAR)
O HQSAR é uma método de QSAR-2D baseado em fragmentos moleculares que não
requer informação explícita sobre a estrutura tridimensional dos compostos e não depende
do cálculo e seleção de descritores físico-químicos. Cada molécula utilizada na construção
do modelo é fragmentada, dando origem a diversos fragmentos estruturais que são
organizados em hologramas moleculares, os quais são formados por diversas caixas
(bins). Esses hologramas são semelhantes a “impressões digitais” moleculares
(fingerprints). Entretanto, nos fingerprints a representação é binária (indica presença ou
ausência de determinado fragmento) e nos hologramas moleculares cada bin contém a
informação do número de vezes que determinado fragmento se repete (LOWIS, 1997;
SALUM; ANDRICOPULO, 2009; SEEL; TURNER; WILLETT, 1999). As informações
codificadas nos hologramas moleculares são tratadas como variáveis independentes, as
quais são correlacionadas com a atividade biológica (variável dependente), através do
método de regressão por mínimos quadrados parciais (PLS, do inglês Partial Least
Squares) (LINDBERG; PERSSON; WOLD, 1983; SEEL; TURNER; WILLETT, 1999;
WOLD; SJÖSTRÖM; ERIKSSON, 2001). Como resultado, é gerada a equação de
HQSAR, a qual é usada para predizer a atividade biológica de compostos estruturalmente
relacionados que não participaram da construção do modelo. Os resultados de uma análise
de HQSAR podem ser representados graficamente através de mapas de contribuição, que
consistem em esquemas de cores aplicados aos átomos de cada estrutura, indicando a
contribuição de cada átomo para atividade biológica (SEEL; TURNER; WILLETT,
1999). Apesar de ser um método de QSAR-2D, informações tridimensionais podem ser
codificadas nos hologramas moleculares, tais como hibridação e quiralidade (SALUM;
ANDRICOPULO, 2009). A figura 6 mostra o esquema geral da construção de um modelo
HQSAR.
37
Figura 6 - Esquema das etapas envolvidas na geração dos hologramas moleculares e dos
modelos HQSAR.
Em um estudo de HQSAR, alguns parâmetros que podem ser definidos pelo
usuário podem afetar a qualidade dos modelos, tais como: o comprimento de holograma, o
tamanho de fragmento e a distinção de fragmentos. O comprimento de holograma define a
quantidade de bins que serão usados na geração do modelo. O tamanho de fragmento
define a quantidade mínima e máxima de átomos que cada fragmento deve conter. A
distinção de fragmentos indica quais parâmetros serão usados na construção dos
hologramas moleculares, ou seja, que características moleculares serão levadas em conta
para diferenciação entre os fragmentos (LOWIS, 1997; SEEL; TURNER; WILLETT,
1999; TRIPOS, 2010a). A tabela 2 indica os parâmetros de distinção de fragmentos
disponíveis no método de HQSAR.
Em determinados casos, em que a quantidade de fragmentos é maior que o
comprimento de holograma, pode ocorrer o fenômeno de colisão de fragmentos. Este
fenômeno consiste em alocar fragmentos diferentes em um mesmo bin, podendo levar à
perda de informações importantes que acabam não sendo captadas pelo método de
regressão por PLS. Entretanto, para que a colisão de fragmentos não se perpetue à medida
que se aumenta o comprimento de holograma, todos os comprimentos disponíveis devem
ser números primos (SALUM; ANDRICOPULO, 2009; SEEL; TURNER; WILLETT,
1999; TRIPOS, 2010a).
38
Tabela 2 - Parâmetros de distinção de fragmentos no método HQSAR.
Parâmetros Definição
Átomo (A) Tipos de átomos
Ligação (B)* Tipos de ligação química (simples, dupla, tripla e aromática)
Conectividade (C)* Hibridação dos átomos contidos no fragmento
Hidrogênio (H) Presença e número de átomos de hidrogênio
Quiralidade (Ch) Presença de centros estereogênicos
Doador e aceptor (DA) Presença de átomos aceptores ou doadores de ligação de
hidrogênio
* Parâmetros semelhantes. Ao incluir o parâmetro Ligação (B), porém, a vizinhança dos átomos é levada
em consideração, o que permite distinguir fragmentos que possuam o mesmo tipo de hibridação, mas
estejam localizados em diferentes ambientes químicos. Por exemplo, H-C=C-H (etileno) e H-C:C-H
(benzeno). Neste caso ambos os átomos de carbono possuem hibridização sp². O que os diferencia é que no
etileno a ligação é dupla e no benzeno a ligação é aromática.
1.3.1.2. Análise Comparativa de Campos Moleculares (CoMFA)
A Análise Comparativa de Campos Moleculares (CoMFA, do inglês Comparative
Molecular Field Analysis) é um método de QSAR-3D, o qual foi introduzido por Cramer e
colaboradores em 1988. Esse método é baseado no princípio de que as interações não-
covalentes entre os ligantes e o sítio ativo do alvo macromolecular, especialmente as
interações estéricas e eletrostáticas, são importantes para explicar determinado efeito
biológico. Portanto, o cálculo de campos de interação moleculares (MIFs, do inglês
Molecular Interaction Fields) ao redor de uma série de ligantes pode fornecer
informações importantes a respeito de sua atividade biológica (CRAMER; PATTERSON;
BUNCE, 1988).
O primeiro passo em um estudo de CoMFA, como em todo estudo de QSAR, é a
escolha de compostos quimicamente relacionados, ou seja, que possuam um farmacóforo
em comum, que se liguem ao mesmo alvo e atuem por um mesmo mecanismo de ação.
Portanto, a estrutura tridimensional dos compostos deve ser gerada e os confôrmeros de
menor energia, de cada composto (provável conformação bioativa) são escolhidos. É
realizado o cálculo de cargas atômicas parciais para todos os compostos e os mesmos são
alinhados para que seja representada a provável conformação bioativa dos compostos,
sendo esta etapa crucial em um estudo de CoMFA. O alinhamento molecular se apoia no
princípio de que moléculas que possuem um farmacóforo comum apresentam modos de
39
ligação ao alvo biológico semelhantes (KUBINYI, 1997). As estruturas alinhadas são
colocadas em uma caixa tridimensional reticulada, com espaçamento entre os vértices
definido pelo usuário (normalmente de 0,5 a 2 Å). Os MIFs, representados pelos campos
estéricos (potencial Lennard-Jones) e eletrostáticos (potencial de Coulomb) são
calculados, em cada ponto de intersecção da grade, entre um átomo de prova e as
moléculas alinhadas. As energias de interação obtidas são usadas como descritores e
armazenadas em uma matriz em que cada linha corresponde a um composto do conjunto
de dados e cada coluna o valor da energia de interação (estérica e eletrostática), em
kcal/mol em determinado ponto da caixa reticulada. Os dados de atividade biológica são
armazenados em uma coluna que deve ser correlacionada com a matriz de descritores
(CRAMER; PATTERSON; BUNCE, 1988). Entretanto, o número de colunas na matriz de
descritores é muito maior que o número de linhas, tornando difícil a correlação entre a
atividade biológica e as energias de interação através de uma regressão linear
convencional. Portanto, é utilizado o método de regressão por PLS (LINDBERG;
PERSSON; WOLD, 1983; WOLD; SJÖSTRÖM; ERIKSSON, 2001).
O PLS é baseado no cálculo de variáveis latentes, as quais são combinações
lineares dos descritores originais (energias de interação calculadas) e também ortogonais
entre si, ou seja, cada variável codifica informações diferentes. Em outras palavras, a
regressão por PLS é baseada na projeção da matriz dos descritores originais e as novas
coordenadas resultantes são usadas como variáveis independentes na construção do
modelo de QSAR-3D. Esse procedimento reduz o número de variáveis (descritores)
evitando superajuste do modelo (overfitting). Portanto, cada componente da análise por
PLS é uma regressão que correlaciona parte da atividade biológica com uma variável
latente (HASEGAWA; FUNATSU, 2012; STANTON, 2012; WOLD; SJÖSTRÖM;
ERIKSSON, 2001). A figura 7 apresenta o esquema geral da geração de um modelo de
CoMFA.
Os resultados de um estudo de CoMFA podem ser representados graficamente
através dos mapas de contorno, os quais indicam pontos da grade reticulada onde
variações de energia estão relacionadas com variações na atividade biológica. Esses
mapas podem ser usados para estimar as regiões das moléculas onde alguns tipos de
interações estéricas e eletrostáticas têm influência favorável ou desfavorável na atividade
biológica. A interpretação desses mapas pode ser útil para guiar o planejamento de
40
análogos mais potentes e desenvolvimento de novas moléculas (CRAMER;
PATTERSON; BUNCE, 1988; KUBINYI, 1997).
Figura 7 - Etapas envolvidas na geração de modelos CoMFA.
1.3.1.3. Análise Comparativa dos Índices de Similaridade Molecular (CoMSIA)
A Análise Comparativa dos Índices de Similaridade Molecular (CoMSIA, do inglês
Comparative Molecular Similarity Analysis) é outro método de QSAR-3D bastante
utilizado. Ao contrário do método de CoMFA, em que apenas os potenciais de Lennard-
Jones e de Coulomb são considerados, o método de CoMSIA acrescenta os campos
hidrofóbicos e de ligação de hidrogênio. Os potenciais de Lennard-Jones e Coulomb,
descrevem as contribuições energéticas da constante de ligação do complexo ligante-
receptor. Entretanto, esses dois potenciais não descrevem bem as contribuições entrópicas,
relacionadas à dessolvatação, o que é possível acrescentando-se os campos hidrofóbicos.
Além dos campos hidrofóbicos, o método de CoMSIA utiliza campos moleculares que
descrevem as propriedades de doadores e aceptores de ligação de hidrogênio (KLEBE;
ABRAHAM; MIETZNER, 1994).
No método de CoMSIA, semelhantemente ao CoMFA, as moléculas devem estar
previamente na conformação de menor energia, com as cargas parciais calculadas e com
as estruturas alinhadas. As moléculas são inseridas em uma caixa tridimensional
41
reticulada, onde cada ponto de intersecção é percorrido por um átomo de prova, o qual é
usado para o cálculo dos índices de similaridade molecular. Os índices de similaridade,
obtidos em cada ponto de intersecção, são armazenados em uma matriz em que cada
coluna indica o índice calculado entre as moléculas e o átomo de prova. É utilizado o
método de regressão por PLS, em que as variáveis latentes resultantes são correlacionadas
com a atividade biológica (KLEBE; ABRAHAM; MIETZNER, 1994).
Assim como em CoMFA, os resultados podem ser representados graficamente
através de mapas de contorno. Entretanto, os mapas de contorno obtidos em CoMSIA, são
mais suaves e interpretáveis, pois não apresentam cortes abruptos de energia (KLEBE;
ABRAHAM, 1999). Isso ocorre, pois no método de CoMSIA é utilizada uma função do
tipo gaussiana, que ao contrário dos potenciais de Lennard-Jones e Coulomb, não
apresenta variações abruptas de energia em regiões próximas ao raio de van der Waals dos
átomos. Como consequência, o método CoMSIA é menos sensível ao alinhamento (Figura
8) (KLEBE; ABRAHAM; MIETZNER, 1994).
Figura 8 – Comparação entre os potenciais de Lennard-Jones e de Coulomb (CoMFA) e a
função Gaussiana (CoMSIA). Em CoMFA, pequenas variações na distância (r) podem
provocar variações muito grandes de energia (Adaptado de KUBINYI, 1997).
42
1.4. Bases Moleculares para o planejamento de novos fármacos esquistossomicidas
Os avanços da genômica e proteômica nas últimas décadas, aliados aos avanços na
bioinformática e nos métodos de elucidação estrutural como cristalografia de raios-x e
ressonância magnética nuclear (RMN), possibilitaram uma expansão no conhecimento de
alvos moleculares. O conhecimento dos alvos e das vias metabólicas possibilita o
planejamento de novos candidatos a fármacos através de várias estratégias de CADD
(COHEN, 1996; JORGENSEN, 2004).
O sequenciamento completo do genoma de S. mansoni, em 2012, abriu novas
possibilidades na busca de alvos moleculares. Além disso, os dados do genoma trazem
informações importantes na exploração das diferenças entre as vias metabólicas do
parasito e do hospedeiro (ANGELUCCI et al., 2011; PROTASIO et al., 2012).
1.4.1. Tioredoxina Glutationa Redutase de Schistosoma mansoni (SmTGR)
S. mansoni pode sobreviver por décadas nas veias mesentéricas de indivíduos
infectados. A sobrevivência nos vasos sanguíneos, um ambiente aeróbio, exige que o
parasito desenvolva mecanismos de proteção contra espécies reativas de oxigênio (ROS,
do inglês Reactive Oxygen Species) produzidas pelo sistema imune do hospedeiro. Na
maioria dos eucariotos, dois sistemas principais participam da proteção contra ROS: um é
baseado no tripeptídeo glutationa (GSH) e outro baseado na proteína tioredoxina (Trx).
Nos dois sistemas, equivalentes redutores são fornecidos por NADPH através das enzimas
glutationa redutase (GR) e tioredoxina redutase (TrxR). Essas enzimas transferem elétrons
para seus respectivos carreadores, a glutationa dissulfeto (GSSG) e a tioredoxina oxidada
(Trx-S2). Portanto, esses carreadores são convertidos em GSH e tioredoxina reduzida
(Trx-[SH]2). O GSH e a Trx-[SH]2 fornecem equivalentes redutores para várias reações,
incluindo aquelas relacionadas à proteção contra ROS (ANGELUCCI et al., 2010;
KUNTZ et al., 2007).
No S. mansoni, as enzimas GR e TrxR são substituídas por uma única enzima
multifuncional, chamada tioredoxina glutationa redutase (SmTGR) (Figura 9). Esta é uma
enzima capaz de reduzir não apenas GSSG e Trx-S2, mas compostos como H2O2
(HUANG et al., 2011; KUNTZ et al., 2007).
43
Figura 9 - Enzimas tioredoxina redutase e glutationa redutase envolvidas na proteção
contra espécies reativas de oxigênio na maioria dos eucariotos (A) e a enzima tioredoxina
glutationa redutase que desempenha essa função no Schistosoma mansoni (B) (Adaptado
de Kuntz et al., 2007).
A SmTGR é uma flavoproteína homodimérica, na qual cada monômero apresenta
componentes do domínio TrxR e do domínio Grx. O domínio TrxR é composto de
resíduos de ambos monômeros: FAD; o par Cys-154/Cys159 proveniente de um
monômero; o par Cys-596’/Sec-597’ proveniente do outro monômero. Este último par se
encontra na extremidade C-terminal de cada monômero. O domínio Grx contém o par
Cys-28/Cys-31. Através de Cys-28/Cys-31 e de Cys-596’/Sec-597’, a SmTGR catalisa a
redução de uma variedade de substratos por NADPH. A SmTGR é uma selenoproteína,
pois possui um resíduo de selenocisteína (Sec) na sua extremidade C-terminal. A Sec é
uma cisteína onde o átomo de enxofre é substituído por um átomo de selênio
(ANGELUCCI et al., 2010; HUANG et al., 2011). A Figura 10 mostra a estrutura da
SmTGR.
O mecanismo catalítico proposto para a enzima SmTGR pode ser descrito da
seguinte forma: equivalentes redutores presentes no NADPH são transferidos para o FAD,
o qual os transfere para um par de cisteínas (Cys-154/Cys159) adjacentes ao FAD. Os
equivalentes redutores continuam sendo transferidos e chegam ao par Cys-596’/Sec-597’,
44
e se necessário, são transferidos para o par de cisteínas Cys-28/Cys-31. Os resíduos Cys-
596’/Sec-597’, localizados na cauda C-terminal, apresentam alta mobilidade para aceitar
os elétrons de Cys-154/Cys-159 e doar pares de elétrons para Trx ou para extreminade N-
terminal Cys-28/Cys-31 (domínio Grx) (HUANG et al., 2011). A presença de um resíduo
de selenocisteína, na extremidade C-terminal, confere uma alta reatividade a essa região.
Selenocisteínas são mais reativas que cisteínas e apresentam um menor pKa (trê ordens de
grandeza menor). Portanto, as selenocisteínas são nucleófilos mais fortes que as cisteínas,
o que demonstra o papel essencial desse tipo de resíduo na atividade catalítica de enzimas
que participam de reações de oxi-redução (JOHANSSON; GAFVELIN; ARNÉR, 2005;
NAUSER; STEINMANN; KOPPENOL, 2012).
A SmTGR é uma enzima vital para manutenção do equilíbrio redox do parasito.
Estudos de validação dessa enzima, como alvo de novos fármacos esquistossomicidas, já
foram realizados. O silenciamento da SmTGR através de RNA interferente (iRNA) foi
capaz de causar a morte do parasito. Além disso, estudos de HTS identificaram inibidores
dessa enzima capazes de diminuir a carga parasitária em camundongos (HUANG et al.,
2011; KUNTZ et al., 2007). A SmTGR é portanto, um alvo validado para o planejamento
de novos agentes esquistossomicidas.
Nos mamíferos, a tioredoxina glutationa redutase (TGR) é somente encontrada em
abundância nos testículos, após a puberdade, sendo menos expressa em outros órgãos. Sua
função pode estar relacionada à isomerização de ligações dissulfeto de proteínas que
formam componentes estruturais dos espermatozoides, ou seja, atua em uma função
diferente da observada em Schistosoma mansoni (SU et al., 2005). A TGR de mamíferos,
assim como a SmTGR, apresenta um resíduo Sec em sua extremidade C-terminal.
Entretanto, diferenças entre as duas enzimas são observadas na porção N-terminal
(domínio Grx). Enquanto a SmTGR possui dois resíduos de cistéina no domínio N-
terminal, a TGR de mamíferos possui apenas um resíduo de cisteína. As duas enzimas
apresentam identidade sequencial de 54% (PRAST-NIELSEN; HUANG; WILLIAMS,
2011).
45
Figura 10 - Estrutura da SmTGR (PDB ID: 2V6O) (ANGELUCCI et al., 2008). A alça C-
terminal flexível de um monômero fornece elétrons para os domínios Trx e Grx do outro
monômero (adaptado de SACCOCCIA et al., 2012).
1.4.2. Oxadiazóis-2-óxidos
Os oxadiazóis-2-óxidos são compostos capazes de inibir a enzima SmTGR, como
foi demonstrado em ensaios de HTS (SAYED et al., 2008; SIMEONOV et al., 2008).
Além disso, a partir de ensaios com GR humana e TrxR de ratos, foi demonstrada baixa
ou nenhuma afinidade dos oxadiazóis-2-óxidos por essas enzimas, indicando seletividade
desses inibidores para a enzima SmTGR (RAI et al., 2009; SAYED et al., 2008). Dentre as
moléculas selecionadas, o furoxano (Figura 11), em baixas concentrações, foi capaz de
causar a morte de S.mansoni desde as formas mais jovens até a forma adulta. Com base
nesses resultados, estudos in vivo foram realizados em camundongos infectados por S.
mansoni. Nesses estudos, foi observada significativa redução da carga parasitária, além de
redução da hepatomegalia e esplenomegalia em todas as fases do ciclo de vida do parasito
(RAI et al., 2009). Sayed e colaboradores realizaram estudos de citotoxicidade do
furoxano frente a células de mieloma de camundongos da linhagem SP2/0. Em
concentrações de 25 M de furoxano e PZQ, a viabilidade das células foi de 54% e 62%,
respectivamente (SAYED et al., 2008).
46
Figura 11 – Estrutura química do furoxano (A) e estrutura do anel 1,2,5-oxadiazol-2-
óxido (anel oxadiazólico) (B) presente em todos compostos da série de inibidores da
tioredoxina glutationa redutase de S. mansoni.
Os oxadiazóis-2-óxidos são compostos com capacidade de liberar óxido nítrico
(NO), quando incubados em solução fisiológica na presença de tióis. Como resultado, é
observada a presença de nitrosotióis na solução, resultado da S-nitrosilação que ocorre
durante a reação (FEELISCH; SCHÖNAFINGER; NOACK, 1992; GASCO et al., 2004).
A SmTGR possui em sua estrutura 13 resíduos de cisteína e um resíduo de selenocistéina.
Consequentemente, a S-nitrosilação foi observada nos ensaios de inibição de SmTGR por
oxadiazóis-2-óxidos, indicando que além de serem capazes de inibir a enzima, esses
compostos liberam NO, uma molécula com conhecida atividade antiparasitária (RAI et al.,
2009; RIVERO, 2006).
47
2. JUSTIFICATIVA
A terapia da esquistossomose, utilizando apenas um fármaco, somada aos
inúmeros casos de reinfecção em áreas endêmicas, traz preocupações quanto ao
aparecimento de cepas resistentes ao PZQ. Relatos de cepas menos sensíveis ao
tratamento com PZQ em determinados países, aliados a experimentos laboratoriais que
demonstram a capacidade de desenvolvimento de resistência desse parasito, tornam a
busca de novos fármacos esquistossomicidas uma necessidade premente.
Os avanços na área de genética e bioinformática permitiram o sequenciamento e
análise do genoma de S. mansoni. O entendimento da bioquímica do parasito e de seus
mecanismos de evasão do sistema imune do hospedeiro permitiram a identificação de
alvos moleculares importantes, como a enzima multifuncional SmTGR, um alvo validado
que participa da proteção do parasito contra ROS.
A SmTGR é uma enzima vital para manutenção do equilíbrio redox do parasito.
Estudos de validação dessa enzima como alvo de novos fármacos esquistossomicidas
foram realizados através de silenciamento por RNA interferente (iRNA). Além disso,
estudos de HTS identificaram inibidores dessa enzima capazes de diminuir a carga
parasitária em camundongos (HUANG et al., 2011; KUNTZ et al., 2007). Ensaios in vitro
e in vivo foram realizados demonstrando que uma série de oxadiazóis-2-óxidos são
capazes de inibir a SmTGR, causando a morte do parasito (RAI et al., 2009; SAYED et
al., 2008). Esses compostos são potenciais doadores de NO, uma substância que apresenta
conhecida atividade antiparasitária (RIVERO, 2006).
Os dados experimentais de atividade biológica permitem a realização de estudos de
QSAR para a série de oxadiazóis-2-óxidos com a finalidade de se definir os requisitos
estruturais importantes para a atividade esquistossomicida. A partir das informações
obtidas no QSAR é possível planejar novos inibidores de SmTGR.
48
3. OBJETIVOS
3.1. Objetivo geral
Face ao exposto, o objetivo geral deste trabalho foi utilizar a série de oxadiazóis-2-
óxidos inibidores de SmTGR para a construção de modelos de QSAR-2D e QSAR-3D, com
a finalidade de se obter informações sobre o requisitos estruturais relevantes para a
atividade esquistossomicida e utilizá-las no planejamento de novos inibidores de SmTGR.
3.2. Objetivos específicos
Gerar modelos de QSAR com boa consistência interna e preditividade
externa a partir do método de HQSAR (QSAR-2D) e dos métodos de
CoMFA e CoMSIA (QSAR-3D)
Interpretar os mapas de contribuição e de contorno obtidos a partir dos
estudos de QSAR;
Nos estudos de QSAR-3D, utilizar dois métodos diferentes de cálculo de
cargas atômicas parciais (método empírico Gasteiger-Hückel e método
semi-empírico AM1-BCC) e duas estratégias diferentes de alinhamento
baseadas no ligante (alinhamento no ROCS e alinhamento no Surflex-Sim);
Planejar novos inibidores de SmTGR a partir de modificações moleculares
baseadas nas informações estruturais obtidas dos mapas de QSAR-2D e
QSAR-3D.
49
4. MATERIAL E MÉTODOS
4.1. Material
4.1.1. Computadores e softwares
Todos os estudos foram realizados em estações computacionais do Laboratório de
Modelagem Molecular (LabMol) na Faculdade de Farmácia da Universidade Federal de
Goiás, utilizando sistema operacional Linux. Os seguintes softwares foram utilizados:
SYBYL-X v.1.2 (Tripos, Inc., St. Louis, MO, USA), PICTO, QUACPAC v.1.5.0,
OMEGA v.2.4.6, ROCS v.3.1.2, BROOD v.2.0.0, VIDA v.4.1.2 (OpenEye Scientific
Software, Santa Fe, NM, USA) e PyMol v.1.3 (Schrödinger, LLC, New York, NY,
USA).
4.1.2. Conjunto de dados
Para a construção dos modelos de QSAR-2D e QSAR-3D, utilizou-se um conjunto
de 35 oxadiazóis-2-óxidos selecionados da literatura (RAI et al., 2009; SAYED et al.,
2008). A atividade biológica de todos os compostos foi determinada através de ensaios de
inibição da enzima SmTGR e expressa por valores de IC50 (concentração do composto
para que ocorra 50 % de inibição da enzima, potência). Os ensaios foram realizados
utilizando o mesmo protocolo experimental. Todos os valores de IC50 foram convertidos
para os valores correspondentes de pIC50 (-log IC50), os quais foram usados como
variáveis dependentes nas análises de QSAR. A figura 12 indica o gráfico de dispersão dos
valores de pIC50 calculados para os 35 oxadiazóis-2-óxidos. As estruturas químicas dos
compostos e seus respectivos valores de IC50 e pIC50 estão representados na Tabela 3.
Figura 12 - Gráfico de dispersão dos valores de pIC50 experimental para os compostos do
conjunto de dados.
50
Tabela 3 - Estruturas químicas, valores de IC50 e pIC50 dos inibidores de SmTGR.
Composto Estrutura R X IC50
(M)
pIC50
1
CN - 6,30 5,20
2 CH3 - 50,1 4,30
3 CH2OH - 11,2 4,95
4 CHO - 0,11 6,95
5 COOH - 0,63 6,20
6 CONH2 - 17,7 4,75
7
3-NO2 - 2,23 5,65
8 3-CF3 - 2,51 5,60
9 3-Br, 4-F - 2,81 5,55
10* 3-Br - 2,81 5,55
11 3-Cl - 3,54 5,45
12 4-Br - 3,54 5,45
13* 4-Cl - 4,07 5,39
14 4-CF3 - 7,07 5,15
15 3-OH - 7,07 5,15
16* 4-F - 7,94 5,10
17 2-OMe - 7,94 5,10
18 3,4,5-
OMe
- 8,91 5,05
19* 3-OMe - 8,91 5,05
20 4-OMe - 10,0 5,00
21 4-Me - 11,2 4,95
22 4-Ph - 15,8 4,80
23 4-OH - 18,1 4,74
24
-
-
0,040
7,39
25*
O
-
2,81
5,55
26
S
-
3,54
5,45
27
-
-
0,063
7,20
* Compostos selecionados para compor o conjunto teste
51
Tabela 3 (cont.) – Estruturas químicas, valores de IC50 e pIC50 dos inibidores de SmTGR.
* Compostos selecionados para compor o conjunto teste
4.2. Métodos
4.2.1. Construção das estruturas 3D, minimização de energia e cálculo de cargas
Os compostos do conjunto de dados foram inicialmente desenhados no programa
PICTO (OpenEye Scientific Software, Santa Fe, NM, USA) e salvos no formato
SMILES (.smi). Em seguida, as estruturas foram convertidas para o formato 3D utilizando
o programa OMEGA v.2.4.6 (OpenEye Scientific Software, Inc., Santa Fe, NM, USA),
que gera um grande número de conformações iniciais para cada composto a partir de um
banco de dados de fragmentos pré-calculados, em que cada átomo é incorporado
aleatoriamente no espaço cartesiano e otimizado pelo campo de força MMFF94
(HAWKINS et al., 2010).
Composto Estrutura R X IC50
(M)
pIC50
28
- 1,3-Ph 3,54 5,45
29 - 1,4-Ph 1,00 6,00
30 - 5-F-
1,3-Ph
0,47 6,32
31 - 2,5-
tiofeno
0,40 6,39
32* - 2,4-
tiofeno
0,35 6,45
33
-
-
0,038
7,42
34
-
-
1,28
5,89
35*
-
-
0,10
6,98
52
Foram empregados dois métodos diferentes para o cálculo das cargas atômicas
parciais: o método empírico Gasteiger-Hückel, disponível no programa SYBYL-X v.1.2
(Tripos, Inc., St. Louis, MO, USA) e o método semi-empírico AM1-BCC (JAKALIAN;
JACK; BAYLY, 2002; JAKALIAN et al., 1999), disponível no programa QUACPAC
v.1.5.0 (OpenEye Scientific Software, Inc., Santa Fe, NM, USA).
4.2.2. Divisão do conjunto de dados
Os 35 compostos do conjunto de dados foram divididos em conjunto treinamento e
conjunto teste, mantendo em ambos a diversidade estrutural e valores representativos de
toda a faixa de distribuição da potência (Figura 12). Durante a divisão, foram selecionados
28 compostos (80% do conjunto total) para compor o conjunto treinamento e 7 compostos
(20% do conjunto total) para compor o conjunto teste. Entretanto, durante a construção
dos modelos de QSAR-2D e QSAR-3D foram retiradas amostras atípicas (outliers),
alterando a proporção inicial entre os conjuntos teste e treinamento. Os compostos
selecionados para conjunto treinamento e conjunto teste estão indicados na Tabela 3.
4.2.3. QSAR-2D
4.2.3.1. HQSAR
O módulo de HQSAR da plataforma SYBYL-X v.1.2 (Tripos, Inc., St. Louis, MO,
USA) foi empregado na geração dos modelos de HQSAR para o conjunto de inibidores da
enzima SmTGR. Inicialmente, foram gerados modelos HQSAR utilizando todas as
moléculas do conjunto de dados, sem divisão entre treinamento e teste. Foram gerados
diversos modelos com diferentes parâmetros de distinção de fragmentos. Foi utilizado o
tamanho de fragmento padrão (4-7 átomos). Em seguida, a atividade biológica de todos os
compostos do conjunto de dados foi predita, obtendo-se o valor residual (diferença entre
atividade biológica experimental e predita). Assumindo um intervalo de confiança (IC) de
95%, todos os compostos que apresentaram valor residual duas vezes maior que o desvio-
padrão médio dos resíduos foram considerados outliers. Portanto, os modelos finais de
HQSAR foram gerados após a retirada dos outliers.
53
Após a seleção do conjunto treinamento, foram gerados modelos de HQSAR
variando diversos parâmetros que influenciam na geração de hologramas moleculares.
Foram variados os parâmetros de distinção de fragmentos, comprimento de holograma e
tamanho de fragmento. Foram gerados hologramas com diferentes combinações dos
seguintes parâmetros de distinção de fragmentos: átomos (A), ligação (B), conectividade
(C), átomos de hidrogênio (H), doadores e aceptores de ligação de hidrogênio (DA). Foi
utilizada uma série padrão de comprimentos de holograma (53, 59, 61, 71, 83, 97, 151,
199, 257, 307, 353, 401). Além disso, para se observar a influência do comprimento de
holograma nos modelos de HQSAR, foram gerados modelos com comprimentos maiores
(457 a 997). Diversos tamanhos mínimos e máximos de fragmentos (4-7, 5-8, 6-9, 7-10)
foram testados para se avaliar a influência do tamanho de fragmento nos modelos de
HQSAR.
As informações codificadas nos hologramas moleculares (variáveis independentes)
foram correlacionadas com os valores de atividade biológica (variável dependente) através
do método de regressão por PLS.
4.2.4. QSAR-3D
4.2.4.1 Alinhamento molecular
O alinhamento molecular é uma etapa crucial antes de se iniciar uma análise de
CoMFA. Nessa etapa, as moléculas são dispostas em uma mesma orientação no espaço
tridimensional de forma que representem a sua conformação bioativa.
Foram utilizadas duas estratégias de alinhamento baseadas no ligante: o
alinhamento obtido pelo programa ROCS (do inglês, Rapid Overlay of Chemical
Structures) (OpenEye Scientific Software, Inc., Santa Fe, NM, USA), que se baseia na
comparação entre os volumes e características moleculares (Shape-based), e o
alinhamento gerado pelo programa Surflex-Sim, disponível na plataforma SYBYL-X
v.1.2 (Tripos, Inc., St. Louis, MO, USA), que se baseia na similaridade morfológica.
No alinhamento pelo ROCS, os confôrmeros gerados previamente (seção 3.2.1)
foram sobrepostos a estrutura do composto mais potente do conjunto de dados (composto
33). Após cada sobreposição, os confôrmeros foram classificados a partir da função de
pontuação TanimotoCombo. Essa função de pontuação é uma combinação das funções
54
ShapeTanimoto (compara as moléculas baseando-se na melhor sobreposição dos volumes
moleculares) e ColorTanimoto (pontuação relacionada à sobreposição apropriada de
grupos com propriedades como doador de ligação de hidrogênio, aceptor de ligação de
hidrogênio, hidrofóbico, cátion, ânion e anel) (HAWKINS; SKILLMAN; NICHOLLS,
2007).
No alinhamento pelo Surflex-Sim, não foram gerados confôrmeros previamente.
Esse programa utiliza uma função de similaridade morfológica e técnicas rápidas para
geração de poses. A similaridade morfológica é definida como uma função gaussiana das
distâncias de duas moléculas em relação a pontos de observação uniformes de uma grade
(JAIN, 2004). Os compostos 24 e 33, que apresentavam maior potência, foram escolhidos
para definição do molde, sobre o qual os demais compostos do conjunto de dados seriam
sobrepostos. Em seguida, foi realizado o alinhamento flexível dos demais compostos do
conjunto de dados. O número máximo de poses geradas para cada molécula foi igual a 20.
Para cada composto, foi escolhida a pose com maior valor de similaridade com o molde.
4.2.4.2. CoMFA
Os modelos de CoMFA foram gerados na plataforma SYBYL-X v.1.2 (Tripos,
Inc., St. Louis, MO, USA). As moléculas alinhadas de acordo com cada estratégia foram
inseridas em uma caixa 3D reticulada, em que os campos estéricos (potencial de Lennard-
Jones) e eletrostáticos (potencial de Coulomb) foram calculados entre as moléculas e um
átomo de prova carregado positivamente, utilizando o campo de força Tripos (CLARK;
CRAMER III; VAN OPDENBOSCH, 1989). Foi utilizado nos cálculos um átomo de
prova que consistia em um átomo de carbono de hibridização sp3 (Csp
3) e carga +1,0. Foi
utilizado o valor de corte (cut-off) de energia igual a 30 kcal/mol.
Inicialmente, foi gerado um modelo utilizando todos os compostos do conjunto de
dados, sem divisão entre treinamento e teste. Em seguida, a atividade biológica de todos
os compostos do conjunto de dados foi predita, obtendo-se o valor residual. Assumindo
um intervalo de confiança (IC) de 95%, todos os compostos que apresentaram valor
residual duas vezes maior que o desvio-padrão médio dos resíduos foram considerados
outliers, os quais não foram inclusos nos modelos finais.
Os modelos finais foram gerados utilizando quatro diferentes espaçamentos entre
os vértices da caixa 3D reticulada (0,5; 1,0; 1,5; 2,0 Å). Foi utilizado o recurso de
focagem da região, através do método do coeficiente do desvio padrão (SDC, do inglês
Standard Deviation Coefficient), para que somente regiões com variações de energia
55
relevantes fossem consideradas na correlação com a atividade biológica. Foram
exploradas variações do SDC de 0,3 até 1,5. As energias de interação entre o átomo de
prova e as moléculas alinhadas em cada ponto da caixa 3D reticulada (variáveis
independentes) foram correlacionadas com a atividade biológica (variável dependente)
através do método de regressão por PLS. O número ótimo de variáveis latentes foi obtido
pela técnica de validação cruzada LOO (do inglês Leave-One-Out). A filtragem de coluna
adotada para a análise de PLS foi de 2,0 kcal/mol.
4.2.4.3. CoMSIA
Os modelos de CoMSIA foram gerados na plataforma SYBYL-X v.1.2 (Tripos,
Inc., St. Louis, MO, USA). Os modelos foram calculados com a mesma divisão entre
conjunto treinamento e teste usada no HQSAR e na análise de CoMFA. Os mesmos
outliers identificados na análise de CoMFA foram mantidos para a análise de CoMSIA.
As moléculas alinhadas de acordo com cada estratégia foram inseridas em uma
caixa 3D reticulada, na qual foram calculados os índices de similaridade molecular, em
cada intersecção, entre as moléculas e o átomo de prova. Além dos campos estéricos e
eletrostáticos, foram considerados os campos hidrofóbicos e doadores/aceptores de
ligação de hidrogênio. A análise foi feita utilizando-se um átomo de prova de raio igual a
1,0 Å e carga +1,0. Uma função do tipo gaussiana foi usada para descrever os termos
energéticos em função da distância entre o átomo de prova e as moléculas alinhadas. Foi
atribuído o valor de 0,3 ao fator de atenuação (), o qual descreve a inclinação da função
gaussiana.
4.2.5. Validação dos modelos de QSAR
4.2.5.1. Validação interna
A validação interna dos modelos foi realizada utilizando todos os compostos do
conjunto treinamento, através do método de validação cruzada LOO. Nesse método um
composto do conjunto treinamento é retirado e os demais são utilizados na construção de
um modelo, o qual é usado para predizer a atividade biológica do composto retirado. Esse
procedimento é repetido várias vezes até que todos os compostos do conjunto tenham sido
retirados e preditos pelo menos uma vez (PICARD; COOK, 1984; TRIPOS, 2010b). Os
resultados da validação cruzada foram expressos pelo coeficiente de correlação da
validação cruzada (q2).
56
Após a escolha dos melhores modelos de QSAR-2D e QSAR-3D, a estabilidade dos
mesmos foi avaliada através do método de validação cruzada LMO (do inglês, Leave-
Many-Out). Nesse método os compostos do conjunto treinamento são divididos em
subgrupos. Uma parte dos subgrupos é utilizada para construção de um modelo e um
subgrupo restante tem suas atividades biológicas preditas por esse modelo. Esse
procedimento é repetido várias vezes (número de rodadas), de acordo com a escolha do
usuário (BAUMANN, 2003; TRIPOS, 2010b). Nesse trabalho, a validação cruzada LMO
foi realizada utilizando 5 subgrupos, ou seja, a cada rodada o conjunto treinamento era
dividido em 5 grupos dos quais 4 (80%) eram utilizados para construção do modelo e o
grupo restante (20%) tinha a atividade biológica predita pelo modelo. O procedimento foi
realizado em 25 rodadas e o resultado final foi expresso pela média dos valores de q2
obtidos em cada rodada.
4.2.5.2. Validação externa
Na validação externa, os sete compostos do conjunto teste tiveram suas atividades
biológicas preditas pelos modelos gerados a partir do conjunto treinamento. Assumindo
um intervalo de confiança de 99%, todas as moléculas do conjunto teste que apresentaram
valor residual maior que o desvio padrão médio dos resíduos foram consideradas mal
preditas pelo modelo. Foi avaliada a capacidade de predição dos modelos através do
cálculo do coeficiente de correlação da predição (r2pred) e das seguintes variantes do
coeficiente de correlação modificado (rm2): rm
2 médio e rm
2 delta.
O r2
pred foi calculado a partir da seguinte equação:
[∑ ( ̂ )
] ⁄
[∑ (
– ̅ ) ] ⁄ (1)
em que representa a atividade biológica predita; corresponde a atividade biológica
experimental; é a média da atividade biológica do conjunto treinamento; nEXT é o
número de compostos no conjunto teste; nTR é o número de compostos no conjunto
treinamento. Essa equação é menos dependente do tamanho e da distribuição do conjunto
teste quando comparada às outras equações que calculam o r2
pred (CONSONNI;
BALLABIO; TODESCHINI, 2010).
O rm2 foi calculado conforme a seguinte equação:
57
( |√ |) (2)
em que r² representa o coeficiente de correlação da reta entre os valores observados e
preditos de atividade biológica; r02 corresponde ao coeficiente de correlação da reta que
intercepta a origem (ponto zero); Diferentemente das fórmulas clássicas de se calcular o
r2
pred, o rm2
independe da média dos valores de atividade do conjunto teste e do conjunto
treinamento, ou seja, não sofre influência da distribuição dos valores de atividade
biológica e não é sensível à forma como o conjunto de dados foi dividido (ROY; ROY,
2008).
Nesse trabalho, duas variantes do rm2
foram calculadas: o rm2
médio (Equação 3) e
o rm2 delta (Equação 4). Essas duas variantes da equação original do rm
2 são obtidas após a
definição do rm2 inverso (r’m
2), calculado partir da inversão dos eixos contendo as
atividades biológicas experimentais e preditas (Figura 13) (ROY et al., 2013).
(
) ⁄ (3)
|
| (4)
Figura 13 – Curvas de regressão com interceptação em zero (linha pontilhada) e sem
interceptação em zero (linha contínua). O rm2 é obtido sem a inversão dos eixos (A); O
r’m2 é obtido após a inversão dos eixos (B) (Adaptado de ROY et al., 2013).
58
4.2.6. Planejamento de novos inibidores de SmTGR a partir dos estudos de QSAR
Com o objetivo de desenvolver novos inibidores de SmTGR, foram propostas
modificações moleculares com base nas informações obtidas dos melhores modelos de
QSAR-2D e QSAR-3D. O planejamento foi realizado através da substituição bioisostérica
de fragmentos utilizando o programa BROOD v.2.0.0 (OpenEye Scientific Software,
Santa Fe, NM, USA). A estrutura utilizada como referência para a substituição foi o
composto mais potente do conjunto de dados (composto 33).
No programa BROOD v.2.0.0, após a definição da estrutura de referência, foi
selecionada a região molecular a ser substituída por fragmentos através da busca por
bioisósteros. A busca foi realizada a partir do banco de dados do próprio programa, que
possui uma quimioteca de fragmentos derivados de compostos comercialmente
disponíveis. Para a substituição dos fragmentos foram utilizados os parâmetros pré-
definidos pelo programa, obtendo-se para a molécula de referência 1000 compostos
diferentes agrupados em clusters de acordo com a similaridade estrutural e propriedades
físico-químicas (OPENEYE, 2010). No programa VIDA v.4.1.2 (OpenEye Scientific
Software, Santa Fe, NM, USA) foi selecionada a molécula representativa de cada
cluster, denominada cluster-head. As cluster-heads selecionadas foram submetidas à
geração de confôrmeros no programa OMEGA v.2.4.6 e as cargas atômicas parciais foram
calculadas de acordo como o modelo de QSAR que seria utilizado na predição da atividade
biológica. Para a predição através dos modelos de QSAR-3D, os compostos obtidos foram
alinhados de acordo com o item 3.2.4.1. Os melhores modelos de QSAR-2D e QSAR-3D
foram utilizados na predição da atividade biológica dos compostos planejados.
59
5. RESULTADOS E DISCUSSÃO
5.1. Caracterização do conjunto de dados
Os modelos de QSAR-2D e QSAR-3D foram desenvolvidos para um conjunto de
35 oxadiazóis-2-óxidos inibidores da enzima SmTGR (RAI et al., 2009; SAYED et al.,
2008). Os dados de potência dos compostos estavam disponíveis em valores de IC50 (M),
os quais foram convertidos para pIC50 (-log IC50). Todos os compostos tiveram seus dados
de atividade biológica obtidos a partir de um mesmo protocolo experimental, um requisito
recomendado para a construção de modelos de QSAR confiáveis (OECD, 2007). Os
valores de pIC50 compreendiam uma faixa de aproximadamente 3,12 unidades
logarítmicas.
Todos os compostos do conjunto de dados apresentaram em sua estrutura o anel
1,2,5-oxadiazol-2-óxido (anel oxadiazólico) (Figura 14), destacando a importância desse
anel na atividade inibitória sobre a enzima SmTGR (RAI et al., 2009; SAYED et al.,
2008).
Figura 14 - Estrutura química do anel 1,2,5-oxadiazol-2-óxido.
A geração de modelos de QSAR robustos e preditivos depende da utilização de um
conjunto de dados com compostos de adequada distribuição da diversidade estrutural e de
dados de atividade biológica entre o conjunto treinamento e o conjunto teste. O conjunto
treinamento compreende as moléculas que são utilizadas para a construção do modelo de
QSAR, ou seja, a partir dessas moléculas são calculados os descritores moleculares os
quais, através de métodos estatísticos, são correlacionados com a atividade biológica,
obtendo-se um modelo matemático capaz de predizer a atividade de compostos externos
que pertençam ao mesmo espaço químico e biológico. Portanto, para que um modelo de
QSAR seja preditivo, ele deve passar por uma validação externa, que consiste na predição
da atividade de compostos de um conjunto teste, os quais não foram utilizados na geração
do modelo.
60
A série de 35 oxadiazóis-2-óxidos foi dividida em conjunto treinamento (80% dos
compostos) e conjunto teste (20% dos compostos) (Tabela 3). A divisão foi realizada
mantendo-se a diversidade química e de atividade biológica homogênea entre os dois
conjuntos (Figura 15).
Figura 15 - (A) Distribuição dos valores de potência no conjunto de dados total e nos
conjuntos treinamento e teste; (B) Proporção entre compostos do conjunto treinamento e
teste dentro de cada uma das três unidades logarítmicas de potência.
O conjunto teste utilizado para a validação externa dos modelos de QSAR-2D e
QSAR-3D foi o mesmo, constituído por 7 compostos. Entretanto, o conjunto treinamento,
constituído inicialmente de 28 compostos teve essa quantidade reduzida para 26
compostos tanto nos estudos de QSAR-2D, quanto no QSAR-3D. Portanto, foram retirados
dois outliers antes da geração dos modelos finais de QSAR.
5.2. QSAR-2D
5.2.1. HQSAR
5.2.1.1. Identificação de outliers
Foram gerados modelos utilizando todos os compostos do conjunto de dados, sem
divisão. Foram testadas várias distinções de fragmento, utilizando o tamanho de
fragmento padrão (4-7 átomos) (Tabela 4).
61
Tabela 4 - Análises de HQSAR utilizando o conjunto de dados total, várias distinções de
fragmento e tamanho padrão de fragmento (4-7 átomos).
q2
LOO: coeficiente de correlação de validação cruzada; r2: coeficiente de correlação de determinação
múltipla; SEE: erro padrão estimado; N: número ótimo de componentes PLS ou variáveis latentes; HL:
comprimento de holograma; Distinção de fragmento: A, átomo; B, ligação; C, conectividade; H, hidrogênio;
DA, doador e aceptor; *modelos que apresentaram q2LOO maior que 0,5.
Os modelos que apresentaram valor de q2
LOO maior que 0,5 foram usados para predizer
a atividade de todos os 35 compostos. Aqueles compostos que apresentaram valor residual
duas vezes maior que o desvio padrão médio dos resíduos foram considerados outliers (IC =
95%) e não participaram da construção dos modelos finais. Os compostos 4 e 6 foram
considerados outliers uma vez que seus valores residuais superaram mais que duas vezes o
desvio padrão nos modelos A/B/C/H/DA, C/H e H/DA. A tabela 5 demonstra os valores
residuais de todos os compostos do conjunto de dados no modelo gerado com distinção de
fragmento A/B/C/H/DA e tamanho de fragmento padrão (4-7).
Distinção de
fragmento
q2
LOO r2 SEE HL N
A 0,400 0,638 0,499 199 2
A/B 0,482 0,771 0,404 97 3
A/B/C 0,413 0,795 0,382 307 3
A/B/C/H 0,369 0,854 0,333 83 5
A/B/C/H/DA* 0,509 0,827 0,357 97 4
A/C 0,422 0,740 0,423 307 2
A/C/H 0,449 0,769 0,412 83 4
A/C/DA 0,413 0,869 0,321 59 6
A/C/H/DA 0,474 0,798 0,385 97 4
A/H 0,464 0,773 0,408 199 4
A/H/DA 0,444 0,756 0,423 61 4
B/C 0,392 0,702 0,453 257 2
B/C/H/DA 0,489 0,856 0,325 97 4
C/H* 0,566 0,901 0,280 53 6
C/H/DA 0,452 0,788 0,395 71 4
H/DA* 0,504 0,739 0,438 53 4
A/DA 0,420 0,776 0,405 151 4
A/B/H 0,427 0,776 0,406 97 4
B/C/DA 0,489 0,856 0,325 97 4
A/B/C/DA 0,492 0,916 0,253 353 5
62
Tabela 5 - Atividade experimental, predita e resíduos obtidos com modelo de distinção de
fragmento A/B/C/H/DA e tamanho de fragmento padrão (4-7), utilizando todos os
compostos.
a pIC50 experimental - pIC50 predito; * Compostos identificados como outliers; Desvio padrão = 0,33.
Composto
pIC50
Experimental Predito Resíduoa
6* 4,75 5,44 -0,69
4* 6,95 5,85 1,11
1 5,20 5,10 0,10
2 4,30 4,58 -0,27
3 4,95 4,63 0,32
5 6,20 5,94 0,26
7 5,65 5,42 0,24
8 5,60 5,40 0,20
9 5,55 5,50 0,05
10 5,55 5,50 0,05
11 5,45 5,39 0,06
12 5,45 5,41 0,05
13 5,39 5,36 0,04
14 5,15 5,33 -0,18
15 5,15 5,27 -0,12
16 5,10 5,22 -0,12
17 5,10 5,08 0,03
18 5,05 4,66 0,39
19 5,05 5,19 -0,14
20 5,00 5,19 -0,19
21 4,95 5,25 -0,30
22 4,80 4,90 -0,10
23 4,74 5,17 -0,42
24 7,39 7,76 -0,36
25 5,55 5,70 -0,14
26 5,45 5,86 -0,40
27 7,20 6,56 0,64
28 5,45 5,95 -0,49
29 6,00 5,83 0,17
30 6,31 6,16 0,16
31 6,39 6,37 0,03
32 6,45 6,74 -0,29
33 7,42 7,51 -0,09
34 5,89 5,73 0,16
35 6,98 6,75 0,23
63
Além dos altos valores residuais, os outliers 4 e 6 apresentam estruturas químicas
com grupos funcionais únicos, não observados no restante das moléculas do conjunto de
dados. O composto 4 apresenta um grupo aldeído ligado ao anel oxadiazólico, enquanto o
composto 6 apresenta um grupo amida ligado ao anel oxadiazólico. Após a retirada dos
outliers, o conjunto treinamento passou a ter 26 compostos, sendo mantida a quantidade
de compostos no conjunto teste. Portanto, uma nova proporção entre os conjuntos foi
obtida: 78,7% dos compostos no conjunto treinamento e 21,3% no conjunto teste.
5.2.1.2. Construção dos modelos de HQSAR
Os parâmetros como o comprimento do holograma molecular, a distinção e
tamanho de fragmentos influenciam a qualidade do resultado de uma análise de HQSAR.
Portanto, várias combinações de distinções de fragmentos e comprimento de holograma
foram investigados.
Foram utilizadas as seguintes distinções de fragmento na geração dos modelos de
HQSAR: átomos (A), ligações (B), conectividade (C), átomos de hidrogênio (H) e
doadores e aceptores de ligação de hidrogênio (DA). Foi empregado o tamanho padrão de
fragmento (4-7). Os comprimentos de holograma variaram de 53 a 401, que são os
padrões pré-definidos no programa SYBYL-X v.1.2 (Tabela 6). Entretanto, comprimentos
maiores de holograma foram testados para se analisar a influência do aumento do
comprimento de holograma na qualidade dos modelos de HQSAR. A investigação de
comprimentos maiores de holograma tem por objetivo evitar a influência de um possível
fenômeno de colisão de fragmentos na geração dos modelos. A colisão de fragmentos é
definida como a alocação de fragmentos moleculares diferentes dentro de um mesmo bin,
definindo-os erroneamente como fragmentos iguais. Geralmente ocorre quando o número
de fragmentos moleculares gerados é superior ao número de hologramas moleculares
disponíveis. Tal evento pode levar à perda de informações importantes que não são
capturadas durante a regressão por PLS (SEEL; TURNER; WILLETT, 1999; TRIPOS,
2010a).
64
Tabela 6 - Análises de HQSAR utilizando o conjunto treinamento, após a retirada de dois
outliers, utilizando várias distinções de fragmento e tamanho padrão de fragmento (4-7
átomos).
q2LOO: coeficiente de correlação de validação cruzada; r
2: coeficiente de correlação de
determinação múltipla; SEE: erro padrão estimado; N: número ótimo de componentes PLS ou
variáveis latentes; HL: comprimento de holograma; Distinção de fragmento: A, átomo; B,
ligação; C, conectividade; H, hidrogênio; DA, doador e aceptor; *único modelo com q2
LOO
menor que 0,6.
Após a retirada dos outliers, nove modelos apresentaram valor de q2
LOO maior que 0,6.
Todos esses modelos foram, posteriormente, testados com seis tamanhos de fragmento
diferentes (2-5, 3-6, 4-7, 5-8, 6-9, 7-10 átomos). No total, após a variação dos tamanhos de
fragmento, foram gerados 54 diferentes modelos de HQSAR. Destes, 34 modelos
apresentaram boa robustez, ou seja, q2
LOO maior que 0,6. Dentre eles, três apresentaram boa
preditividade externa, com valores de r2
pred maiores que 0,6, rm2
médio maior que 0,5 e rm2
delta menor que 0,2 (ROY et al., 2013) (Tabela 7). A construção de modelos utilizando
comprimentos maiores de holograma não alterou significativamente os resultados estatísticos.
Portanto, os modelos com comprimentos maiores de holograma não foram utilizados nas
análises futuras.
Distinção de
fragmento
q2
LOO r2 SEE HL N
A 0,494 0,862 0,327 401 4
A/B 0,525 0,851 0,333 97 3
A/B/C 0,568 0,962 0,180 71 6
A/B/C/H 0,547 0,937 0,227 83 5
A/B/C/H/DA 0,583 0,911 0,269 59 5
A/C 0,444 0,907 0,275 61 5
A/C/H 0,534 0,913 0,266 307 5
A/C/H/DA 0,665 0,941 0,225 97 6
A/C/DA 0,612 0,978 0,137 199 6
A/H 0,637 0,918 0,259 307 5
A/H/DA 0,650 0,937 0,233 83 6
B/C 0,576 0,884 0,293 257 3
C/H 0,617 0,892 0,289 353 4
C/H/DA 0,671 0,963 0,179 199 6
H/DA 0,719 0,935 0,236 53 6
A/DA 0,612 0,930 0,238 59 5
A/B/H 0,572 0,820 0,374 71 4
B/C/DA 0,639 0,966 0,168 97 5
A/B/C/DA 0,596 0,974 0,145 353 5
65
Tabela 7 - Modelos de HQSAR com maior preditividade externa após variação do
tamanho de fragmento.
q2LOO: coeficiente de correlação de validação cruzada; r
2: coeficiente de correlação de determinação múltipla; SEE: erro
padrão estimado; N: número ótimo de componentes PLS ou variáveis latentes; HL: comprimento de holograma; Distinção
de fragmento: A, átomo; B, ligação; C, conectividade; DA, doador e aceptor.
O modelo 3, com tamanho de fragmento de 4 a 7 átomos, apresentou maior
robustez, com valor de q2
LOO igual a 0,639. O modelo que apresentou maior preditividade
externa foi o modelo 2, com valor de r2
pred igual a 0,939, rm2médio igual a 0,878 e rm
2 delta
igual a 0,017. Isso significa que o modelo 2 foi capaz de predizer de forma satisfatória os
valores de atividade biológica dos compostos do conjunto teste, utilizados na validação
externa dos modelos. Dos sete compostos do conjunto teste, apenas dois apresentaram valor
residual maior que o desvio padrão dos resíduos, para um intervalo de confiança de 99%,
indicando capacidade preditiva do modelo igual a 71,42% para o conjunto teste considerado
(Tabela 8).
O valor de q2
LOO, considerado isoladamente, não é um parâmetro suficiente para se
avaliar a preditividade externa de um modelo. Valores de q2
LOO abaixo de 0,5 podem indicar
modelos com baixa preditividade externa, porém o inverso nem sempre acontece, ou seja,
modelos com altos valores de q2
LOO não apresentam, necessariamente, maior preditividade
externa (GOLBRAIKH; TROPSHA, 2002). O modelo 1 apresentou valor de q2
LOO igual a
0,636 , rm2médio igual a 0,700 e rm
2 delta igual a 0,133. De acordo com esses dados, pode ser
observar que a preditividade externa desse modelo é semelhante à do modelo 2. Entretanto, o
modelo 2 apresentou capacidade preditiva de 71,42% (Tabela 8). No modelo 1, três dos sete
compostos do conjunto teste apresentaram valor residual maior que o desvio padrão dos
resíduos (intervalo de confiança igual a 99%), indicando capacidade preditiva de 57,14%, a
qual foi inferior em relação aos modelos 2 e 3. O modelo 3 apresentou capacidade preditiva
Modelo
Distinção de
fragmento
Tamanho
de
fragmento
q2
LOO
r2
SEE
HL
N
r²pred
rm2
médio
rm2
delta
1 A/B/C/DA 2-5 0,636 0,963 0,179 97 6 0,915 0,700 0,133
2 A/DA 2-5 0,613 0,847 0,345 61 4 0,939 0,878 0,017
3 B/C/DA 4-7 0,639 0,966 0,168 97 5 0,899 0,763 0,135
66
igual à observada no modelo 2, 71,42 %. O gráficos de atividade biológica experimental
versus predita indicam que os modelos 2 e 3 apresentam boa preditividade externa (Figura
16).
Tabela 8 - Atividade biológica experimental, predita e valores residuais relacionados aos
dois melhores modelos de HQSAR.
Composto
Modelo 2 (A/DA)
Modelo 3 (B/C/DA)
pIC50
Experimental
pIC50
Predito
Resíduoa
)
pIC50
Experimental
pIC50
Predito
Resíduoa
)
25 5,55 5,73 -0,18 5,55 5,91 -0,35*
32 6,45 6,46 0,00 6,45 6,67 -0,22
10 5,55 5,16 0,40* 5,55 5,37 0,19
19 5,05 5,12 -0,07 5,05 5,12 -0,07
13 5,39 5,30 0,10 5,39 5,28 0,12
35 6,98 7,00 -0,02 6,98 6,55 0,43*
16 5,10 5,35 -0,25* 5,10 5,28 -0,17 aDiferença entre pIC50 experimental e predito; desvio padrão dos resíduos; *valores residuais que
ultrapassaram o desvio padrão (IC = 99%).
Figura 16 - Gráficos de atividade biológica experimental versus predita para os modelos 2
e 3 (os círculos representam os compostos do conjunto treinamento e os losangos os
compostos do conjunto teste).
67
Os modelos 2 e 3 foram submetidos à validação cruzada utilizando o método de
LMO. Nessa análise, foram realizadas 25 corridas e os valores de q2 obtidos em cada
corrida foram usados para se calcular uma média, correspondente ao valor de q2
LMO. Os
modelos 2 e 3 apresentaram valores de q2
LMO iguais a 0,568 e 0,632, respectivamente,
indicando a boa estabilidade desses modelos.
Além de serem utilizadas para a predição da atividade biológica de compostos que
não participaram da construção dos modelos, as análises de HQSAR fornecem
informações a respeito da relação entre os fragmentos estruturais e a atividade biológica.
Essas informações são obtidas através dos mapas de contribuição, os quais indicam a
contribuição individual de cada átomo ou fragmento estrutural para a atividade biológica.
Os mapas de contribuição apresentam escalas de cores para indicar a magnitude da
contribuição de cada átomo. As cores próximas ao vermelho no espectro (vermelho,
laranja avermelhado e laranja) indicam contribuições desfavoráveis ou negativas,
enquanto cores na região do verde (amarelo, azul esverdeado e verde) indicam
contribuições favoráveis ou positivas. Os átomos com contribuições intermediárias são
apresentados em branco.
Os mapas de contribuição gerados a partir do modelo 2, para os compostos mais e
menos potentes do conjunto de dados, estão representados na figura 17. O mapa de
contribuição gerado para o composto mais potente (composto 33) indica que o átomo O11
da carbonila têm contribuição positiva para a atividade biológica. O anel furano ligado a
essa carbonila, como sugere o mapa, é importante para a atividade biológica, visto que o
átomos O17 do anel têm contribuição positiva para a atividade. Os carbonos C10, C13 e
C14 do outro anel furano também têm contribuição positiva para a atividade biológica. O
anel 1,2,5-oxadiazólico juntamente com os átomos C7 e C8 constituem a máxima
subestrutura comum (MCS), presente em todos os compostos do conjunto de dados. O
mapa de contribuição gerado para o composto menos potente (composto 2), apesar de
indicar fragmentos em verde e amarelo no anel aromático ligado ao anel oxadiazólico,
permite concluir que a ausência do anel furano e das carbonilas diminui a potência dos
compostos em três unidades logarítmicas, ou seja, de um pIC50 igual a 7,42 no composto
33 para um pIC50 igual a 4,30 no composto 2.
68
Figura 17 - Mapas de contribuição gerados a partir do modelo 2. (A) Mapa de
contribuição para o composto mais potente do conjunto de dados; (B) Mapa de
contribuição para o composto menos potente do conjunto de dados. Os fragmentos em
azul representam a máxima subestrutura comum (MCS).
Como mencionado anteriormente, a SmTGR é uma selenoproteína, ou seja,
apresenta em sua estrutura a selenocisteína (Sec), que é um aminoácido mais reativo que a
cisteína (Cys), na qual o átomo de enxofre é substituído por um átomo de selênio
(KUNTZ et al., 2007). A diferença na reatividade ocorre porque os selenóis são mais
ácidos que os tióis, como se pode observar na diferença de pKa entre a Cys e a Sec, com
valores de 8,5 e 5,2, respectivamente. Portanto, a Sec apresenta maior nucleofilicidade que
a Cys (JOHANSSON; GAFVELIN; ARNÉR, 2005; NAUSER; STEINMANN;
KOPPENOL, 2012). Os oxadiaxóis-2-óxidos são capazes de liberar óxido nítrico (NO) na
presença de tióis em solução fisiológica (Figura 18) (FEELISCH; SCHÖNAFINGER;
NOACK, 1992). O NO é um composto conhecido por apresentar atividade antiparasitária,
participando da resposta imune do hospedeiro contra parasitos (RIVERO, 2006). Tanto a
Cys quanto a Sec, presentes na SmTGR, reagem com os oxadiazóis-2-óxidos por meio de
ataque nucleofílico ao anel oaxadiazólico, resultando na liberação de NO. Além da
liberação de NO, a ligação dos oxadiazóis-2-óxidos pode ocorrer nos resíduos
69
Cys596’/Sec597’, localizados na extremidade C-terminal da enzima, o quais possuem
papel crucial no ciclo catalítico da SmTGR. Portanto, a atividade esquistossomicida desses
compostos pode estar relacionada à liberação de NO em associação à inibição do ciclo
catalítico da enzima (RAI et al., 2009).
Figura 18 - Esquema demonstrando a liberação de NO a partir de uma molécula de
oxadiazol-2-óxido em solução fisiológica contendo tióis. O ataque nucleofílico do grupo
tiolato pode ocorrer nos carbonos C4 e C3 do anel oxadiazólico (Adaptado de GASCO et
al., 2004).
De acordo com o mecanismo de liberação de NO proposto para os oxadiazóis-2-
óxidos, o ataque nucleofílico do grupo tiolato pode ocorrer nos carbonos C4 e C3 do anel
oxadiazólico (Figura 18). Portanto, a presença do anel oxadiazólico, que constitui a MCS
dos compostos do conjunto de dados, é essencial para a liberação de NO. O mapa de
contribuição obtido para o composto mais potente do conjunto de dados (composto 33)
sugere que a presença da carbonila, como espaçador, ligada ao anel furano, é responsável
pela maior potência do composto (Figura 17). Esses resultados sugerem que a presença de
um grupo retirador de elétrons, como a carbonila, ligado ao anel oxadiazólico, favorece o
mecanismo de liberação de NO a partir do ataque nucleofílico de tióis nas posições 3 e 4
(Figura 18). A presença do grupo metila e do anel aromático, no composto menos potente,
sugere que a ausência de um retirador de elétrons nessas posições dificulta a abertura do
anel oxadiazólico e consequentemente a liberação de NO.
70
5.3. QSAR-3D
5.3.1. Cálculo de cargas atômicas parciais
O cálculo de descritores eletrostáticos nas análises de CoMFA depende da
atribuição de cargas atômicas parciais às moléculas do conjunto de dados. Portanto, as
energias de interação eletrostáticas entre o átomo de prova e as moléculas podem variar de
acordo com o método de cálculo de cargas parciais adotado. Consequentemente, os mapas
de contorno obtidos após as análises podem exibir resultados diferentes (KROEMER et
al., 1998; TSAI et al., 2010).
Foram empregados dois métodos diferentes para o cálculo das cargas atômicas
parciais: o método empírico Gasteiger-Hückel, disponível na plataforma SYBYL-X v.1.2
(Tripos, Inc., St. Louis, MO, USA) e o método semi-empírico AM1-BCC (JAKALIAN;
JACK; BAYLY, 2002; JAKALIAN et al., 1999), disponível no programa QUACPAC
v.1.5.0 (OpenEye Scientific Software, Inc., Santa Fe, NM, USA).
O método Gasteiger-Hückel é uma combinação dos métodos de cálculo de carga
Gasteiger-Marsili e Hückel (GASTEIGER; MARSILI, 1978; PURCELL; SINGER,
1967). O primeiro é utilizado para cargas e o segundo é uma extensão utilizada para
descrever cargas distribuídas em ligações CLARKO método AM1-BCC utiliza
uma abordagem complementar entre o método AM1 e o método ESP-fit. As cargas
atômicas AM1 são calculadas rapidamente e capturam uma parte essencial da estrutura
eletrônica. São acrescentadas aos cálculos de AM1, as correções ligação-carga (BCCs, do
inglês Bond Charge Corrections). As BCCs são utilizadas para corrigir deficiências
encontradas na função de onda de AM1, como por exemplo, a dificuldade na
parametrização de cargas em moléculas contendo enxofre e fósforo (átomos com orbitais
p). As BCCs consistem em parâmetros pré calculados, que são computados de acordo com
o tipo de átomos e ligações presentes nas estruturas das moléculas. O cálculo de cargas
por AM1-BCC permite resultados comparáveis a métodos mecânico-quânticos como
HF/6-31G* ESP, com a vantagem de apresentar reduzido custo computacional
(JAKALIAN; JACK; BAYLY, 2002; JAKALIAN et al., 1999).
5.3.2. Alinhamento molecular
Uma etapa crucial antes de se realizar a análise de CoMFA é o alinhamento dos
compostos que compõem o conjunto de dados. O alinhamento pode afetar a qualidade dos
71
resultados estatísticos relacionados aos modelos (DOWEYKO, 2004). Há uma diversidade
de estratégias de alinhamento que se são divididas entre aquelas baseadas na estrutura e
aquelas baseadas no ligante. O alinhamento das estruturas se baseia no princípio da
similaridade, ou seja, ligantes com características similares possuem modos de ligação
semelhantes com o alvo macromolecular. O objetivo final de uma estratégia de
alinhamento é a representação da provável conformação bioativa dos compostos. Portanto,
antes de se realizar o alinhamento, conformações apropriadas das moléculas devem ser
calculadas (MARTIN, 1998). Nesse trabalho, as conformações foram geradas no
programa OMEGA v.2.4.6 (OpenEye Scientific Software, Inc., Santa Fe, NM, USA).
A ausência de estruturas cristalográficas da SmTGR contendo os oxadiazóis-2-
óxidos ou outros inibidores co-cristalizados, exigiu a adoção de estratégias de alinhamento
molecular baseadas no ligante. Foram executadas duas estratégias de alinhamento, uma
baseada na sobreposição de volumes e características moleculares (alinhamento no ROCS)
e outra baseada em uma função de similaridade morfológica (alinhamento no Surflex-
Sim) (Figura 19).
Figura 19 - Alinhamentos moleculares utilizados nos estudos de QSAR-3D. (A)
Alinhamento no ROCS (alinhamento1); (B) alinhamento no Surflex-Sim (alinhamento 2).
O ROCS se baseia na descrição da forma molecular (molecular shape), ou seja, as
moléculas são tratadas como um conjunto de esferas interseccionadas. A superfície
exposta dessas esferas define os limites do volume molecular. Nesse método, uma função
gaussiana é utilizada para descrever a forma molecular, que por sua vez pode refletir a
distribuição de cargas nas moléculas, permitindo informações relacionadas ao
reconhecimento molecular no sítio de ligação. O alinhamento pelo ROCS é realizado com
as estruturas rígidas. Portanto, um conjunto de confôrmeros deve ser gerado previamente
72
para que o espaço conformacional das moléculas seja explorado (GRANT; GALLARDO;
PICKUP, 1996; HAWKINS; SKILLMAN; NICHOLLS, 2007). Nesse estudo, o composto
33 (mais potente do conjunto de dados) foi utilizado como referência para o alinhamento
dos demais compostos, utilizando-se o anel oxadiazólico como referência para
sobreposição (Figura 20). Foi utilizada a função de pontuação TanimotoCombo,
implementada no ROCS, para a classificação e escolha dos melhores confôrmeros, ou seja,
aqueles que melhor se sobrepõem ao composto de referência. A função TanimotoCombo é
uma combinação das funções ShapeTanimoto, a qual compara as moléculas baseando-se
na melhor sobreposição dos volumes moleculares e ColorTanimoto, a qual consiste em
uma pontuação relacionada à sobreposição adequada de grupos com propriedades como
doadores de ligação de hidrogênio, aceptores de ligação de hidrogênio, hidrofóbicos,
cátion, ânion e anéis (HAWKINS; SKILLMAN; NICHOLLS, 2007).
Figura 20 - Esquema demonstrando o alinhamento realizado pelo programa ROCS. As
moléculas do conjunto de dados são sobrepostas a uma molécula de referência e em
seguida, é realizado um processo de otimização que maximiza a sobreposição dos
volumes moleculares (OPENEYE SCIENTIFIC SOFTWARE INC., 2011).
O Surflex-Sim utiliza uma função de similaridade morfológica e uma técnica
rápida de geração de poses para alinhar moléculas ou fragmentos a outras moléculas. A
73
similaridade morfológica é definida como uma função gaussiana das diferenças na
distância da superfície de duas moléculas aos pontos de observação de uma grade. As
distâncias computadas incluem tanto as distâncias à superfície atômica mais próxima
quanto distâncias a superfícies doadoras e aceptoras. Além disso, é realizada uma
otimização da similaridade entre pares de moléculas não alinhadas, que consiste na
definição de pontos de observação que formam triângulos de mesmo tamanho, em que
cada par de pontos correspondentes nos triângulos observam características similares
(Figura 21).
Figura 21 - Esquema demonstrando o alinhamento realizado no Surflex-Sim. (A) A
similaridade entre as moléculas é definida como as diferenças entre medidas de superfície
e pontos de observação; (B) Representação do procedimento de otimização do
alinhamento, o qual utiliza tripletos constituídos de pontos de observação de duas
moléculas (Adaptado de JAIN, 2004).
74
5.3.3. Análises de CoMFA
5.3.3.1. Identificação de outliers
Um modelo de CoMFA foi gerado utilizando todos os compostos do conjunto de
dados, sem divisão entre treinamento e teste. As cargas atômicas parciais foram calculadas
pelo método AM1-BCC e o alinhamento molecular realizado através do programa ROCS.
O modelo foi gerado utilizando o espaçamento padrão dos vértices da caixa 3D reticulada
(2,0 Å). Os valores de corte de energia adotados foram de 30 kcal/mol e a filtragem de
coluna adotada na análise de PLS igual a 2,0 kcal/mol. Em seguida, a atividade biológica
de todos os compostos do conjunto de dados foi predita, obtendo-se o valor residual
(Tabela 9).
Tabela 9 - Atividade biológica experimental, predita e valores residuais obtidos a partir
de um modelo de CoMFA utilizando todos os compostos do conjunto de dados.
Composto
pIC50
Experimental Predito Resíduoa
1 5,20 5,37 -0,17
24 7,39 7,01 0,39
2 4,30 5,33 -1,03
3 4,95 5,33 -0,38
4* 6,95 5,39 1,57
5 6,20 5,57 0,63
6* 4,75 5,86 -1,11
7 5,65 5,20 0,46
8 5,60 5,26 0,35
9 5,55 5,28 0,28
10 5,55 5,31 0,25
11 5,45 5,32 0,14
12 5,45 5,31 0,14
13 5,39 5,30 0,10
14 5,15 5,54 -0,39
15 5,15 5,29 -0,14
16 5,10 5,57 -0,47
17 5,10 5,66 -0,56
18 5,05 5,52 -0,47
19 5,05 5,38 -0,33
20 5,00 5,43 -0,43
21 4,95 5,31 -0,36
75
Tabela 9 (cont.) - Atividade biológica experimental, predita e valores residuais obtidos a
partir de um modelo de CoMFA utilizando todos os compostos do conjunto de dados.
a pIC50 experimental - pIC50 predito; * Composto identificado como outlier; Desvio padrão = 0,59.
Assumindo um intervalo de confiança (IC) de 95%, um composto apresentou valor
residual duas vezes maior que o desvio padrão médio dos resíduos: o composto 4
(composto contendo grupo aldeído). Entretanto, o composto 6 foi considerado outlier, no
qual o valor residual foi igual a 1,11, ou seja, um valor próximo a duas vezes o desvio
padrão. Além disso, o composto 6 foi retirado pois nos estudos de HQSAR ele já havia
sido considerado um outlier, pois apresenta um grupo amida ausente nas demais
moléculas do conjunto de dados.
Os modelos finais de CoMFA foram construídos com a mesma divisão entre
conjunto teste e conjunto treinamento utilizada nos modelos de QSAR-2D.
5.3.3.2. Modelos de CoMFA utilizando as cargas Gasteiger-Hückel
Após o cálculo de cargas atômicas parciais pelo método de Gasteiger-Hückel,
foram gerados modelos de CoMFA utilizando duas diferentes estratégias de alinhamento:
o alinhamento no ROCS (alinhamento 1) e o alinhamento no Surflex-Sim (alinhamento
2). Foram utilizados quatro diferentes espaçamentos dos vértices da caixa 3D reticulada
(espaçamento da grade): 0,5; 1,0; 1,5; 2,0 Å. Todos modelos foram gerados mediante
Composto
pIC50
Experimental Predito Resíduoa
22 4,80 5,49 -0,69
23 4,74 5,15 -0,40
25 5,55 5,47 0,09
26 5,45 5,55 -0,10
27 7,20 6,34 0,87
28 5,45 5,65 -0,20
29 6,00 5,47 0,53
30 6,31 5,80 0,52
31 6,39 5,58 0,82
32 6,45 5,66 0,80
33 7,42 6,85 0,57
34 5,89 6,96 -1,07
35 6,98 7,16 -0,18
76
focagem da região, através do método do coeficiente do desvio padrão (SDC), com
variações de 0,3 até 1,5 desse coeficiente.
5.3.3.2.1. Modelos obtidos a partir do alinhamento 1 (ROCS)
Em cada espaçamento da grade foram gerados 13 modelos de CoMFA diferentes
(SDC de 0,3 até 1,5). Todos os modelos foram submetidos a validação interna pelo
método de LOO. Nenhum modelo obtido a partir do alinhamento 1 apresentou q2
LOO
maior que 0,6, indicando que os modelos obtidos apresentaram baixa robustez. A tabela
10 indica os melhores modelos obtidos a partir de cada espaçamento da grade.
Tabela 10 - Melhores modelos de CoMFA obtidos a partir do alinhamento 1.
SDC: coeficiente do desvio padrão utilizado na focagem; N: número ótimo de componentes na análise de
PLS; q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente de correlação determinação
múltipla; SEE: erro padrão estimado;
5.3.3.2.2. Modelos obtidos a partir do alinhamento 2 (Surflex-Sim)
Em cada espaçamento da grade foram gerados 13 modelos de CoMFA diferentes
(SDC de 0,3 até 1,5). Todos foram submetidos a validação interna pelo método de LOO.
Nenhum modelo obtido a partir do alinhamento 2 apresentou q2
LOO maior que 0,6,
indicando que os modelos obtidos apresentaram baixa robustez (Tabela 11).
Espaçamento
da grade
(Å)
SDC N q²LOO r² SEE
0,5 0,6 2 0,559 0,778 0,397
1,0 1,5 1 0,549 0,701 0,451
1,5 0,8 1 0,495 0,660 0,481
2,0 0,7 1 0,526 0,677 0,469
77
Tabela 11 - Melhores modelos de CoMFA obtidos a partir do alinhamento 2.
E.G.: espaçamento da grade; SDC: coeficiente do desvio padrão utilizado na focagem; N: número ótimo
de componentes na análise de PLS; q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente
de correlação determinação múltipla; SEE: erro padrão estimado.
5.3.3.3. Modelos de CoMFA utilizando as cargas AM1-BCC
Após o cálculo de cargas atômicas parciais pelo método AM1-BCC, foram gerados
modelos de CoMFA utilizando duas diferentes estratégias de alinhamento: o alinhamento
no programa ROCS (alinhamento 1) e o alinhamento no Surflex-Sim (alinhamento 2).
Foram utilizados quatro diferentes espaçamentos dos vértices da caixa 3D reticulada
(espaçamento da grade): 0,5; 1,0; 1,5; 2,0 Å. Todos modelos foram gerados mediante
focagem da região, através do método do coeficiente do desvio padrão (SDC), com
variações de 0,3 até 1,5 desse coeficiente.
5.3.3.3.1. Modelos obtidos a partir do alinhamento 1
Foram gerados 13 modelos de CoMFA para cada espaçamento de grade, da mesma
forma que os modelos com cargas Gasteiger-Hückel. A validação interna foi realizada
através do método de LOO. Os modelos obtidos com espaçamento da grade de 0,5 a 1,5 Å
apresentaram boa robustez com valores de q²LOO entre 0,711 e 0,813 (Tabela 12). Portanto,
foi avaliada a preditividade externa desses modelos, através do cálculo de r²pred, rm2médio
e rm2 delta. O modelo com melhor preditividade externa foi obtido com espaçamento de
grade igual a 0,5 Å, no qual o valor de r²pred foi igual a 0,904 e os valores de rm2médio e
rm2 delta iguais a 0,832 e 0,042, respectivamente. O modelo com espaçamento de grade
igual a 1,0 Å também apresentou boa preditividade externa, com valor de r²pred foi igual a
0,818 e valores de rm2médio e rm
2 delta dentro da faixa ideal: 0,694 e 0,170,
respectivamente (ROY et al., 2013). Os modelos com espaçamento de 2,0 Å não
apresentaram boa robustez, com valores de q²LOO menores que 0,6.
E.G.
(Å)
SDC N q²LOO r² SEE
0,5 0,9 3 0,512 0,843 0,342
1,0 1,1 1 0,574 0,670 0,474
1,5 1,4 1 0,387 0,556 0,549
2,0 1,5 2 0,329 0,654 0,496
78
Tabela 12 - Melhores modelos de CoMFA obtidos a partir do alinhamento 1.
E.G.: espaçamento da grade; SDC: coeficiente do desvio padrão utilizado na focagem; N: número ótimo de
componentes na análise de PLS; q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente de
correlação determinação múltipla; SEE: erro padrão estimado; r²pred: coeficiente de correlação preditivo;
rm2médio: média dos valores de rm
2 e r’m
2; rm
2 delta: diferença entre os valores de rm
2 e r’m
2.
5.3.3.3.2 Modelos obtidos a partir do alinhamento 2
O mesmo protocolo utilizado na geração dos modelos do alinhamento 1 foi usado.
A validação interna dos modelos foi feita através do método de validação cruzada LOO.
Apenas um modelo com espaçamento de grade igual a 1,0 Å apresentou valor de q²LOO
maior que 0,6. Entretanto, a preditividade externa do modelo não foi satisfatória em
termos de rm2médio e rm
2 delta, 0,549 e 0,258, respectivamente. O valor de rm
2 delta
estava acima do recomendado (rm2 delta < 0,2) (ROY et al., 2013). Todos os demais
espaçamentos da grade testados não foram capazes de gerar modelos com boa
consistência interna (q²LOO menor que 0,6) (Tabela 13).
Tabela 13 - Melhores modelos de CoMFA obtidos a partir do alinhamento 2.
E.G.: espaçamento da grade; SDC: coeficiente do desvio padrão utilizado na focagem; N: número ótimo de
componentes na análise de PLS; q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente de
correlação determinação múltipla; SEE: erro padrão estimado; r²pred: coeficiente de correlação preditivo;
rm2médio: média dos valores de rm
2 e r’m
2; rm
2 delta: diferença entre os valores de rm
2 e r’m
2.
E.G.
(Å)
SDC N q²LOO r² SEE r²pred rm2médio rm
2 delta
0,5 0,3 6 0,711 0,997 0,052 0,904 0,832 0,042
1,0 0,3 6 0,719 0,997 0,052 0,818 0,694 0,170
1,5 0,3 6 0,813 0,998 0,040 0,829 0,632 0,207
2,0 0,3 5 0,516 0,987 0,102 0,831 0,715 0,161
E.G.
(Å)
SDC N q²LOO r² SEE r²pred rm2médio rm
2 delta
0,5 1,3 1 0,371 0,476 0,597 - - -
1,0 0,7 5 0,628 0,991 0,087 0,696 0,549 0,258
1,5 1,5 1 0,347 0,469 0,601 - - -
2,0 0,4 1 0,272 0,463 0,604 - - -
79
5.3.3.4. Melhores modelos de CoMFA
Dentre os vários modelos de CoMFA gerados a partir de dois métodos de cálculo
de carga e dois métodos de alinhamento molecular, foram escolhidos dois modelos, os
quais apresentaram consistência interna e melhor preditividade externa (Tabela 14).
Tabela 14 - Melhores modelos finais de CoMFA e seus resultados de robustez e
preditividade externa.
aAlinhamento no ROCS; E.G.: espaçamento da grade; N: número ótimo de componentes na análise de PLS; q²LOO:
coeficiente de correlação de validação cruzada; q²LMO: coeficiente de validação cruzada leave-many-out; r²:
coeficiente de correlação determinação múltipla; r²pred: coeficiente de correlação preditivo; rm2médio: média dos
valores de rm2 e r’m
2; rm
2 delta: diferença entre os valores de rm
2 e r’m
2.
Os dois modelos escolhidos apresentaram boa robustez e boa preditividade
externa. Os valores de rm2 delta estavam abaixo de 0,2, como é recomendável. O rm
2 é um
parâmetro de avaliação da preditividade bastante rigoroso, podendo penalizar bastante a
qualidade das predições. Entretanto, nos melhores modelos de CoMFA, o rm2 delta não
ficou acima de 0,2 e o rm2médio permaneceu acima de 0,5. Além disso, os resultados de
r²pred ficaram entre 0,8 e 0,9 (OJHA et al., 2011; ROY et al., 2013). Os modelos gerados a
partir de cargas Gasteiger-Hückel e alinhamento pelo Surflex-Sim mostraram-se inferiores
aos modelos gerados a partir de cargas AM1-BCC e alinhamento pelo ROCS, tanto na
consistência interna, quanto na preditividade externa. Na tabela 15 são demonstrados os
valores residuais após a predição da atividade biológica dos compostos do conjunto teste,
utilizando os dois melhores modelos de CoMFA.
Modelo Cargas Alinhamento E.G.
(Å)
N q²LOO q²LMO r² r²pred rm2
médio
rm2
delta
I AM1-BCC 1 a
0,5 6 0,711 0,665 0,997 0,904 0,832 0,042
II AM1-BCC 1 a
1,0 6 0,719 0,671 0,997 0,818 0,694 0,170
80
Tabela 15 - Atividade biológica experimental, predita e resíduos dos compostos do
conjunto teste preditos pelos dois melhores modelos de CoMFA.
aDiferença entre pIC50 experimental e predito; desvio padrão dos resíduos; *valores residuais que
ultrapassaram o desvio padrão (IC = 99%).
O modelo I conseguiu predizer, de forma satisfatória, a atividade de seis dos sete
compostos do conjunto teste. Apenas o composto 32 apresentou seus valores residuais
maiores que o desvio padrão dos resíduos (intervalo de confiança de 99%). Portanto, a
capacidade preditiva do modelo I foi de 85,71%. O modelo II conseguiu predizer bem a
atividade de cinco dos sete compostos do conjunto teste, apresentando capacidade
preditiva de 71,42%. A figura 22 mostra os gráficos das atividades experimentais e
preditas pelos dois modelos.
Figura 22 - Gráficos das atividade experimental versus predita construídos a partir dos
dois melhores modelos de CoMFA. Os círculos representam os compostos do conjunto
treinamento e os losangos os compostos do conjunto teste.
Composto
Modelo I
Modelo II
pIC50
Experimental
pIC50
Predito
Resíduoa
)
pIC50
Experimental
pIC50
Predito
Resíduoa
)
25 5,55 5,44 0,11 5,55 5,36 0,19
32 6,45 5,93 0,52* 6,45 5,78 0,67*
10 5,55 5,53 0,03 5,55 5,50 0,05
19 5,05 5,28 -0,23 5,05 5,26 -0,21
13 5,39 5,27 0,12 5,39 5,27 0,12
16 5,10 4,94 0,16 5,10 4,84 0,26
35 6,98 7,16 -0,18 6,98 7,40 -0,42*
81
5.3.3.5. Mapas de contorno de CoMFA
Além de fornecer modelos capazes de prever a atividade biológica de compostos,
as análises de CoMFA permitem a visualização de informações gráficas a partir de mapas
de contorno. Esses mapas indicam os pontos da caixa 3D reticulada onde variações nos
campos estéricos e elestrotáticos são relacionadas a variações na atividade biológica.
Esses mapas podem ser usados para estimar as regiões das moléculas que são favoráveis
ou desfavoráveis para a atividade biológica. A interpretação desses mapas fornece
informações úteis no planejamento de novos compostos inibidores do alvo biológico em
estudo. (CRAMER; PATTERSON; BUNCE, 1988; KUBINYI, 1997).
Foram gerados mapas de contorno para os modelos I e II, obtidos após a análise de
CoMFA (Figuras 23 e 24). Os mapas foram gerados marcando-se as opções
STDEV*COEFF e a função contour by actual. Nos mapas de contorno estéricos, os
poliedros verdes indicam regiões em que grupos volumosos favorecem a atividade
biológica, enquanto os poliedros amarelos indicam regiões em que grupos volumosos são
desfavoráveis para atividade biológica. Nos mapas de contorno eletrostáticos, os poliedros
vermelhos indicam regiões em que grupos eletronegativos favorecem a atividade
biológica, enquanto os poliedros azuis indicam regiões onde grupo eletronegativos não
são favoráveis a atividade biológica.
O mapa de contorno estérico, obtido a partir do modelo I (Figura 23A), indica que
grupos volumosos na região próxima ao anel furano favorecem a atividade biológica.
Esse resultado sugere, assim como nos estudos de HQSAR, que o anel furano, que pode
ser considerado um grupo volumoso, apresenta importância para a atividade biológica. O
mapa eletrostático, obtido a partir do modelo I (Figura 23B), indica que grupos
eletronegativos em regiões próximas aos átomos de oxigênio O12 e O11 favorecem a
atividade biológica. Além disso, grupos eletronegativos são desfavoráveis na região do
carbono C7.
82
Figura 23 - Mapas de contorno para o composto mais potente do conjunto de dados
obtidos a partir do modelo I. Mapa de contorno estérico (A); Mapa de contorno
eletrostático (B).
Ao analisar o mapa eletrostático nas proximidades da carobonila (C7 e O12),
observa-se que esse grupo funcional é essencial para atividade biológica. Comparando as
informações obtidas do mapa eletrostático com o mecanismo de liberação de NO pelos
oxadiazóis-2-óxidos (Figura 18), observa-se que a presença de um espaçador, como a
carbonila, com capacidade de atrair elétrons favorece a liberação de NO através do ataque
nucleofílico de tióis nas posições 3 e 4 do anel oxadiazólico (GASCO et al., 2004).
Compostos que não possuem esse espaçador apresentam menor potência como, por
exemplo, o composto 2. O mapa de contorno estérico, obtido a partir do modelo II (Figura
24A), indica que grupos volumosos são favoráveis na região do anel furano, o que está de
acordo com o mapa estérico obtido no modelo I.
83
Figura 24 - Mapas de contorno para o composto mais potente do conjunto de dados
obtidos a partir do modelo II. Mapa de contorno estérico (A); Mapa de contorno
eletrostático (B).
Oberva-se que os dois compostos mais potentes do conjunto de dados (compostos
33 e 24) possuem anel furano e anel tiofênico, respectivamente, o que sugere a
importância desses grupos para a atividade biológica. No mapa de contorno eletrostático,
obtido a partir do modelo II (Figura 24B), a carbonila ligada ao anel furano (C7 e O12)
novamente demonstra ser favorável à atividade biológica, pois como já foi mencionado,
ele pode favorecer o ataque nucleofílico de tióis ao anel oxadizólico, liberando NO
(GASCO et al., 2004).
84
5.3.4. Análises de CoMSIA
5.3.4.1 Identificação de outliers
Os compostos 4 e 6 foram também considerados outliers na análise de CoMSIA.
Os modelos finais de CoMSIA foram construídos com a mesma divisão entre conjunto
treinamento e conjunto teste utilizada na análise de CoMFA. Portanto, a divisão do
conjunto de dados seguiu a mesma proporção: 78,7% dos compostos no conjunto
treinamento e 21,3% no conjunto teste.
5.3.4.2. Modelos de CoMSIA utilizando as cargas Gasteiger-Hückel
Após o cálculo de cargas atômicas parciais pelo método de Gasteiger-Hückel,
foram gerados modelos de CoMSIA utilizando duas diferentes estratégias de alinhamento:
o alinhamento no programa ROCS (alinhamento 1) e o alinhamento no Surflex-Sim
(alinhamento 2). O espaçamento dos vértices da caixa 3D reticulada (espaçamento da
grade) utilizado foi de 2,0 Å. Não foram gerados modelos de CoMSIA com outros
espaçamentos da grade.
5.3.4.2.1. Modelos obtidos a partir do alinhamento 1 (ROCS)
Foram gerados 26 modelos de CoMSIA, utilizando diferentes combinações dos
campos estérico, eletrostático, hidrofóbico, doador e aceptor de ligação de hidrogênio.
Foram considerados satisfatórios aqueles modelos que apresentaram boa robustez (q2
LOO >
0,6) e boa preditividade externa (r2
pred > 0,6; rm2 médio > 0,5; rm
2 delta < 0,2)
(GOLBRAIKH; TROPSHA, 2002; ROY et al., 2013). A tabela 16 mostra os melhores
modelos de CoMSIA gerados a partir do alinhamento 1.
85
Tabela 16 - Melhores modelos de CoMSIA obtidos a partir de cargas Gasteiger-Hückel e
alinhamento 1.
q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente de correlação determinação múltipla
N: número ótimo de componentes na análise de PLS; SEE: erro padrão estimado; r²pred: coeficiente de
correlação preditivo; rm2médio: média dos valores de rm
2 e r’m
2; rm
2 delta: diferença entre os valores de rm
2
e r’m2; S: campo estérico; E: campo eletrostático; H: campo hidrofóbico; D: campo doador de ligação de
hidrogênio; A: campo aceptor de ligação de hidrogênio. *melhor modelo gerado utilizando cargas
Gasteiger-Hückel. .
Apesar de os melhores modelos apresentarem q2
LOO menor que 0,6, indicativo de
menor consistência interna, todos demonstraram boa preditividade externa com valores de
r²pred, rm2médio e rm
2 delta satisfatórios (r
2pred > 0,6; rm
2 médio > 0,5; rm
2 delta < 0,2).
5.3.4.2.2. Modelos obtidos a partir do alinhamento 2 (Surflex-Sim)
Foram gerados 26 modelos a partir do alinhamento 2. Os modelos que
apresentaram melhor robustez e preditividade externa estão apresentados na tabela 17. Os
Modelo q2
LOO r2
N SEE Contribuição r2
pred rm2
médio
rm2 delta
EH 0,559 0,960 5 0,181 0,449 0,551 0,971 0,944 0,034
HD 0,525 0,910 6 0,278 0,856 0,144 0,888 0,687 0,154
SEA 0,538 0,987 6 0,106 0,189 0,345
0,466
0,812 0,668 0,066
SHA 0,504 0,996 6 0,061 0,181 0,342
0,477
0,957 0,894 0,051
EDA 0,537 0,924 5 0,250 0,368 0,155
0,476
0,782 0,636 0,045
HDA 0,502 0,937 4 0,221 0,347 0,239
0,414
0,972 0,878 0,037
SEHA* 0,513 0,995 6 0,068 0,115 0,248
0,269 0,367
0,947 0,884 0,065
SEHD 0,506 0,911 4 0,263 0,112 0,344
0,351 0,193
0,930 0,769 0,101
SEDA 0,564 0,969 5 0,158 0,130 0,316
0,135 0,420
0,789 0,620 0,013
EHDA 0,568 0,981 5 0,124 0,259 0,272
0,126 0,343
0,965 0,928 0,042
SHDA 0,508 0,950 4 0,197 0,120 0,303
0,206 0,371
0,982 0,929 0,025
SEHDA 0,562 0,990 5 0,090 0,091 0,236
0,238 0,118
0,317
0,961 0,899 0,053
86
três melhores modelos, apesar de apresentarem q2
LOO menor que 0,6, foram aprovados em
todos os critérios de preditividade externa (r2
pred, rm2 médio e rm
2 delta).
Tabela 17 - Melhores modelos de CoMSIA obtidos a partir de cargas Gasteiger-Hückel e
alinhamento 2.
q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente de correlação determinação
múltipla N: número ótimo de componentes na análise de PLS; SEE: erro padrão estimado; r²pred: coeficiente de correlação preditivo; rm
2médio: média dos valores de rm
2 e r’m
2; rm
2 delta: diferença
entre os valores de rm2 e r’m
2; S: campo estérico; E: campo eletrostático; H: campo hidrofóbico; D:
campo doador de ligação de hidrogênio; A: campo aceptor de ligação de hidrogênio; *melhor modelo
gerado utilizando cargas Gasteiger-Hückel.
5.3.4.3. Modelos de CoMSIA utilizando as cargas AM1-BCC
Após o cálculo de cargas atômicas parciais pelo método AM1-BCC, foram gerados
modelos de CoMSIA utilizando duas diferentes estratégias de alinhamento: o alinhamento
no programa ROCS (alinhamento 1) e o alinhamento no Surflex-Sim (alinhamento 2). O
espaçamento dos vértices da caixa 3D reticulada (espaçamento da grade) utilizado foi de
2,0 Å.
5.3.4.3.1. Modelos obtidos a partir do alinhamento 1
Foram gerados 26 modelos de CoMSIA a partir do alinhamento 1. Os melhores
modelos, que demonstraram melhor consistência interna e preditividade externa, estão
representados na tabela 18. O modelo SEHA, foi aquele que apresentou os melhores
resultados, dentre todos os modelos que usaram cargas AM1-BCC, demonstrando
robustez e boa preditividade externa, ao ser aprovado em todos critérios de preditividade
externa (r2
pred, rm2 médio e rm
2 delta).
Modelo q2
LOO r2
N SEE Contribuição r2
pred rm2
médio
rm2 delta
EH 0,500 0,947 5 0,209 0,473 0,527 0,863 0,736 0,155
SHDA 0,509 0,975 6 0,145 0,116 0,312
0,149 0,422
0,919 0,753 0,073
SEHDA 0,515 0,970 5 0,155 0,074 0,255
0,234 0,130
0,307
0,912 0,739 0,092
87
Tabela 18 - Melhores modelos de CoMSIA obtidos a partir de cargas AM1-BCC e
alinhamento 1.
q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente de correlação determinação múltipla
N: número ótimo de componentes na análise de PLS; SEE: erro padrão estimado; r²pred: coeficiente de
correlação preditivo; rm2médio: média dos valores de rm
2 e r’m
2; rm
2 delta: diferença entre os valores de rm
2 e
r’m2; S: campo estérico; E: campo eletrostático; H: campo hidrofóbico; D: campo doador de ligação de
hidrogênio; A: campo aceptor de ligação de hidrogênio; *melhor modelo gerado utilizando cargas AM1-
BCC.
5.3.4.3.2. Modelos obtidos a partir do alinhamento 2
Foram gerados 26 modelos a partir do alinhamento 2. Os modelos que
apresentaram boa robustez e preditividade externa estão representados na tabela 19.
Modelo q2
LOO r2
N SEE Contribuição r2
pred rm2
médio
rm2 delta
EH 0,669 0,985 5 0,111 0,673 0,327 0,875 0,668 0,164
SE 0,658 0,994 6 0,070 0,173 0,827 0,864 0,738 0,161
HD 0,525 0,910 6 0,278 0,856 0,144 0,888 0,687 0,154
SEA 0,615 0,996 6 0,058 0,153 0,508
0,339
0,868 0,747 0,077
SEH 0,609 0,990 5 0,090 0,109 0,605
0,287
0,921 0,797 0,102
EHA 0,565 0,984 4 0,111 0,430 0,237
0,333
0,926 0,817 0,078
SHA 0,504 0,996 6 0,061 0,181 0,342
0,477
0,957 0,894 0,051
EDA 0,539 0,983 6 0,119 0,494 0,150
0,356
0,763 0,593 0,106
HDA 0,502 0,937 4 0,221 0,347 0,239
0,414
0,972 0,878 0,037
SEHA* 0,597 0,996 6 0,056 0,103 0,385
0,212 0,300
0,965 0,902 0,036
SEHD 0,614 0,986 6 0,111 0,100 0,496
0,261 0,144
0,898 0,651 0,155
SEDA 0,597 0,993 6 0,078 0,105 0,435
0,134 0,326
0,798 0,621 0,137
EHDA 0,630 0,992 6 0,084 0,360 0,216
0,147 0,277
0,921 0,731 0,100
SHDA 0,508 0,950 4 0,197 0,120 0,303
0,206 0,371
0,982 0,929 0,025
SEHDA 0,623 0,994 6 0,069 0,074 0,334
0,192 0,136
0,264
0,928 0,754 0,095
88
Tabela 19 - Melhores modelos de CoMSIA obtidos a partir de cargas AM1-BCC e
alinhamento 2.
q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente de correlação determinação múltipla N:
número ótimo de componentes na análise de PLS; SEE: erro padrão estimado; : desvio padrão dos
resíduos; r²pred: coeficiente de correlação preditivo; rm2médio: média dos valores de rm
2 e r’m
2; rm
2 delta:
diferença entre os valores de rm2 e r’m
2; S: campo estérico; E: campo eletrostático; H: campo hidrofóbico; D:
campo doador de ligação de hidrogênio; A: campo aceptor de ligação de hidrogênio;
5.3.4.4. Melhores modelos de CoMSIA
Os modelos de CoMSIA mais robustos e preditivos foram: o modelo SEHA, obtido
a partir do cálculo de cargas Gasteiger-Hückel e alinhamento 1 (Modelo I); o modelo
SEHA, obtido a partir do cálculo de cargas AM1-BCC e alinhamento 1 (Modelo II). Esses
modelos foram submetidos a validação cruzada por LMO, obtendo-se q2LMO igual 0,477
para o modelo I e 0,554 para o modelo II. Na tabela 20 são demonstrados os valores
residuais após a predição da atividade biológica dos compostos do conjunto teste,
utilizando esses dois modelos.
O modelo I apresentou capacidade preditiva igual a 57,14%, ou seja, dos sete
compostos que compõem o conjunto teste, três apresentaram valor residual maior que o
desvio padrão dos resíduos (intervalo de confiança igual a 99%). O modelo II apresentou
capacidade preditiva igual a 85,71%, ou seja, dos sete compostos que compõem o
conjunto teste, apenas um apresentou valor residual maior que o desvio padrão dos
resíduos (intervalo de confiança igual a 99%). O modelo II foi utlizado posteriormente
para a geração dos mapas de contorno. A figura 25 mostra os gráficos das atividades
experimentais e previstas pelos dois modelos.
Modelo q2
LOO r2
N SEE Contribuição r2
pred rm2
médio
rm2 delta
EHA 0,521 0,944 3 0,203 0,422 0,261
0,317
0,874 0,681 0,158
SEHA 0,532 0,946 3 0,201 0,072 0,389
0,239 0,300
0,872 0,649 0,173
EHDA 0,538 0,965 4 0,165 0,360 0,230
0,137 0,274
0,851 0,639 0,180
SHDA 0,507 0,975 6 0,145 0,116 0,312
0,149 0,423
0,919 0,753 0,073
89
Tabela 20 - Atividade biológica experimental, predita e resíduos dos compostos do
conjunto teste após predição a partir dos dois melhores modelos de CoMSIA.
Composto
Modelo I b
Modelo II c
pIC50
Experimental
pIC50
Predito
Resíduoa
)
pIC50
Experimental
pIC50
Predito
Resíduoa
)
25 5,55 5,33 0,22* 5,55 5,58 -0,03
32 6,45 6,19 0,27* 6,45 6,09 0,36*
10 5,55 5,53 0,02 5,55 5,46 0,09
19 5,05 5,15 -0,10 5,05 5,05 0,00
13 5,39 5,32 0,08 5,39 5,32 0,07
16 5,10 5,25 -0,15 5,10 5,14 -0,04
35 6,98 7,25 -0,27* 6,98 6,95 0,03 aDiferença entre pIC50 experimental e predito;
b modelo obtido a partir das cargas Gasteiger-Hückel e
alinhamento 1; c modelo obtido a partir das cargas AM1-BCC alinhamento 1; desvio padrão dos resíduos;
*valores residuais que ultrapassaram o desvio padrão (IC = 99%).
Figura 25 - Gráficos da atividade experimental versus predita construídos a partir dos
dois melhores modelos de CoMSIA. (A) modelo I, obtido com cálculo de cargas
Gasteiger-Hückel e alinhamento 1; (B) modelo II, obtido com cálculo de cargas AM1-
BCC e alinhamento 1.
5.3.4.5. Mapas de contorno de CoMSIA
As análises de CoMSIA, assim como as análises de CoMFA, permitem a
visualização de informações a partir de mapas de contorno. Esses mapas podem ser
usados para estimar as regiões das moléculas que são favoráveis ou desfavoráveis para a
atividade biológica e sua interpretação fornece informações úteis no planejamento de
novos compostos bioativos.
90
Foram gerados mapas de contorno para o modelo II, o qual apresentou melhor
capacidade preditiva (Figura 26 ). Os mapas foram gerados utilizando a função contour by
actual. No mapa de contorno estérico, os poliedros verdes indicam regiões em que grupos
volumosos favorecem a atividade biológica, enquanto poliedros amarelos indicam regiões
em que grupos volumosos são desfavoráveis para a atividade biológica. No mapa de
contorno eletrostático, os poliedros vermelhos indicam regiões em que grupos
eletronegativos favorecem a atividade biológica, enquanto os poliedros azuis indicam
regiões em que grupos eletronegativos não são favoráveis a atividade biológica. No mapa
de contorno hidrofóbico, os poliedros amarelos indicam regiões em que grupos
hidrofóbicos favorecem a atividade biológica, enquanto os poliedros cinzas indicam
regiões em que grupos hidrofóbicos são desfavoráveis para atividade biológica. No mapa
de aceptores de ligação de hidrogênio, os poliedros de cor violeta indicam regiões em que
aceptores de ligação de hidrogênio são favoráveis a atividade biológica, enquanto os
poliedros de cor magenta indicam regiões em que aceptores de ligação de hidrogênio são
desfavoráveis a atividade biológica.
Figura 26 - Mapas de contorno obtidos a partir do modelo II (SEHA). (A) mapa de
contorno estérico; (B) mapa de contorno eletrostático; (C) mapa de contorno hidrofóbico;
(D) mapa de contorno de aceptores de ligação de hidrogênio.
91
O mapa de contorno estérico (Figura 26A), ao indicar a região em que grupos
volumosos são favoráveis, sugere novamente a importância do anel furano na atividade
biológica da série de compostos. O mapa de contorno eletrostático (Figura 26B), assim
como nos estudos de CoMFA, destaca a importância da carbonila para a atividade
biológica através do mecanismo de liberação de NO. O mapa de contorno hidrofóbico
indica que grupos hidrofóbicos são desfavoráveis na região em que se encontram os dois
oxigênios (O12 e O11) das carbonilas, sugerindo a importância de grupos polares nessa
região e reforçando ainda mais o papel da carbonila a atividade biológica. O mapa de
contorno de aceptores de ligação de hidrogênio confirma também a importância para a
atividade biológica de aceptores de ligação de hidrogênio, como o átomo de oxigênio O12
da carbonila. Observa-se que aceptores de ligação de hidrogênio são desfavoráveis em
regiões próximas ao anel furano.
5.4. Planejamento de novos inibidores de SmTGR a partir dos estudos de QSAR
Os estudos de QSAR-2D e QSAR-3D forneceram informações importantes que
foram usadas no planejamento de novos inibidores da enzima SmTGR. Os mapas de
contribuição do HQSAR e os mapas de contorno de CoMFA e CoMSIA indicaram
requisitos estruturais importantes para o planejamento de novos oxadiazóis-2-óxidos
capazes de inibir SmTGR, como se pode observar na figura 27.
O planejamento de novos inibidores de SmTGR foi realizado a partir da estrutura
do composto mais potente do conjunto de dados (composto 33, pIC50 = 7,42). A partir das
informações obtidas dos mapas de HQSAR, CoMFA e CoMSIA, foram propostas
substituições bioisostéricas para os dois anéis furano (anel A e anel B) utilizando o
programa BROOD v.2.0.0. Foi utilizada uma quimioteca de fragmentos, disponível no
programa, com propriedades farmacocinéticas e parâmetros de acessibilidade sintética
desejáveis.
92
Figura 27 – Resumo das informações obtidas através dos estudos de QSAR-2D e QSAR-
3D.
Após as modificações no anel A, foram obtidas 1000 moléculas agrupadas em 17
clusters, obtendo-se 17 cluster-heads, que são as moléculas mais representativas de cada
cluster. Entretanto, apenas 9 moléculas foram selecionadas. Cinco moléculas que
apresentavam quiralidade foram excluídas, pois os compostos usados na construção dos
modelos de QSAR não apresentavam quiralidade. Outras 3 moléculas foram excluídas,
pois as modificações realizadas não estavam de acordo com os mapas dos modelos de
QSAR. Após as modificações no anel B, foram obtidas 1000 moléculas agrupadas em 20
clusters. Das 20 cluster-heads iniciais, foram escolhidas apenas 3, após a retirada de
compostos quirais e compostos que não estavam de acordo com os mapas de QSAR.
Portanto, foram obtidos 12 novos compostos que tiveram suas atividades biológicas
preditas pelos melhores modelos de QSAR-2D e QSAR-3D.
Antes de se realizar a predição da atividade dos novos compostos, os mesmos
foram preparados. Foram gerados confôrmeros para os compostos por meio do programa
OMEGA v.2.4.6. A escolha dos melhores confôrmeros de cada molécula foi realizada
após sobreposição, no programa ROCS, com o composto mais potente do conjunto de
dados. Os melhores confôrmeros foram escolhidos através dos escores de
TanimotoCombo e posteriormente foram submetidos ao cálculo de cargas AM1-BCC. A
atividade biológica dos 12 novos compostos foi predita através dos três melhores modelos
de QSAR (HQSAR, CoMFA CoMSIA) e foi feita uma média (consenso) das predições
(Tabela 21).
93
Tabela 21 – Estrutura química, valores de pIC50 preditos e valores de IC50 preditos para os
potenciais inibidores de SmTGR e o composto 33.
a pIC50 predito pelo melhor modelo de HQSAR;
b pIC50 predito pelo melhor modelo de CoMFA;
c pIC50 predito
pelo melhor modelo de CoMSIA; d Consenso das predições.
e AS = acessibilidade sintética; * pIC50
experimental = 7,42.
Comp Estrutura HQSARa
(A/DA)
CoMFAb
CoMSIAc
Consenso d
IC50 pred
(M)
ASe
hit-1
7,609 6,518 6,927 7,018 0,095 0,55
hit-2
6,934 5,831 6,323 6,362 0,434 0,62
hit-3
7,543 6,464 5,969 6,658 0,219 0,53
hit-4
7,494 6,631 6,671 6,932 0,116 0,53
hit-5
8,243 5,959 5,442 6,548 0,283 0,54
hit-6
7,558 5,814 5,714 6,362 0,434 0,45
hit-7
8,469 6,008 5,685 6,720 0,190 0,54
hit-8
7,606 6,311 6,367 6,71 0,194 0,53
hit-9
8,075 6,051 6,006 6,710 0,194 0,55
hit-10
6,663 5,589 6,360 6,204 0,625 0,62
94
Tabela 21 (cont.) – Estrutura química, valores de pIC50 preditos e valores de IC50 preditos
para os potenciais inibidores de SmTGR e o composto 33.
a pIC50 predito pelo melhor modelo de HQSAR;
b pIC50 predito pelo melhor modelo de CoMFA;
c pIC50 predito
pelo melhor modelo de CoMSIA; d Consenso das predições.
e AS = acessibilidade sintética; * pIC50
experimental = 7,42.
Dentre os novos compostos planejados, o hit-1 demonstrou ser o mais promissor.
Apesar de a potência predita para esse composto ser inferior à do composto 33, o valor de
IC50 predito foi igual a 0,095 M, ou seja, o composto é um potencial inibidor da enzima
SmTGR em escala nanomolar. Além disso, a boa acessibilidade sintética (AS) de 0,55 indica
que o hit-1 é um composto promissor para que seja dado prosseguimento à síntese e
avaliação experimental. Considerando-se a boa acessibilidade sintética dos compostos, a
qual tem seu valor sempre superior a 0,5, com exceção do hit-6, todos os potenciais
inibidores dão possibilidades de se realizar a síntese e a avaliação experimental.
Comp Estrutura HQSARa
(A/DA)
CoMFAb
CoMSIAc
Consensod
IC50 pred
(M)
ASe
hit-11
7,612 5,359 7,236 6,735 0,184 0,55
hit-12
7,543 6,205 6,013 6,587 0,258 0,53
33*
7,567 7,414 7,410 7,463 0,034 -
95
6. CONCLUSÕES
Os oxadiazóis-2-óxidos parecem exercer atividade esquistossomicida através
de um mecanismo de ação duplo, pois inibem a enzima SmTGR através da
ligação (S-nitrosilação) a resíduos de cisteína e selenocisteína e liberam, ao
mesmo tempo, o NO, o qual exerce atividade antiparasitária;
Os modelos de HQSAR, CoMFA e CoMSIA para a série de oxadiazóis-2-
óxidos inibidores da enzima SmTGR apresentaram bons resultados estatísticos,
tanto de validação interna quanto externa. Tais modelos foram usados para a
predição da atividade biológica de novos compostos;
Os mapas de contribuição do HQSAR e de contorno de CoMFA e CoMSIA
indicaram a importância de determinados grupos para a atividade biológica
como, por exemplo, a carbonila e os anéis tiofênico e furano. Os mapas
permitiram correlacionar a estrutura dos inibidores com o mecanismo de
liberação de NO pelos oxadiazóis-2-óxidos;
Os estudos de QSAR-3D utilizando dois métodos diferentes de cálculo de
cargas e duas estratégias de alinhamento demonstraram a importância do
cálculo do potencial eletrostático e do alinhamento molecular nos estudos de
CoMFA e CoMSIA;
As cargas AM1-BCC e a estratégia de alinhamento pelo ROCS geraram
modelos de QSAR-3D superiores aos obtidos com as cargas Gasteiger-Hückel
e alinhamento pelo Surflex-Sim;
As informações obtidas dos mapas gerados por HQSAR, CoMFA e CoMSIA
foram utilizadas no planejamento de novos inibidores da enzima SmTGR,
permitindo a identificação de um potencial inibidor na faixa nanomolar.
96
7. PERSPECTIVAS
A identificação de 12 novos potenciais inibidores com boa acessibilidade sintética
justifica a realização da síntese desses compostos e posterior validação experimental
através de ensaios biológicos de inibição da enzima SmTGR e de ensaios in vitro contra
Schistosoma mansoni. Além disso, é interessante a realização de estudos in silico de
predição de propriedades físico-químicas e farmacocinéticas para garantir que os
compostos apresentem propriedades ADMET satisfatórias.
97
8. REFERÊNCIAS BIBLIOGRÁFICAS
ABDUL-GHANI, R. et al. Current chemotherapy arsenal for schistosomiasis mansoni:
alternatives and challenges. Parasitology research, v. 104, n. 5, p. 955–965, 2009.
ABDULLA, M.-H. et al. Schistosomiasis mansoni: novel chemotherapy using a cysteine
protease inhibitor. PLoS medicine, v. 4, n. 1, p. e14, 2007.
ADAMS, C. P.; BRANTNER, V. V. Estimating the cost of new drug development: is it really
802 million dollars? Health affairs (Project Hope), v. 25, n. 2, p. 420–428, 2006.
ALBUQUERQUE, M. G. et al. Multidimensional-QSAR: Beyond the third-dimension in drug
design. In: TAFT, C. A.; SILVA, C. H. T. P. (Eds.). Current methods in medicinal
chemistry and biological physics. Kerala: Research signpost, 2007. v. 1p. 91–100.
ANGELUCCI, F. et al. Glutathione reductase and thioredoxin reductase at the crossroad: the
structure of Schistosoma mansoni thioredoxin glutathione reductase. Proteins, v. 72, n. 3, p.
936–945, 2008.
ANGELUCCI, F. et al. Mapping the catalytic cycle of Schistosoma mansoni thioredoxin
glutathione reductase by X-ray crystallography. The Journal of biological chemistry, v. 285,
n. 42, p. 32557–32567, 2010.
ANGELUCCI, F. et al. Macromolecular bases of antischistosomal therapy. Current topics in
medicinal chemistry, v. 11, n. 16, p. 2012–2028, 2011.
BAJORATH, J. Computational chemistry in pharmaceutical research: at the crossroads.
Journal of computer-aided molecular design, v. 26, n. 1, p. 11–12, 2012.
BAUMANN, K. Cross-validation as the objective function for variable-selection techniques.
TrAC Trends in Analytical Chemistry, v. 22, n. 6, p. 395–406, 2003.
BEZERRA, J. C. B. et al. Ocorrência de paraplegia associada a infecção com Schistosoma
mansoni não autóctone no estado de Goiás. Revista de patologia tropical, v. 25, n. 1, p. 73–
79, 1996.
BONESSO-SABADINI, P. I. P.; DIAS, L. C. S. Altered Response of Strain of Schistosoma
mansoni to Oxamniquine and Praziquantel. Memórias do instituto oswaldo cruz, v. 97, n. 3,
p. 381–385, 2002.
BROOD version 2.0.0, OpenEye Scientific Software, Inc., Santa Fe, NM, USA,
www.eyesopen.com, 2010.
CAFFREY, C. R. Chemotherapy of schistosomiasis: present and future. Current opinion in
chemical biology, v. 11, n. 4, p. 433–439, 2007.
CAFFREY, C. R.; SECOR, W. E. Schistosomiasis: from drug deployment to drug
development. Current opinion in infectious diseases, v. 24, n. 5, p. 410–417, 2011.
98
CDC. Centers for Disease Control and Prevention. Disponível em:
<http://www.cdc.gov/parasites/schistosomiasis/biology.html> Acesso em: 10 ago. 2013.
CLARK, M.; CRAMER III, R. D.; VAN OPDENBOSCH, N. Validation of the general
purpose tripos 5.2 force field. Journal of computational chemistry, v. 10, n. 8, p. 982–1012,
1989.
CLARK, R. D. Boosted leave-many-out cross-validation: the effect of training and test set
diversity on PLS statistics. Journal of computer-aided molecular design, v. 17, n. 2-4, p.
265–275, 2003.
CLARK, R. D. Prospective ligand- and target-based 3D QSAR: state of the art 2008. Current
topics in medicinal chemistry, v. 9, n. 9, p. 791–810, 2009.
COHEN, N. C. Guidebook on molecular modeling in drug design. San Diego: Academic
Press, 1996. p. 361
CONLON, C. P. Schistosomiasis. Medicine, v. 33, n. 8, p. 64–67, 2005.
CONSONNI, V.; BALLABIO, D.; TODESCHINI, R. Evaluation of model predictive ability
by external validation techniques. Journal of Chemometrics, v. 24, n. 3-4, p. 194–201, 17
2010.
CRAMER, R. D. The inevitable QSAR renaissance. Journal of computer-aided molecular
design, v. 26, n. 1, p. 35–38, 2012.
CRAMER, R. D.; PATTERSON, D. E.; BUNCE, J. D. Comparative molecular field analysis
(CoMFA). 1. Effect of shape on binding of steroids to carrier proteins. Journal of the
american chemical society, v. 110, n. 18, p. 5959–5967, 1988.
DEARDEN, J. C.; CRONIN, M. T. D.; KAISER, K. L. E. How not to develop a quantitative
structure-activity or structure-property relationship (QSAR/QSPR). SAR and QSAR in
environmental research, v. 20, n. 3-4, p. 241–266, 2009.
DIMASI, J. A; HANSEN, R. W.; GRABOWSKI, H. G. The price of innovation: new
estimates of drug development costs. Journal of health economics, v. 22, n. 2, p. 151–85,
2003.
DOENHOFF, M. J. et al. Praziquantel: its use in control of schistosomiasis in sub-Saharan
Africa and current research needs. Parasitology, v. 136, n. 13, p. 1825–1835, 2009.
DOWEYKO, A. M. 3D-QSAR illusions. Journal of computer-aided molecular design, v.
18, n. 7-9, p. 587–596, 2004.
DUDEK, A. Z.; ARODZ, T.; GÁLVEZ, J. Computational methods in developing quantitative
structure-activity relationships (QSAR): a review. Combinatorial chemistry & high
throughput screening, v. 9, n. 3, p. 213–228, 2006.
99
DUFFY, B. C. et al. Early phase drug discovery: cheminformatics and computational
techniques in identifying lead series. Bioorganic & medicinal chemistry, v. 20, n. 18, p.
5324–5342, 2012.
ELEBRING, T.; GILL, A.; PLOWRIGHT, A. T. What is the most important approach in
current drug discovery: doing the right things or doing things right? Drug discovery today, v.
17, n. 21-22, p. 1166–1169, 2012.
FEELISCH, M.; SCHÖNAFINGER, K.; NOACK, E. Thiol-mediated generation of nitric
oxide accounts for the vasodilator action of furoxans. Biochemical pharmacology, v. 44, n.
6, p. 1149–1157, 1992.
FENWICK, A. The global burden of neglected tropical diseases. Public health, v. 126, n. 3,
p. 233–236, 2012.
FERREIRA, R. S.; OLIVA, G.; ANDRICOPULO, A. D. Integração das técnicas de triagem
virtual e triagem biológica automatizada em alta escala: oportunidades e desafios em P&D de
fármacos. Química nova, v. 34, n. 10, p. 1770–1778, 2011.
GASCO, A. et al. NO donors: Focus on furoxan derivatives. Pure and applied chemistry, v.
76, n. 5, p. 973–981, 2004.
GASHAW, I. et al. What makes a good drug target? Drug discovery today, v. 16, n. 23-24,
p. 1037–1043, 2011.
GASTEIGER, J.; MARSILI, M. A new model for calculating atomic charges in molecules.
Tetrahedron letters, v. 19, n. 34, p. 3181–3184, 1978.
GOLBRAIKH, A.; TROPSHA, A. Beware of q2! Journal of molecular graphics &
modelling, v. 20, n. 4, p. 269–276, 2002.
GRANT, J. A.; GALLARDO, M. A.; PICKUP, B. T. A fast method of molecular shape
comparison: A simple application of a Gaussian description of molecular shape. Journal of
computational chemistry, v. 17, n. 14, p. 1653–1666, 1996.
GRAY, D. J. et al. Diagnosis and management of schistosomiasis. British medical journal,
v. 342, n. d2651, p. 1–11, 2011.
GRYSEELS, B. et al. Human schistosomiasis. Lancet, v. 368, n. 9541, p. 1106–1118, 2006.
GRYSEELS, B. Schistosomiasis. Infectious disease clinics of North America, v. 26, n. 2, p.
383–397, 2012.
GUIDO, R. V. C.; ANDRICOPULO, A. D.; OLIVA, G. Planejamento de fármacos,
biotecnologia e química medicinal: aplicações em doenças infecciosas. Estudos avançados,
v. 24, n. 70, p. 81–98, 2010.
GUIDO, R. V. C.; OLIVA, G.; ANDRICOPULO, A. D. Virtual screening and its integration
with modern drug design technologies. Current medicinal chemistry, v. 15, n. 1, p. 37–46,
2008.
100
GUIDO, R. V. C.; OLIVA, G.; ANDRICOPULO, A. D. Modern drug discovery technologies:
opportunities and challenges in lead discovery. Combinatorial chemistry & high
throughput screening, v. 14, n. 10, p. 830–839, 2011.
HAGAN, P. et al. Schistosomiasis control: keep taking the tablets. Trends in parasitology, v.
20, n. 2, p. 92–97, 2004.
HANSCH, C.; FUJITA, T. p-σ-π analysis. A method for the correlation of biological activity
and chemical structure. Journal of the american chemical society, v. 86, n. 8, p. 1616–1626,
1964.
HASEGAWA, K.; FUNATSU, K. Evolution of PLS for Modeling SAR and omics Data.
Molecular informatics, v. 31, n. 11-12, p. 766–775, 2012.
HAWKINS, P. C. D. et al. Conformer generation with OMEGA: algorithm and validation
using high quality structures from the Protein Databank and Cambridge Structural Database.
Journal of chemical information and modeling, v. 50, n. 4, p. 572–584, 2010.
HAWKINS, P. C. D.; SKILLMAN, A G.; NICHOLLS, A. Comparison of shape-matching
and docking as virtual screening tools. Journal of medicinal chemistry, v. 50, n. 1, p. 74–82,
2007.
HOPFINGER, A. J. et al. Construction of 3D-QSAR Models Using the 4D-QSAR Analysis
Formalism. Journal of the american chemical society, v. 119, n. 43, p. 10509–10524, 1997.
HUANG, H. et al. Investigations of the catalytic mechanism of thioredoxin glutathione
reductase from Schistosoma mansoni. Biochemistry, v. 50, n. 26, p. 5870–5882, 2011.
HUGHES, J. P. et al. Principles of early drug discovery. British journal of pharmacology,
v. 162, n. 6, p. 1239–1249, 2011.
JAIN, A. N. Ligand-based structural hypotheses for virtual screening. Journal of medicinal
chemistry, v. 47, n. 4, p. 947–961, 2004.
JAKALIAN, A. et al. Fast, Efficient Generation of High-Quality Atomic Charges. AM1-BCC
Model: I. Method. Journal of computational chemistry, v. 21, n. 2, p. 132–146, 1999.
JAKALIAN, A.; JACK, D. B.; BAYLY, C. I. Fast, efficient generation of high-quality atomic
charges. AM1-BCC model: II. Parameterization and validation. Journal of computational
chemistry, v. 23, n. 16, p. 1623–1641, 2002.
JOHANSSON, L.; GAFVELIN, G.; ARNÉR, E. S. J. Selenocysteine in proteins-properties
and biotechnological use. Biochimica et biophysica acta, v. 1726, n. 1, p. 1–13, 2005.
JORGENSEN, W. L. The many roles of computation in drug discovery. Science (New York,
N.Y.), v. 303, n. 5665, p. 1813–1818, 2004.
KAPETANOVIC, I. M. Computer-aided drug discovery and development (CADDD): in
silico-chemico-biological approach. Chemico-biological interactions, v. 171, n. 2, p. 165–
176, 2008.
101
KATZ, N. The discovery of Schistosomiasis mansoni in Brazil. Acta tropica, v. 108, n. 2-3,
p. 69–71, 2008.
KING, C. H. Parasites and poverty: the case of schistosomiasis. Acta tropica, v. 113, n. 2, p.
95–104, 2010.
KLEBE, G.; ABRAHAM, U. Comparative molecular similarity index analysis (CoMSIA) to
study hydrogen-bonding properties and to score combinatorial libraries. Journal of
computer-aided molecular design, v. 13, n. 1, p. 1–10, 1999.
KLEBE, G.; ABRAHAM, U.; MIETZNER, T. Molecular similarity indices in a comparative
analysis (CoMSIA) of drug molecules to correlate and predict their biological activity.
Journal of medicinal chemistry, v. 37, n. 24, p. 4130–4146, 1994.
KLOOS, H. et al. Socioeconomic studies of schistosomiasis in Brazil: a review. Acta tropica,
v. 108, n. 2-3, p. 194–201, 2008.
KROEMER, R. T. et al. Improving the predictive quality of COMFA models. In: KUBINYI,
H.; FOLKERS, G.; MARTIN, Y. C. (Eds.). 3D QSAR in Drug Design Recent Advances.
Dordrecht: Kluwer Academic Publishers, 1998. p. 41–56.
KUBINYI, H. QSAR: Hansch analysis and related approaches. Weinheim: VCH, 1993. p.
1–13
KUBINYI, H. QSAR and 3D QSAR in drug design Part 1: methodology. Drug discovery
today, v. 2, n. 11, p. 457–467, 1997.
KUNTZ, A. N. et al. Thioredoxin glutathione reductase from Schistosoma mansoni: an
essential parasite enzyme and a key drug target. PLoS medicine, v. 4, n. 6, p. e206, 2007.
LAURENT, S. A.-L. et al. Synthesis of “Trioxaquantel”® Derivatives as Potential New
Antischistosomal Drugs. European journal of organic chemistry, v. 2008, n. 5, p. 895–913,
2008.
LINDBERG, W.; PERSSON, J.-A.; WOLD, S. Partial least-squares method for
spectrofluorimetric analysis of mixtures of humic acid and lignin sulfonate. Analytical
chemistry, v. 55, n. 4, p. 643–648, 1983.
LOMBARDINO, J. G.; LOWE, J. A. The role of the medicinal chemist in drug discovery-
then and now. Nature reviews. Drug discovery, v. 3, n. 10, p. 853–862, 2004.
LOUKAS, A.; BETHONY, J. M. New drugs for an ancient parasite. Nature medicine, v. 14,
n. 4, p. 365–367, 2008.
LOWIS, D. R. HQSAR: a new, highly predictive QSAR technique. Tripos technical notes,
v. 1, n. 5, p. 1–17, 1997.
MARTIN, Y. C. 3D QSAR: current state, scope, and limitations. In: KUBINYI, H.;
FOLKERS, G.; MARTIN, Y. C. (Eds.). 3D QSAR in Drug Design Recent Advances.
Dordrecht: Kluwer Academic Publishers, 1998. p. 3–23.
102
MOREIRA, L. S. A. et al. A study of the activity of 2-(alkylamino)-1-phenyl-1-
ethanethiosulfuric acids against infection by Schistosoma mansoni in a murine model.
Transactions of the Royal Society of Tropical Medicine and Hygiene, v. 101, n. 4, p. 385–
390, 2007.
MORGAN, S. et al. The cost of drug development: a systematic review. Health policy
(Amsterdam, Netherlands), v. 100, n. 1, p. 4–17, 2011.
MÜLLNER, A et al. Chemistry and pharmacology of neglected helminthic diseases. Current
medicinal chemistry, v. 18, n. 5, p. 767–789, 2011.
NAUSER, T.; STEINMANN, D.; KOPPENOL, W. H. Why do proteins use selenocysteine
instead of cysteine? Amino acids, v. 42, n. 1, p. 39–44, 2012.
NIH. National Institutes of Health. Mirazid clinicaltrial.gov (NCT01529710), Rockville,
USA, 2012a. Disponível em:
<http://clinicaltrials.gov/ct2/show/NCT01529710?term=schistosomiasis&rank=2>. Acesso
em: 15 ago. 2013.
NIH. National Institutes of Health. Bilhvax1a clinicaltrial.gov (NCT01512277), Rockville,
USA, 2012b. Disponível em:
<http://clinicaltrials.gov/ct2/show/NCT01512277?term=schistosomiasis&rank=12>. Acesso
em: 15 ago. 2013.
NIH. National Institutes of Health. sm14 clinicaltrial.gov (NCT01154049), Rockville, USA,
2012c. Disponível em:
<http://clinicaltrials.gov/ct2/show/NCT01154049?term=schistosomiasis&rank=18>. Acesso
em: 26 mar. 2014.
NIH. National Institutes of Health. Mefloquine clinicaltrial.gov (NCT01132248), Rockville,
USA, 2013. Disponível em:
<http://clinicaltrials.gov/ct2/show/NCT01132248?term=schistosomiasis&rank=5>. Acesso
em: 15 ago. 2013.
NWAKA, S.; HUDSON, A. Innovative lead discovery strategies for tropical diseases. Nature
reviews. Drug discovery, v. 5, n. 11, p. 941–955, 2006.
NWAKA, S.; RIDLEY, R. G. Virtual drug discovery and development for neglected diseases
through public-private partnerships. Nature reviews. Drug discovery, v. 2, n. 11, p. 919–
928, 2003.
OECD. Organization for Economic Co-operation and Development (OECD). Guidance
document on the validation of (Quantitative) Structure-Activity Relationship [(Q)SAR]
models., 2007. Disponível em: <OECD Web>. Acesso em: 5 out. 2013
OJHA, P. K. et al. Further exploring rm2 metrics for validation of QSPR models.
Chemometrics and intelligent laboratory systems, v. 107, n. 1, p. 194–205, 2011.
OLIVEIRA, M. F. et al. Inhibition of heme aggregation by chloroquine reduces Schistosoma
mansoni infection. The Journal of infectious diseases, v. 190, n. 4, p. 843–852, 2004.
103
OMEGA version 2.4.6, OpenEye Scientific Software, Inc., Santa Fe, NM, USA,
www.eyesopen.com, 2012.
OPENEYE. BROOD, version 2.0.0. Santa Fe, NM, USA: p. 110
OPENEYE SCIENTIFIC SOFTWARE INC. ROCS Release 3.1.2, 2011.
PAUL, S. M. et al. How to improve R&D productivity: the pharmaceutical industry’s grand
challenge. Nature reviews. Drug discovery, v. 9, n. 3, p. 203–214, 2010.
PICARD, R. R.; COOK, R. D. Cross-Validation of Regression Models. Journal of the
american statistical association, v. 79, n. 387, p. 575–583, 1984.
PRAST-NIELSEN, S.; HUANG, H.-H.; WILLIAMS, D. L. Thioredoxin glutathione
reductase: its role in redox biology and potential as a target for drugs against neglected
diseases. Biochimica et biophysica acta, v. 1810, n. 12, p. 1262–1271, 2011.
PROTASIO, A. V et al. A systematically improved high quality genome and transcriptome of
the human blood fluke Schistosoma mansoni. PLoS neglected tropical diseases, v. 6, n. 1, p.
e1455, 2012.
PURCELL, W. P.; SINGER, J. A. A Brief Review and Table of Semiempirical Parameters
Used in the Hückel Molecular Orbital Method. Journal of chemical and engineering data,
v. 12, n. 2, p. 235–246, 1967.
PyMol, version 1.3. Schrödinger, LLC, New York, NY, USA, 2010.
QUACPAC version 1.5.0, OpenEye Scientific Software, Inc., Santa Fe, NM, USA,
www.eyesopen.com, 2011.
RAI, G. et al. Structure-Mechanism Insights and the Role of Nitric Oxide Donation Guide the
Development of Oxadiazole-2-Oxides as Therapeutic Agents against Schistosomiasis.
Journal of medicinal chemistry, v. 52, n. 20, p. 6474–6483, 2009.
RIVEAU, G. et al. Safety and immunogenicity of rSh28GST antigen in humans: phase 1
randomized clinical study of a vaccine candidate against urinary schistosomiasis. PLoS
neglected tropical diseases, v. 6, n. 7, p. e1704, 2012.
RIVERO, A. Nitric oxide: an antiparasitic molecule of invertebrates. Trends in parasitology,
v. 22, n. 5, p. 219–225, 2006.
ROCS version 3.1.2, OpenEye Scientific Software, Inc., Santa Fe, NM, USA,
www.eyesopen.com, 2011.
RONKETTI, F. et al. Praziquantel derivatives I: Modification of the aromatic ring.
Bioorganic & medicinal chemistry letters, v. 17, n. 15, p. 4154–7, 2007.
ROY, K. et al. Some case studies on application of “r(m)2” metrics for judging quality of
quantitative structure-activity relationship predictions: emphasis on scaling of response data.
Journal of computational chemistry, v. 34, n. 12, p. 1071–1082, 2013.
104
ROY, P. P.; ROY, K. On Some Aspects of Variable Selection for Partial Least Squares
Regression Models. QSAR & combinatorial science, v. 27, n. 3, p. 302–313, 2008.
SACCOCCIA, F. et al. On the mechanism and rate of gold incorporation into thiol-dependent
flavoreductases. Journal of inorganic biochemistry, v. 108, p. 105–111, 2012.
SALUM, L. B.; ANDRICOPULO, A. D. Fragment-based QSAR: perspectives in drug design.
Molecular diversity, v. 13, n. 3, p. 277–285, 2009.
SALVADOR-RECATALÀ, V.; GREENBERG, R. M. Calcium channels of schistosomes:
unresolved questions and unexpected answers. Wiley interdisciplinary reviews. Membrane
transport and signaling, v. 1, n. 1, p. 85–93, 2012.
SAYED, A. A. et al. Identification of oxadiazoles as new drug leads for the control of
schistosomiasis. Nature medicine, v. 14, n. 4, p. 407–412, 2008.
SCIOR, T. et al. How to recognize and workaround pitfalls in QSAR studies: a critical
review. Current medicinal chemistry, v. 16, n. 32, p. 4297–4313, 2009.
SEEL, M.; TURNER, D. B.; WILLETT, P. Effect of Parameter Variations on the
Effectiveness of HQSAR Analyses. Molecular informatics, v. 18, n. 3, p. 245–252, 1999.
SIMEONOV, A. et al. Quantitative high-throughput screen identifies inhibitors of the
Schistosoma mansoni redox cascade. PLoS neglected tropical diseases, v. 2, n. 1, p. e127,
2008.
STANTON, D. T. QSAR and QSPR Model Interpretation Using Partial Least Squares ( PLS )
Analysis. Current computer-aided drug design, v. 8, n. 2, p. 107–127, 2012.
SU, D. et al. Mammalian selenoprotein thioredoxin-glutathione reductase. Roles in disulfide
bond formation and sperm maturation. The Journal of biological chemistry, v. 280, n. 28, p.
26491–26498, 2005.
SYBYL-X, version 1.2: Tripos, Inc., St. Louis, MO, USA , 2010.
TALELE, T. T.; KHEDKAR, S. A; RIGBY, A. C. Successful applications of computer aided
drug discovery: moving drugs from concept to the clinic. Current topics in medicinal
chemistry, v. 10, n. 1, p. 127–141, 2010.
TRIPOS, HQSAR TM Manual: SYBYL®-X 1.1 2010.Saint Louis, USA, 2010a.
TRIPOS,QSAR and COMFA® Manual: SYBYL®-X 1.1 2010.Saint Louis, USA, 2010b.
TSAI, K.-C. et al. A comparison of different electrostatic potentials on prediction accuracy in
COMFA and CoMSIA studies. European journal of medicinal chemistry, v. 45, n. 4, p.
1544–1551, 2010.
UTZINGER, J. et al. Artemisinins for schistosomiasis and beyond. Current opinion in
investigational drugs (London, England : 2000), v. 8, n. 2, p. 105–116, 2007.
105
VAN NASSAUW, L. et al. Schistosomicidal activity of the antimalarial drug, mefloquine, in
Schistosoma mansoni-infected mice. Travel medicine and infectious disease, v. 6, n. 5, p.
253–258, 2008.
VEDANI, A et al. Multiple-conformation and protonation-state representation in 4D-QSAR:
the neurokinin-1 receptor system. Journal of medicinal chemistry, v. 43, n. 23, p. 4416–
4427, 2000.
VEDANI, A. et al. Novel ligands for the chemokine receptor-3 (CCR3): a receptor-modeling
study based on 5D-QSAR. Journal of medicinal chemistry, v. 48, n. 5, p. 1515–1527, 2005.
VEDANI, A.; DOBLER, M.; LILL, M. A. Combining protein modeling and 6D-QSAR.
Simulating the binding of structurally diverse ligands to the estrogen receptor. Journal of
medicinal chemistry, v. 48, n. 11, p. 3700–3703, 2005.
VERMA, J.; KHEDKAR, V. M.; COUTINHO, E. C. 3D-QSAR in drug design - a review.
Current topics in medicinal chemistry, v. 10, n. 1, p. 95–115, 2010.
WANG, W.; WANG, L.; LIANG, Y.-S. Susceptibility or resistance of praziquantel in human
schistosomiasis: a review. Parasitology research, v. 111, n. 5, p. 1871–1877, 2012.
WEIGELT, J. et al. Structural genomics and drug discovery: all in the family. Current
opinion in chemical biology, v. 12, n. 1, p. 32–39, 2008.
WERMUTH, C. et al. Glossary of terms used in medicinal chemistry (IUPAC
recommendations 1998). Pure and applied chemistry, v. 71, n. 10, p. 1919–1981, 1998.
WHO. Schistosomiasis: progress report 2001-2011 and strategic plan 2012-2020., 2013a.
WHO. Sustaining the drive to overcome the global impact of neglected tropical diseases.,
2013b.
WOLD, S.; SJÖSTRÖM, M.; ERIKSSON, L. PLS-regression: a basic tool of chemometrics.
Chemometrics and intelligent laboratory systems, v. 58, n. 2, p. 109–130, 2001.
XIAO, S.-H. et al. In vitro and in vivo activities of synthetic trioxolanes against major human
schistosome species. Antimicrobial agents and chemotherapy, v. 51, n. 4, p. 1440–1445,
2007.