Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
コンピュータを用いた分子標的創薬 (産総研広川) 2011年10月21日
1
コンピュータを用いた分子標的創薬
広川貴次
創薬分子設計チーム 生命情報工学研究センター産業技術総合研究所
東京大学大学院 新領域創成科学研究科東京医科歯科大学 疾患生命科学研究部北海道大学大学院 生命科学院
GCOE「ゲノム情報ビッグバン」「全学自由研究ゼミナール」
2011 年度冬学期 10月21日
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
2011年10月21日 © 2011 Takatsugu Hirokawa 2
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C 医薬品分子とは
2011年10月21日 © 2011 Takatsugu Hirokawa 3
生物学的活性の変化を導く分子(低分子、ペプチド、抗体等含む)
酵素 Inhibitors受容体 Agonists or antagonistsイオンチャネル Blockers輸送タンパク質 InhibitorsDNA Blockers
創薬標的分子
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
2011年10月21日 © 2011 Takatsugu Hirokawa 4
創薬研究の推移
世代 主なアプローチ、手法
第一世代(1940年代~) 抗生物質の発見・改良・合成
第二世代(1960年代~) 生理学的な研究に基づく受容体拮抗、イオンチャネル阻害、酵素阻害
第三世代(1970年代~) 分子生物学やバイオテクノロジーに基づくバイオ医薬品
第四世代(1980年代~)
遺伝子治療、転写因子阻害剤などによる難病への遺伝子レベルのアプローチ。化学物質については、コンビナトリアルケミストリ、ハイスループットスクリーニングなど
第五世代(2000年代~)ヒトの遺伝子情報の解明、バイオインフォマティクスによるゲノム創薬。構造ゲノミクスによる受容体構造の活用。
創薬研究: 生物系と化学物質の選択的相互作用の解明
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
“the total number of possible small organic molecules that populate 'chemical space' has been estimated to exceed 1060 — an amount so vast when compared to the number of such molecules we have made, or indeed could ever hope to make, that it might as well be infinite.”
Nature 432, 823, 2004より
2011年10月21日 © 2011 Takatsugu Hirokawa 5
化合物(創薬分子)の多様性
• ヒトの遺伝子 ≒ 2万2千• ヒト塩基配列 ≒ 30億• ヒトの細胞数 ≒ 60兆
Nature 432, 823 (16 December 2004)Nature chemical space特集記事
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
2011年10月21日 © 2011 Takatsugu Hirokawa 6
宝(医薬品分子)探しの旅
Nature 432, 824-828(16 December 2004)より
人が作った合成化合物 天然物上市医薬品
ただ、やみくもに探索しても新薬にたどり着けない
※キラリティや芳香族環の寄与がコンビケム合成だけでは不十分
化合物空間における広がり比較
コンピュータを用いた分子標的創薬 (産総研広川) 2011年10月21日
2
2011年10月21日 © 2011 Takatsugu Hirokawa 7
薬物受容体
活性物質
花粉症の発作が起きるとき、私たちの体内では「ヒスタミン」という化学物質が分泌されます。この「ヒスタミン」が細胞内のある特定な部分に結合することによって、鼻づまりといった花粉症の症状を引き起こします。
この「ヒスタミン」が特異的に結合する細胞内のある特定な部分を「薬物受容体」と呼んでいます。
阻害物質
某製薬会社の鼻炎用薬のCMでおなじみの・・・
「シベ○ン」という薬は、この「ヒスタミン」より先にヒスタミンの受容体に結合することによって、ヒスタミンの作用を妨害して花粉症の症状を軽減させているのです。
分子標的創薬:「鍵と鍵穴」理論
多くの薬は、このように「薬物受容体」というところに結合して、薬理作用を発揮します。
この「薬物受容体」は、それぞれ特異的な構造を持つ化学物質としか結合しません。そんなことから、この「薬物受容体」に結合して薬が作用を発揮するという理論を「鍵と鍵穴」理論ということがあります。すなわち、「薬」が「鍵」で、「薬物受容体」が「鍵穴」です。
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
© 2011 Takatsugu Hirokawa 8
• 「鍵と鍵穴」理論– 酵素による糖の異性体認識(
Emil Fischer, 1894)• Structure-based drug
design(SBDD)分野の発展– X線(主にリガンドとの共結晶構造)、NMR、計算機モデリング構造の活用
– 計算機によるリガンド再挿入実験の高精度化(Friesner et al., J. Med. Chem., 2006)
分子標的創薬の歴史と現状
2011年10月21日
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C 分子標的創薬の歴史(抗がん剤を例に)
2011年10月21日 © 2011 Takatsugu Hirokawa 9
Entryホルモン療法
分子標的治療
1960
1894
ナイトロジェンマスタードシクロホスファミドイホマイド
ビンカアルカノイドアドリアマイシン、5-FU
シスプラチンカルボプラチンエトポシド
イリノテカンパクリタキセルドセタキセルオキザリプラチン
ハーセプチンリツキサングリーベックイレッサアバスチン
タモキシフェン
プロゲステロンアロマターゼ阻害剤
タンパク質立体構造の登録件数
Emil Fischer酵素による糖の異性体認識
ヒトゲノム配列決定
化学療法
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C 講義内容
• イントロダクション• 計算機手法による医薬品探索(インシリコスクリーニング)
– タンパク質の立体構造を手掛かりに探索する方法• Structure-based drug design
– 化合物(先行品、天然物等)の情報を手掛かりに探索する方法
• Ligand-based drug design
• これからの医薬品探索研究– High Performance Computingと創薬研究の最前線 他
2011年10月21日 © 2011 Takatsugu Hirokawa 10
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
© 2011 Takatsugu Hirokawa 11
医薬品探索方法(インシリコスクリーニング)
N
N
NH
Don Acc
Aro2D fingerprintSubstructure search Volume/surface match 3D pharmacophore
docking
Compound library
2D 3D
COCCOc1cc2ncnc(Nc3cccc(c3)C#C)c2cc1OCCOC
2011年10月21日
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C インシリコクリーニング法の分類
2011年10月21日 © 2011 Takatsugu Hirokawa 12
長所 短所
既知リガンド情報に依存しない
高精度の手法ほど計算時間がかかる新規ケモタイプの発見
結合に関するエネルギー的寄与を評価
長所 短所
計算時間が高速新規ケモタイプが発見しにくい
タンパク質の構造が未知でも可能
構造類似化合物、同等の活性レベル、作用機序が期待できる
Structure-Based Drug Design (SBDD)
Ligand-Based Drug Design (LBDD)
コンピュータを用いた分子標的創薬 (産総研広川) 2011年10月21日
3
リボソーム
rRNA
DNA
RNA合成酵素
タンパク質
tRNA
mRNA
RNA分子
遺伝子 アミノ酸分子
遺伝情報からタンパク質が作られるまで
2011年10月21日 13© 2011 Takatsugu Hirokawa 2011年10月21日 © 2011 Takatsugu Hirokawa 14
タンパク質の構造:主鎖、側鎖、リボン
2011年10月21日 © 2011 Takatsugu Hirokawa 15
タンパク質構造:表面の表現方法
プローブ球
ファンデルワールス表面
Contact surface
Re-entrant surface
水分子を想定した場合:1.4Å
2011年10月21日 © 2011 Takatsugu Hirokawa 16
タンパク質立体構造:リガンド結合
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
2011年10月21日 © 2011 Takatsugu Hirokawa 17
ドッキング問題
• 計算機的手法による非共有結合複合体予測– シグナル伝達、免疫応答、酵素触媒
– 低分子化合物のもつ物理化学的、薬理学的な機能の分子認識機構から解明
– 立体構造情報に基づく、新しいリード化合物発見、薬物候補の探索(structure-based drug design)
• タンパク質結合部位における自由エネルギー最安定のリガンド(DNA、RNA、タンパク質)結合状態を現実的な時間範囲内で検索、極小化する問題
計算機による再挿入ドッキングの様子(青が天然でのリガンド結合状態)
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
2011年10月21日 © 2011 Takatsugu Hirokawa 18
でも難しい「鍵と鍵穴」理論(その壱)
コンピュータを用いた分子標的創薬 (産総研広川) 2011年10月21日
4
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
2011年10月21日 © 2011 Takatsugu Hirokawa 19
でも難しい「鍵と鍵穴」理論 (その弐)差し込む方向にも多くの選択肢がある!
「鍵」
「鍵穴」
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C ポケット部位の探索方法
2011年10月21日 © 2011 Takatsugu Hirokawa 20
1. Computational Geometry: Voronoi Diagram,Delaunay Triangulation, and Alpha Shape
2. Discrete Flow
staphyloccocal nucleaseのalpha shapeモデル(上)とBinding site(下:緑のCPK), Jiang et al.,1998より
Empty Delaunay triangulation
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
2011年10月21日 © 2011 Takatsugu Hirokawa 21
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C タンパク質-リガンドドッキング
距離のヒストグラムを作成
R
N化合物の中心から表面へ向けて距離を計算
グリット点から表面へ向けて距離を計算
R
N
R
N
・・・・・・
分布の比較から適切なグリッドを検討
タンパク質のポケット
2009年6月5日 タンパク質-タンパク質間相互作用を標的としたインシリコ創薬 222011年10月21日 22© 2011 Takatsugu Hirokawa
N
S NH
O
NHO
O
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C スコアリングの基本形
© 2011 Takatsugu Hirokawa 23
水素結合、疎水性相互作用など各相互作用項の総和で結合自由エネルギーを表現
化合物の自由度
2011年10月21日
rotrotlipolipo
ionicionic
bondsHhbbind
NGAG
rfG
rfGGG
,
,
int
0
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
© 2011 Takatsugu Hirokawa 24
•QM/FEP/TI– Quantum Mechanics– Free Energy Perturbation– Thermal dynamics
integration•Molecular Mechanics
– Force field based– MM/PBSA
•Empirical– Empirical function– Knowledge-based
リガンド‐受容体相互作用計算
Accuracy
Months
MD:Weeks
MD/MC:days
Minute
CPU time
参考文献:Pealman et.al., J. Med. Chem. 2001, 44, 3417-3423.
2011年10月21日
コンピュータを用いた分子標的創薬 (産総研広川) 2011年10月21日
5
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
2011年10月21日 © 2011 Takatsugu Hirokawa 25
でも難しい「鍵と鍵穴」理論(その参)
受容体A受容体B
受容体C
受容体D
受容体F
受容体E
本来の標的受容体以外にも作用すると副作用を引き起こす原因となる(選択性が大事)万能鍵があれば・・・・
2011年10月21日 © 2011 Takatsugu Hirokawa 26
膨大な探索空間・・・・
鍵の動き
鍵穴への入り方
結合の強さ
鍵穴もやわらかい
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
2011年10月21日 © 2011 Takatsugu Hirokawa 27
分子動力学シミュレーションの活用
Targeting Structural Flexibility in HIV-1 protease inhibitor binding (DDT 12, 2007)
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
2011年10月21日 © 2011 Takatsugu Hirokawa 28
SBDDにおける課題
LL L
L
LLLL
(a) Lock and key model (b) Induced-fit model (KNF model)
(c) Pre-existing equilibrium model (MWC model)
C.-S. Goh et al., Curr. Opin. Struct. Biol. 14, 2004.
Myosin-Actin, G subunit-RGS14, Flis-FliC
Antibody Spe7-TrxShear3, Gplb-IX-V-Thrombin, NtrC-P
Protein ligand binding mechanisms
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C 講義内容
• イントロダクション• 計算機手法による医薬品探索(インシリコスクリーニング)
– タンパク質の立体構造を手掛かりに探索する方法• Structure-based drug design
– 化合物(先行品、天然物等)の情報を手掛かりに探索する方法
• Ligand-based drug design
• これからの医薬品探索研究– High Performance Computingと創薬研究の最前線 他
2011年10月21日 © 2011 Takatsugu Hirokawa 29
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C バーチャルスクリーニング法の分類
2011年10月21日 © 2011 Takatsugu Hirokawa 30
長所 短所
既知リガンド情報に依存しない
高精度の手法ほど計算時間がかかる新規ケモタイプの発見
結合に関するエネルギー的寄与を評価
長所 短所
計算時間が高速新規ケモタイプが発見しにくい
タンパク質の構造が未知でも可能
構造類似化合物、同等の活性レベル、作用機序が期待できる
Structure-Based Drug Design (SBDD)
Ligand-Based Drug Design (LBDD)
コンピュータを用いた分子標的創薬 (産総研広川) 2011年10月21日
6
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C LBDDの目的と方法
2011年10月21日 © 2011 Takatsugu Hirokawa 31
query
O
O
N
OH
OH
N
CH3
OH
OH
NH
OH
CH3
OH OHO
N
CH3
Substructure searchSimilarity search
Pharmacophore search
Descriptor similarity search
Shape similarity search
構造活性相関誘導体検索
新しいケモタイプの発見(Lead/Scaffold hopping)
active compounds
database compounds
descriptor A descriptor B
descriptor C
Activity Radius
2D fingerprint
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
© 2011 Takatsugu Hirokawa 32
Finger Printによる分子表現:MACCS key
NH2OH
OH
O
O
NH2
NH
OH
NH
CH3
0 1 1 1 0
0 1 1 1 1
1 1 0 1 0
NH
O N N=
代表的な構造キー。全部で990ビットからなる。その内、166ビットについてどのような構造キーであるかが公開されている。MDL Information Systemによって運営されているデータベースなどで採用されている。
2011年10月21日
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
© 2011 Takatsugu Hirokawa 33
類似性基準(定性的特性から)
1 0 1 1 1 0 1 1 0 0 1 1
0 0 1 1 0 0 1 0 1 0 1 1
A
B
j
jAX jBX
a Aにおいて存在
b Bにおいて存在
c 両方の対象に共通の特性の数
d 両方の対象に不在の特性の数
単純一致係数
dcbadc
両対象中の特性の不在によって情報がもたらされない場合
cbac
2011年10月21日
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C LBDDの目的と方法
2011年10月21日 © 2011 Takatsugu Hirokawa 34
query
O
O
N
OH
OH
N
CH3
OH
OH
NH
OH
CH3
OH OHO
N
CH3
Substructure searchSimilarity search
Pharmacophore search
Descriptor similarity search
Shape similarity search
構造活性相関誘導体検索
新しいケモタイプの発見(Lead/Scaffold hopping)
active compounds
database compounds
descriptor A descriptor B
descriptor C
Activity Radius
2D fingerprint
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
© 2011 Takatsugu Hirokawa 35
ファルマコフォア:イントロダクション
F OH NH2 Me Cl
CO2R COSR COCH2R
CONHR CO2H SO2NHR
SO3H PO(OH)NH2
N
O
OHN
N
NH
O
S O
SO
O
N
SO
O
O
N
共通の生物学的等価体
コンセプトは、生物学的等価体に共通している
Don Cat Aro
Acc Ani HydMOE PCH schemeより
基本単位を定義(Feature)
標的分子との相互作用をFeatureの空間配置と拘束条件により抽象化
2011年10月21日
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
© 2011 Takatsugu Hirokawa 36
ファルマコフォア例
ヒスタミンH1受容体をターゲットした阻害剤分子から構築されたファルマコフォア
N
CH3
CH3
N
N
S
N
N
N
N
CH3
CH3 NCH3
CH3
4.7-5.1Å
4.2-7.3Å 4.9-7.3Å
2011年10月21日
コンピュータを用いた分子標的創薬 (産総研広川) 2011年10月21日
7
2011年10月21日 37© 2011 Takatsugu Hirokawa
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
2011年10月21日 © 2011 Takatsugu Hirokawa 38
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C LBDDの目的と方法
2011年10月21日 © 2011 Takatsugu Hirokawa 39
query
O
O
N
OH
OH
N
CH3
OH
OH
NH
OH
CH3
OH OHO
N
CH3
Substructure searchSimilarity search
Pharmacophore search
Descriptor similarity search
Shape similarity search
構造活性相関誘導体検索
新しいケモタイプの発見(Lead/Scaffold hopping)
active compounds
database compounds
descriptor A descriptor B
descriptor C
Activity Radius
2D fingerprint
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
© 2011 Takatsugu Hirokawa 40
化合物記述子:イントロダクション
化合物の分子構造
特性の理解
化合物記述子
表現方法記述子選択からモデル構築へ
記述子の役割
構造分類等
記述子のデータタイプ
タイプ 例
論理型 芳香族あり
整数値 ヘテロ原子数
実数値 分子量
ベクトル 双極子モーメント
テンソル 分極率
スカラー場 静電ポテンシャル
ベクトル場静電ポテンシャルの勾配、力
2011年10月21日
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
© 2011 Takatsugu Hirokawa 41
分子表記の次元による記述子分類
分子表記 記述子 例
0D 原子数、結合数、分子量 MW, atoms, bonds, double bonds
1D フラグメント数 H-bond donor atoms, hydroxyl groups
2D トポロジー情報Zagreb index, Wiener index, Balaban J index, chi connectivity index, kappa shape index, BCUT
3D 幾何学的情報average geometric distance degree, geometric eccentricity, radius of gyration
Surface properties mean molecular electrostatic potential, hydrophobicity
grid properties comparative molecular field analysis
4D 3D coordinates + sampling of conformations
2011年10月21日
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
© 2011 Takatsugu Hirokawa 42
簡易記述子(0、1D)
• 化合物分類に効果的な記述子ではないが、他の記述子と合わせて利用する簡易記述子。主に原子数や結合数など– 任意の原子種の数(重原子、窒素原子)– 回転可能な単結合の数– キラル中心原子の数– 水素結合供与(受容)部位の数– 二(三)重結合の数– 芳香環結合の数– 環構造の数
2011年10月21日
コンピュータを用いた分子標的創薬 (産総研広川) 2011年10月21日
8
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
© 2011 Takatsugu Hirokawa 43
Wiener指標(構造記述子)
• 1947年にWienerによって提唱• 分子内の原子間i,jの最短ルートの総和を指標化
N
i
N
ijj
ijGDGW1 12
1
N
i
N
ijijGwDGwW
1,,
C1
C2 C
3
C4
C5
W(G) = 1+2+3+2+1+2+1+1+2+3 = 18
wは、edgeやvertexに対する加重
2011年10月21日
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
© 2011 Takatsugu Hirokawa 44
オクタノール/水分配係数(log P)の予測
• 薬物分子には、水に溶けるための親水性と生体膜を通過するための適切な疎水性が必要
• Log Pの実測値は、フラスコ振とう法によって測定される– 約30,000化合物について実測値が存在するが、解析する化合物の
数を考えると微々たるもの。
• Log Pを計算で予測することが可能Fragment method– Rekkerらによって開発された、各フラグメントの疎水性への寄与を足し合わせる
ことで化合物の疎水性を予測する方法。補正項は、共鳴相互作用や芳香族の凝縮などについて行う。
2011年10月21日
m
jjj
n
iii Fbfa
11P log ai:フラグメントiの数 fi:フラグメントiの定数
Fj:補正因子 bj:補正度度合い
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
2011年10月21日 © 2011 Takatsugu Hirokawa 45
記述子による解析: Rule of Five• World Drug Indexから選んだ2245個の化
合物で計算した記述子から抽出した結果をルール化したもの。統計解析から90%のWDI化合物が以下の特徴を持っていた– 分子量が500以下– 予測log Pは、5以下– 水素結合供与部位(OH, NH)は、5以下– 水素結合受容部位(O, N)は、10以下
• 実務では、上記の閾値は目的に応じてわずかに異なることが多い
• “5つの規則(5の倍数)”は、5つめの因子を追加することで”5つの規則”と解釈されることもある– 回転可能な結合数は、10以下
×
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
© 2011 Takatsugu Hirokawa 46
記述子を用いた解析:DACCS: Distance function
active compounds
database compounds
High-dimensional Chemical Space
descriptor A descriptor B
descriptor C
Activity Radius
Godden and Bajorath, JCIM 46, 2006
同じ活性クラスの化合物で形成される”Activity Center”とのユークリッド距離dDACSSを化合物類似性に利用
Descriptor数
データベースにおける任意な化合物のDescriptor iの値 活性化合物における
Descriptor iの平均値
2011年10月21日
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C LBDDの目的と方法
2011年10月21日 © 2011 Takatsugu Hirokawa 47
query
O
O
N
OH
OH
N
CH3
OH
OH
NH
OH
CH3
OH OHO
N
CH3
Substructure searchSimilarity search
Pharmacophore search
Descriptor similarity search
Shape similarity search
構造活性相関誘導体検索
新しいケモタイプの発見(Lead/Scaffold hopping)
active compounds
database compounds
descriptor A descriptor B
descriptor C
Activity Radius
2D fingerprint
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
© 2011 Takatsugu Hirokawa 48
ROCS: Gaussian shape modelによる検索
• 形状類似度による分子間比較– Query vs database molecules Shape Tanimoto (0-1)
• 化学的性質の類似度も考慮– Donors overlain with donors etc. Colour score (0-1)
• 形状と化学的性質の複合スコア– Add shape Tanimoto and colour score Combo score; 0-2
• 関連文献– Grant et al., J. Comp. Chem. 17, 1996; Rush et al., J. Med.
Chem. 48, 2005 等www.eyesopen.comより
2011年10月21日
コンピュータを用いた分子標的創薬 (産総研広川) 2011年10月21日
9
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C 講義内容
• イントロダクション• 計算機手法による医薬品探索(インシリコスクリーニング)
– タンパク質の立体構造を手掛かりに探索する方法• Structure-based drug design
– 化合物(先行品、天然物等)の情報を手掛かりに探索する方法
• Ligand-based drug design
• これからの医薬品探索研究– High Performance Computingと創薬研究の最前線 他
2011年10月21日 © 2011 Takatsugu Hirokawa 49
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C 医薬品分子は、どうやって鍵穴を見つけるか?
2011年10月21日 © 2011 Takatsugu Hirokawa 50
D.E. Shaw研究所• D.E.Shaw氏は、世界最大規模のヘッジファンド
D.E.Shaw & Coの創立者。運用資産2.5兆円。現在は、D.E.Shaw Researchのチーフサイエンティスト。MDのアルゴリズムやAntonシステムの開発を行っている。同研究所の運用費用はShaw氏のポケットマネーで賄われていると言われている。
Anton• 分子動力学(Molecular Dynamics:MD)計算専用のスパコン。2万3,558原子のDHFRでは10.4μs/day、11万6,650原子のT7Ligでは3.06μs/dayの性能を達成。
• これまでの汎用スーパーコンピュータでは、1日かかって100ns程度に相当するシミュレーションしか出来ず、msのシミュレーションには何万日も掛かってしまうのが現状。 タンパク質分子の構造変化と時間-空間の相関プロット
10-15 10-12 10-9 10-6 10-3 100 103 106
10-1
100
101
伸縮・曲面運動
メチル基回転
へリックスコイル転移
基質回転
タンパク質の回転
基質・酵素結合
芳香族側鎖回転
タンパク質の折りたたみ、異性化、変性
(秒)
(nm)
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C 医薬品分子は、どうやって鍵穴を見つけるか?
2011年10月21日 © 2011 Takatsugu Hirokawa 51
D.E. Shaw研究所• D.E.Shaw氏は、世界最大規模のヘッジファンド
D.E.Shaw & Coの創立者。運用資産2.5兆円。現在は、D.E.Shaw Researchのチーフサイエンティスト。MDのアルゴリズムやAntonシステムの開発を行っている。同研究所の運用費用はShaw氏のポケットマネーで賄われていると言われている。
Anton• 分子動力学(Molecular Dynamics:MD)計算専用のスパコン。2万3,558原子のDHFRでは10.4μs/day、11万6,650原子のT7Ligでは3.06μs/dayの性能を達成。
• これまでの汎用スーパーコンピュータでは、1日かかって100ns程度に相当するシミュレーションしか出来ず、msのシミュレーションには何万日も掛かってしまうのが現状。
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C
医薬品分子は、どうやって鍵穴を見つけるか?
2011年10月21日 © 2011 Takatsugu Hirokawa 52
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C IL-2/IL-2R
2011年10月21日 54© 2011 Takatsugu Hirokawa
コンピュータを用いた分子標的創薬 (産総研広川) 2011年10月21日
10
Formula C29 H31 N7 O
Molecular Weight 493.60 g/mol
Isomeric SMILES
Cc1ccc(cc1Nc2nccc(n2)c3cccnc3)4ccc(cc4)CN5CCN(CC5)C まとめ
• 新しい創薬支援技術への期待– ゲノム情報やタンパク質立体構造を活かしたSBDD
– 情報科学技術(計算能力、グラフィックス、アルゴリズム)の発展
• 課題– 標的タンパク質の枯渇– タンパク質-タンパク質相互作用阻害、抗体医薬への挑戦
– HPCを如何に活用するか。– 「京」次世代スーパーコンピュータへの期待と産学官連携
2011年10月21日 © 2011 Takatsugu Hirokawa 55
「京」次世代スーパーコンピュータ