Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
KEGG PATHWAY と GENES の利用法
京都大学化学研究所 バイオインフォマティクスセンター
五斗 進
バイオインフォマティクス講習会@北大 生物情報データベース入門 2012/8/9 1
KEGG: Kyoto Encyclopedia of Genes and Genomes
2
http://www.kegg.jp/kegg/kegg_ja.html http://www.genome.jp/kegg/kegg_ja.html
KEGG: Kyoto Encyclopedia of Genes and Genomes
様々な種類のデータを「生命現象の総体」として再構築
化合物の知識 KEGG LIGAND
ゲノムの知識 KEGG GENES
機能の階層分類 相互参照用データ KEGG BRITE
ネットワークの知識 KEGG PATHWAY
高次機能
研究者の知識をゲノムレベルのデータと結びつける
ツールの提供 EGassembler KAAS GENIES KegArray
ツールの提供 e-zyme PathPred SIMCOMP KegArray
3
KEGG: Kyoto Encyclopedia of Genes and Genomes
http://www.genome.jp/kegg/docs/statistics.html 4
ゲノムの知識 KEGG GENES
化合物の知識 KEGG LIGAND
システムの知識 KEGG PATHWAY KEGG MEDICUS
KEGG: Kyoto Encyclopedia of Genes and Genomes
http://www.genome.jp/kegg/kegg_ja.html
http://www.genome.jp/kegg/kegg2.html
5
KEGG PATHWAY 生体内(外)の分子間ネットワーク図
• 代謝系 ‒ 12カテゴリ ‒ 中間代謝、二次代謝、薬の代謝、全体像
• 制御系 ‒ 20カテゴリ ‒ 遺伝制御、環境シグナル、細胞プロセス、生体システム他
• 疾患 ‒ がん、免疫・神経変性・循環器・代謝疾患、感染症
• 薬の開発 ‒ 開発の歴史、標的ベース、構造ベース
http://www.genome.jp/kegg/pathway.html Carbohydrate -> Glycolysis / Gluconeogensis
6
KEGG PATHWAY マップの例:解糖系
• 酵素/遺伝子と化合物のネットワーク
• Pathway menu ‒ BRITE 形式の階層分類
• Organism menu ‒ 生物種リスト
• Pathway entry ‒ パスウェイデータベースのテキストバージョン
• Show description ‒ マップの説明
• User data mapping ‒ マップ中のオブジェクトへの色付け
http://www.genome.jp/kegg/pathway/map/map00010.html 7
KEGG PATHWAY テキストエントリー • Pathway entry ‒ Entry
• マップ番号(map|ko|ec|rn|生物種コード+番号)
‒ Name, Description • パスウェイの説明とモジュールと
の関係 ‒ Class
• 階層分類情報 ‒ Pathway map
• マップ、生物種保存度を考慮したマップ、オーソログテーブル
‒ Disease ‒ Reference
• モジュール ‒ 生物種間での保存、複合体、オペロンを考慮した機能単位
http://www.genome.jp/dbget-bin/www_bget?pathway+map00010 8
KEGG MODULE モジュール
• モジュール ‒ 生物種間での保存、複合体、オペロンを考慮した機能単位
‒ オーソログ ID(K番号)の組み合わせで表現
‒ 対応するオーソログ遺伝子の有無で、機能の有無を判断できるように定義
‒ (K00134,K00150) で OR を表現
‒ Pathway リンクを辿ると、KEGG PATHWAY 中での対応する箇所が色付けされる
http://www.genome.jp/dbget-bin/www_bget?md:M00001 9
KEGG PATHWAY マップの例:解糖系
• Reference pathway ‒ KO, EC, Reaction へのリ
ンク ‒ (KO) オーソログエントリー
へのリンク ‒ (EC) 酵素エントリーへのリ
ンク ‒ (Reaction) 反応エントリー
へのリンク
• 生物種名 ‒ 各生物種の遺伝子エント
リーへのリンク
• Set personalized menu ‒ 生物種の選択
• Sort below by ‒ 生物種名のソート
http://www.genome.jp/kegg/pathway/map/map00010.html 10
KEGG PATHWAY マップの例:解糖系 (EC)
• Reference pathway (EC) ‒ 従来のリファレンスに対応 ‒ 対応する酵素エントリーの
ある箱に色づけ
• Reference pathway (KO) ‒ 対応するオーソログエント
リーのある箱に色づけ ‒ KEGG GENES に登録され
ている生物種が持つ遺伝子に関して配列の類似度を元に定義されているオーソログ情報
‒ 酵素によってはオーソログが定義できないものもある
http://www.genome.jp/kegg/pathway/ko/ko00010.html 11
KGML: KEGG Markup Language
http://www.genome.jp/kegg/ http://www.genome.jp/kegg/xml/
XML フォーマットでパスウェイ中のオブジェクトのつながりを表現
12
• entry タグ ‒ マップ中のオブジェクト ‒ タンパク質(酵素)、化合物、
マップ
• relation タグ ‒ タンパク質同士の関係 ‒ ECrel: マップ中で隣り合っ
た酵素 ‒ PPrel: タンパク質間相互作
用
• reaction タグ ‒ マップ中の化合物を基質と生
成物とした反応。反応の向き。
KGML の中身
解糖系 ko00010 の KGML 13
KEGG PATHWAY 生物種の選択
• リストの生物種を限定する ‒ カテゴリーは KEGG 生物種
一覧のものが指定可能 • Mammals, Protists,
Actinobacteria など
‒ 生物種コードも KEGG 生物種一覧のものが指定可能 • hsa(ヒト), mmu(マウス),
eco(大腸菌)など
http://www.genome.jp/kegg/catalog/org_list.html 14
• 代謝系 ‒ 12カテゴリ ‒ 中間代謝、二次代謝、薬の代謝、全体像
• 制御系 ‒ 20カテゴリ ‒ 遺伝制御、環境シグナル、細胞プロセス、生体システム他
• 疾患 ‒ がん、免疫・神経変性・循環器・代謝疾患、感染症
• 薬の開発 ‒ 開発の歴史、標的ベース、構造ベース
KEGG PATHWAY
http://www.genome.jp/kegg/pathway.html
疾患パスウェイ
15
• 癌に関与する遺伝子の分子間ネットワーク図
• 病原因子となっている遺伝子に赤でマーク
KEGG PATHWAY 疾患パスウェイ
• Homo sapiens (human) + Disease/drug menu • 疾患遺伝子とドラッグターゲットのマッピング
16
KEGG PATHWAY 薬の開発パスウェイ
• 代謝系 ‒ 12カテゴリ ‒ 中間代謝、二次代謝、薬の代謝、全体像
• 制御系 ‒ 19カテゴリ ‒ 遺伝制御、環境シグナル、細胞プロセス他
• 疾患 ‒ がん、免疫・神経変性・循環器・代謝疾患、感染症
• 薬の開発 ‒ 開発の歴史、標的ベース、構造ベース
http://www.genome.jp/kegg/pathway.html 17
KEGG PATHWAY 薬の開発パスウェイ
18
http://www.genome.jp/kegg/pathway.html
PATHWAY の検索とマッピング
• キーワード検索 ‒ Entry, Name, Description
フィールドとマップ中のオブジェクト(遺伝子、オーソログ、反応、化合物)や注釈を対象とした検索
‒ 複数キーワードは AND 検索
• オブジェクトマッピング KEGG Mapper ‒ マップ中のオブジェクトを指
定してパスウェイにマッピング
‒ 複数オブジェクトを指定するとマッチしたものすべてをマッピング
‒ 自由に色付け 19
PATHWAY のキーワード検索
http://www.genome.jp/kegg/pathway.html 20
KRAS などの遺伝子名でも検索してみよう!
PATHWAY のオブジェクトに好きな色を付ける
• オブジェクトの色を指定する(html で使える色指定ならOK)
• Example をコピペ 21 http://www.genome.jp/kegg/pathway.html
PATHWAY のオブジェクトに好きな色を付ける
22
オミックスデータと PATHWAY
ネットワークの知識 KEGG PATHWAY
高次機能
研究者の知識をオミックスデータと結びつける
KegArray KegArray
トランスクリプトーム プロテオーム メタボローム
統合解析の必要性 Kleemann, R., et al., Genome Biol. 8:R200 (2007) など
23
PATHWAY のオブジェクトに好きな色を付ける マイクロアレイ(擬似)のデータを使ってみる http://goto.kuicr.kyoto-u.ac.jp/kegg/test.txt
生物種を指定する(この例ではマウス)
コピペするか、ダウンロードして保存した test.txt をアップロードする
指定以外の遺伝子の色を決める
24
PATHWAY のオブジェクトに好きな色を付ける
25
PATHWAY のオブジェクトに好きな色を付ける
26
KEGG GENOME • KEGG 生物種ごとの入り口
‒ GENES/DGENES:ゲノムが決定された生物種
‒ EGENES:ESTで作成された遺伝子セット
‒ MGENES:メタゲノムデータ ‒ Pangenomes:近縁生物種をまとめたもの
‒ Viruses ‒ 生物種の組み合わせ
http://www.genome.jp/kegg/genome.html
27
複数生物種の情報を PATHWAY にマッピング • 共生関係 • 寄生関係 • ヒトと腸内細菌叢など
• アブラムシ ‒ 昆虫
• ブフネラ ‒ アブラムシの共生細菌
28
複数生物種の情報を PATHWAY にマッピング
アブラムシ ブフネラ 共通 29
ゲノムの機能解析・予測
30
" 遺伝子産物としてのタンパク質間相互作用・転写ネットワーク
" 化合物ネットワークとしての代謝系
ゲノム
化合物、糖鎖、脂質
生命システム理解のための ゲノムの機能解析
31
遺伝子配列情報
配列DB
モチーフDB
立体構造DB
遺伝子の機能
相同性検索 立体構造予測
(A) 遺伝子の機能予測 (B) ゲノムの機能予測
ゲノム情報 (遺伝子の集合)
生物の機能
パスウェイ DB
相互作用DB
発現DB
ネットワーク解析 ↑
配列・構造解析
遺伝子の機能予測とゲノムの機能予測
32
リジン分解系のリファレンスパスウェイ
リファレンスを用いたパスウェイ再構築
33
リファレンスを用いたパスウェイ再構築
ゲノム情報から再構築された緑膿菌のリジン分解系
34
パスウェイ再構築システム
" ゲノム中の全遺伝子リストの作成 " ゲノム、メタゲノムのアセンブリ " 遺伝子領域の予測 " アミノ酸・塩基配列:マルチFASTA形式
" ゲノム中の全遺伝子の機能アノテーション " 複数配列をクエリにして、ゲノムが決定された生物種の配列セットなどに対してホモロジー検索
" 各クエリ配列に対して、双方向ベストヒット情報などを用いてオーソログを割り当て
" オーソログ情報を元にしたパスウェイ再構築
35
パスウェイ再構築システムの例
" MEGAN: MEta Genome ANalyzer " もともとはメタゲノムの生物種マッピング用のツール
" MEGAN4からKEGGやSEEDを用いた機能予測とパスウェイ再構築の機能が拡張された
" RAST: Rapid Annotations using Subsystems Technology " ERGOを開発していたグループがパスウェイに相当するサブシステムをベースに再構築
" メタゲノム用の MG-RAST もある
" KAAS: KEGG Automatic Annotation Server
36
MEGAN による Taxonomy mapping
Huson DH, et al. (2009) BMC Bioinformatics 10:S12
" rRNA データをクエリとして BLAST で nr-nt データベースを検索
" ヒットした配列の元の生物種をリストアップ
" NCBI Taxonomy に基づいて分類木上にヒット数をマッピング
37
MEGAN による Pathway mapping
Huson DH, et al. (2011) Genome Res 21:1552
KAASによるアノテーションとパスウェイ再構築 KAAS: KEGG Automatic Annotation Server http://www.genome.jp/tools/kaas/
DGENES from draft genomes EGENES from EST assembly MGENES from metagenome ・FASTA形式の塩基配列または アミノ酸配列
KEGG GENES に対する BLASTX と逆向きの TBLASTN または両方向 の BLASTP
(Bidirectional) Best Hits に基づく自動アノテーション
・遺伝子と機能との対応表 (KEGG ORTHOLOGY) ・遺伝子機能の階層分類情報 (KEGG BRITE) ・パスウェイへのマッピング (KEGG PATHWAY)
KAASでの機能アノテーション
1. Query gene
2. Homologs
3. Ortholog candidates
4. KO (KEGG ORTHOLOGY) groups
5. Ranking of KO
BLASTX to GENES TBLASTN from GENES
Cut off by bi-directional best hit rate
Grouping by KO
Scoring by probability and heuristics
Bi-directional best hit rate
BHRab = Rf × Rr
Genome A Genome B Gene a Gene a’ Gene b’
Gene b S
S’: best hit
Rf = S / S’
Moriya, Y. et al. Nucl. Acids Res. 2007 35:W182-W185
KAASでのKOに基づくマッピング
Moriya, Y. et al. Nucl. Acids Res. 2007 35:W182-W185
KEGG でカバーしているもの、いないもの
いる
遺伝子 アノテーション
代謝、制御マップ 病気、薬開発マップ
2次元構造 薬、代謝物、反応 反応パターン
いない
制御領域 バリエーション タンパク質立体構造
シミュレーション用の パラメータ
物性、立体構造 速度定数
ゲノム
パスウェイ
化合物
データ間のリンク 外部データベースへのリンク 41
KEGG 日本語ページ http://www.kegg.jp/ja/
日本語による階層分類
日本語によるエントリーポイント
42
KEGG
http://www.genome.jp/kegg/kegg2.html
リリース情報 新規パスウェイや更新状況
43