22
KEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター 五斗 進 バイオインフォマティクス講習会@北大 生物情報データベース入門 2012/8/9 1 KEGG: Kyoto Encyclopedia of Genes and Genomes 2 http://www.kegg.jp/kegg/kegg_ja.html http://www.genome.jp/kegg/kegg_ja.html

KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

KEGG PATHWAY と GENES の利用法

京都大学化学研究所 バイオインフォマティクスセンター

五斗 進

バイオインフォマティクス講習会@北大 生物情報データベース入門 2012/8/9 1

KEGG: Kyoto Encyclopedia of Genes and Genomes

2

http://www.kegg.jp/kegg/kegg_ja.html http://www.genome.jp/kegg/kegg_ja.html

Page 2: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

KEGG: Kyoto Encyclopedia of Genes and Genomes

様々な種類のデータを「生命現象の総体」として再構築             

化合物の知識 KEGG LIGAND

ゲノムの知識 KEGG GENES

機能の階層分類 相互参照用データ KEGG BRITE

ネットワークの知識 KEGG PATHWAY

高次機能

研究者の知識をゲノムレベルのデータと結びつける

ツールの提供  EGassembler  KAAS  GENIES  KegArray

ツールの提供  e-zyme  PathPred  SIMCOMP  KegArray

3

KEGG: Kyoto Encyclopedia of Genes and Genomes

http://www.genome.jp/kegg/docs/statistics.html 4

ゲノムの知識 KEGG GENES

化合物の知識 KEGG LIGAND

システムの知識 KEGG PATHWAY KEGG MEDICUS

Page 3: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

KEGG: Kyoto Encyclopedia of Genes and Genomes

http://www.genome.jp/kegg/kegg_ja.html

http://www.genome.jp/kegg/kegg2.html

5

KEGG PATHWAY 生体内(外)の分子間ネットワーク図

• 代謝系 ‒  12カテゴリ ‒  中間代謝、二次代謝、薬の代謝、全体像

• 制御系 ‒  20カテゴリ ‒  遺伝制御、環境シグナル、細胞プロセス、生体システム他

• 疾患 ‒  がん、免疫・神経変性・循環器・代謝疾患、感染症

• 薬の開発 ‒  開発の歴史、標的ベース、構造ベース

http://www.genome.jp/kegg/pathway.html Carbohydrate -> Glycolysis / Gluconeogensis

6

Page 4: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

KEGG PATHWAY マップの例:解糖系

• 酵素/遺伝子と化合物のネットワーク

• Pathway menu ‒  BRITE 形式の階層分類

• Organism menu ‒  生物種リスト

• Pathway entry ‒  パスウェイデータベースのテキストバージョン

• Show description ‒  マップの説明

• User data mapping ‒  マップ中のオブジェクトへの色付け

http://www.genome.jp/kegg/pathway/map/map00010.html 7

KEGG PATHWAY テキストエントリー • Pathway entry ‒  Entry

•  マップ番号(map|ko|ec|rn|生物種コード+番号)

‒  Name, Description •  パスウェイの説明とモジュールと

の関係 ‒  Class

•  階層分類情報 ‒  Pathway map

•  マップ、生物種保存度を考慮したマップ、オーソログテーブル

‒  Disease ‒  Reference

• モジュール ‒  生物種間での保存、複合体、オペロンを考慮した機能単位

http://www.genome.jp/dbget-bin/www_bget?pathway+map00010 8

Page 5: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

KEGG MODULE モジュール

• モジュール ‒  生物種間での保存、複合体、オペロンを考慮した機能単位

‒  オーソログ ID(K番号)の組み合わせで表現

‒  対応するオーソログ遺伝子の有無で、機能の有無を判断できるように定義

‒  (K00134,K00150) で OR を表現

‒  Pathway リンクを辿ると、KEGG PATHWAY 中での対応する箇所が色付けされる

http://www.genome.jp/dbget-bin/www_bget?md:M00001 9

KEGG PATHWAY マップの例:解糖系

• Reference pathway ‒  KO, EC, Reaction へのリ

ンク ‒  (KO) オーソログエントリー

へのリンク ‒  (EC) 酵素エントリーへのリ

ンク ‒  (Reaction) 反応エントリー

へのリンク

• 生物種名 ‒  各生物種の遺伝子エント

リーへのリンク

• Set personalized menu ‒  生物種の選択

• Sort below by ‒  生物種名のソート

http://www.genome.jp/kegg/pathway/map/map00010.html 10

Page 6: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

KEGG PATHWAY マップの例:解糖系 (EC)

• Reference pathway (EC) ‒  従来のリファレンスに対応 ‒  対応する酵素エントリーの

ある箱に色づけ

• Reference pathway (KO) ‒  対応するオーソログエント

リーのある箱に色づけ ‒  KEGG GENES に登録され

ている生物種が持つ遺伝子に関して配列の類似度を元に定義されているオーソログ情報

‒  酵素によってはオーソログが定義できないものもある

http://www.genome.jp/kegg/pathway/ko/ko00010.html 11

KGML: KEGG Markup Language

http://www.genome.jp/kegg/ http://www.genome.jp/kegg/xml/

XML フォーマットでパスウェイ中のオブジェクトのつながりを表現

12

Page 7: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

• entry タグ ‒  マップ中のオブジェクト ‒  タンパク質(酵素)、化合物、

マップ

• relation タグ ‒  タンパク質同士の関係 ‒  ECrel: マップ中で隣り合っ

た酵素 ‒  PPrel: タンパク質間相互作

• reaction タグ ‒  マップ中の化合物を基質と生

成物とした反応。反応の向き。

KGML の中身

解糖系 ko00010 の KGML 13

KEGG PATHWAY 生物種の選択

• リストの生物種を限定する ‒  カテゴリーは KEGG 生物種

一覧のものが指定可能 •  Mammals, Protists,

Actinobacteria など

‒  生物種コードも KEGG 生物種一覧のものが指定可能 •  hsa(ヒト), mmu(マウス),

eco(大腸菌)など

http://www.genome.jp/kegg/catalog/org_list.html 14

Page 8: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

• 代謝系 ‒  12カテゴリ ‒  中間代謝、二次代謝、薬の代謝、全体像

• 制御系 ‒  20カテゴリ ‒  遺伝制御、環境シグナル、細胞プロセス、生体システム他

• 疾患 ‒  がん、免疫・神経変性・循環器・代謝疾患、感染症

• 薬の開発 ‒  開発の歴史、標的ベース、構造ベース

KEGG PATHWAY

http://www.genome.jp/kegg/pathway.html

疾患パスウェイ

15

• 癌に関与する遺伝子の分子間ネットワーク図

• 病原因子となっている遺伝子に赤でマーク

KEGG PATHWAY 疾患パスウェイ

• Homo sapiens (human) + Disease/drug menu • 疾患遺伝子とドラッグターゲットのマッピング

16

Page 9: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

KEGG PATHWAY 薬の開発パスウェイ

• 代謝系 ‒  12カテゴリ ‒  中間代謝、二次代謝、薬の代謝、全体像

• 制御系 ‒  19カテゴリ ‒  遺伝制御、環境シグナル、細胞プロセス他

• 疾患 ‒  がん、免疫・神経変性・循環器・代謝疾患、感染症

• 薬の開発 ‒  開発の歴史、標的ベース、構造ベース

http://www.genome.jp/kegg/pathway.html 17

KEGG PATHWAY 薬の開発パスウェイ

18

Page 10: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

http://www.genome.jp/kegg/pathway.html

PATHWAY の検索とマッピング

• キーワード検索 ‒  Entry, Name, Description

フィールドとマップ中のオブジェクト(遺伝子、オーソログ、反応、化合物)や注釈を対象とした検索

‒  複数キーワードは AND 検索

• オブジェクトマッピング KEGG Mapper ‒  マップ中のオブジェクトを指

定してパスウェイにマッピング

‒  複数オブジェクトを指定するとマッチしたものすべてをマッピング

‒  自由に色付け 19

PATHWAY のキーワード検索

http://www.genome.jp/kegg/pathway.html 20

KRAS などの遺伝子名でも検索してみよう!

Page 11: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

PATHWAY のオブジェクトに好きな色を付ける

• オブジェクトの色を指定する(html で使える色指定ならOK)

• Example をコピペ 21 http://www.genome.jp/kegg/pathway.html

PATHWAY のオブジェクトに好きな色を付ける

22

Page 12: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

オミックスデータと PATHWAY

ネットワークの知識 KEGG PATHWAY

高次機能

研究者の知識をオミックスデータと結びつける

KegArray KegArray

トランスクリプトーム プロテオーム メタボローム

統合解析の必要性  Kleemann, R., et al., Genome Biol. 8:R200 (2007) など

23

PATHWAY のオブジェクトに好きな色を付ける マイクロアレイ(擬似)のデータを使ってみる http://goto.kuicr.kyoto-u.ac.jp/kegg/test.txt

生物種を指定する(この例ではマウス) 

コピペするか、ダウンロードして保存した test.txt をアップロードする

指定以外の遺伝子の色を決める

24

Page 13: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

PATHWAY のオブジェクトに好きな色を付ける

25

PATHWAY のオブジェクトに好きな色を付ける

26

Page 14: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

KEGG GENOME • KEGG 生物種ごとの入り口

‒  GENES/DGENES:ゲノムが決定された生物種

‒  EGENES:ESTで作成された遺伝子セット

‒ MGENES:メタゲノムデータ ‒  Pangenomes:近縁生物種をまとめたもの

‒  Viruses ‒  生物種の組み合わせ

http://www.genome.jp/kegg/genome.html

27

複数生物種の情報を PATHWAY にマッピング • 共生関係 • 寄生関係 • ヒトと腸内細菌叢など

• アブラムシ ‒ 昆虫

• ブフネラ ‒ アブラムシの共生細菌

28

Page 15: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

複数生物種の情報を PATHWAY にマッピング

アブラムシ ブフネラ 共通 29

ゲノムの機能解析・予測

30

"  遺伝子産物としてのタンパク質間相互作用・転写ネットワーク

"  化合物ネットワークとしての代謝系

ゲノム

化合物、糖鎖、脂質

生命システム理解のための ゲノムの機能解析

Page 16: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

31

遺伝子配列情報

配列DB

モチーフDB

立体構造DB

遺伝子の機能

相同性検索 立体構造予測

(A) 遺伝子の機能予測 (B) ゲノムの機能予測

ゲノム情報 (遺伝子の集合)

生物の機能

パスウェイ DB

相互作用DB

発現DB

ネットワーク解析 ↑

配列・構造解析

遺伝子の機能予測とゲノムの機能予測

32

リジン分解系のリファレンスパスウェイ

リファレンスを用いたパスウェイ再構築

Page 17: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

33

リファレンスを用いたパスウェイ再構築

ゲノム情報から再構築された緑膿菌のリジン分解系

34

パスウェイ再構築システム

"  ゲノム中の全遺伝子リストの作成 "  ゲノム、メタゲノムのアセンブリ "  遺伝子領域の予測 "  アミノ酸・塩基配列:マルチFASTA形式

"  ゲノム中の全遺伝子の機能アノテーション "  複数配列をクエリにして、ゲノムが決定された生物種の配列セットなどに対してホモロジー検索

"  各クエリ配列に対して、双方向ベストヒット情報などを用いてオーソログを割り当て

"  オーソログ情報を元にしたパスウェイ再構築

Page 18: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

35

パスウェイ再構築システムの例

"  MEGAN: MEta Genome ANalyzer "  もともとはメタゲノムの生物種マッピング用のツール

"  MEGAN4からKEGGやSEEDを用いた機能予測とパスウェイ再構築の機能が拡張された

"   RAST: Rapid Annotations using Subsystems Technology "   ERGOを開発していたグループがパスウェイに相当するサブシステムをベースに再構築

"  メタゲノム用の MG-RAST もある

"   KAAS: KEGG Automatic Annotation Server

36

MEGAN による Taxonomy mapping

Huson DH, et al. (2009) BMC Bioinformatics 10:S12

"   rRNA データをクエリとして BLAST で nr-nt データベースを検索

"  ヒットした配列の元の生物種をリストアップ

"   NCBI Taxonomy に基づいて分類木上にヒット数をマッピング

Page 19: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

37

MEGAN による Pathway mapping

Huson DH, et al. (2011) Genome Res 21:1552

KAASによるアノテーションとパスウェイ再構築 KAAS: KEGG Automatic Annotation Server   http://www.genome.jp/tools/kaas/

 DGENES from draft genomes  EGENES from EST assembly  MGENES from metagenome  ・FASTA形式の塩基配列または   アミノ酸配列

 KEGG GENES に対する BLASTX と逆向きの TBLASTN または両方向  の BLASTP

 (Bidirectional) Best Hits に基づく自動アノテーション             

・遺伝子と機能との対応表  (KEGG ORTHOLOGY) ・遺伝子機能の階層分類情報  (KEGG BRITE) ・パスウェイへのマッピング  (KEGG PATHWAY)

Page 20: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

KAASでの機能アノテーション

1.  Query gene

2.  Homologs

3.  Ortholog candidates

4.  KO (KEGG ORTHOLOGY) groups

5.  Ranking of KO

BLASTX to GENES TBLASTN from GENES

Cut off by bi-directional best hit rate

Grouping by KO

Scoring by probability and heuristics

Bi-directional best hit rate

BHRab = Rf × Rr

Genome A Genome B Gene a Gene a’ Gene b’

Gene b S

S’: best hit

Rf = S / S’

Moriya, Y. et al. Nucl. Acids Res. 2007 35:W182-W185

KAASでのKOに基づくマッピング

Moriya, Y. et al. Nucl. Acids Res. 2007 35:W182-W185

Page 21: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

KEGG でカバーしているもの、いないもの

いる

遺伝子 アノテーション

代謝、制御マップ 病気、薬開発マップ

2次元構造 薬、代謝物、反応 反応パターン

いない

制御領域 バリエーション タンパク質立体構造

シミュレーション用の  パラメータ

物性、立体構造 速度定数

ゲノム

パスウェイ

化合物

データ間のリンク 外部データベースへのリンク 41

KEGG 日本語ページ http://www.kegg.jp/ja/

日本語による階層分類

日本語によるエントリーポイント

42

Page 22: KEGG PATHWAY と GENES の利用法 - 京都大学goto.kuicr.kyoto-u.ac.jp/lecture/KEGG.pdfKEGG PATHWAY と GENES の利用法 京都大学化学研究所 バイオインフォマティクスセンター

KEGG

http://www.genome.jp/kegg/kegg2.html

リリース情報  新規パスウェイや更新状況

43