Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
1
H29 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 概 論 授 業 予 定
( 授 業 の 進 み 具 合 に よ っ て 変 更 の 可 能 性 が あ り ま す )
黒 字 は 、 講 義 に よ る 解 説 。 青 字 は ウ ェ ブ を 使 っ た 実 習 を 示 し ま す 。 黄 色 の 網 掛 け は 、 重 要 な
キ ー ワ ー ド
第 1 回 10 月 3日
授 業 概 要 説 明
Bioinformatics と は ?
ゲ ノ ム - 遺 伝 子 -mRNA- タ ン パ ク 質 の 関 係 の 復 習 ( D V D )
さ ま ざ ま な デ ー タ ベ ー ス ・ ゲ ノ ム デ ー タ ベ ー ス に 触 れ て み る
第 2 回 10 月 10日
配 列 デ ー タ ベ ー ス に つ い て の 解 説
配 列 デ ー タ ベ ー ス か ら の 塩 基 配 列 と ア ミ ノ 酸 配 列 の 取 り 出 し 方
配 列 エ ン ト リ ー の 見 方
ヒ ト 全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト に つ い て の 解 説 ( 1/ 3 )
ヒ ト ゲ ノ ム プ ロ ジ ェ ク ト の 歴 史 ・ 戦 術
連 鎖 地 図 作 製
宿 題 ( 1 ) : 配 布
第 3 回 10 月 17日
ホ モ ロ ジ ー 検 索 ( BLAST 検 索 ) に つ い て の 解 説
BLAST 検 索 の 実 習 ( 1/2 ) ( BLASTP )結 果 の 見 方
ヒ ト 全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト に つ い て の 解 説 ( 2/ 3 )
BAC ラ イ ブ ラ リ ー の 作 製 、 整 列 化
第 4 回 10 月 24日
BLAST 検 索 の 実 習 ( 2 /2 ) ( BLASTN, BLASTX, TBLASTX )
ヒ ト 全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト に つ い て の 解 説 ( 3 / 3 )
BAC ラ イ ブ ラ リ ー の シ ョ ッ ト ガ ン シ ー ケ ン ス
配 列 の ア セ ン ブ リ ー 、 コ ー ド 配 列 の 予 測 ( ア ノ テ ー シ ョ ン )
宿 題 ( 2 ) : 配 布
第 5 回 10 月 31日
MapViewer の 利 用 : 生 物 毎 の ゲ ノ ム デ ー タ ベ ー ス を 使 っ た BLAST 検 索
Whole genome shotgun sequence に よ る ゲ ノ ム 解 読
配 列 解 読 か ら 明 ら か に な っ た ヒ ト ゲ ノ ム の 特 徴
“ 宿 題 ( 1 ) : 提 出 ”
第 6 回 11 月 7日
配 列 ア ラ イ メ ン ト に つ い て の 解 説
ペ ア ワ イ ズ ア ラ イ メ ン ト の 実 際
多 重 配 列 ア ラ イ メ ン ト の 作 成 と 見 方 ( CLUSTALW )
2
分 子 系 統 樹 に つ い て
第 7 回 11 月 14日
分 子 系 統 樹 の 作 成
分 子 系 統 樹 か ら 分 か る こ と
ゲ ノ ム 構 造 の 変 化 と 生 物 進 化
ゲ ノ ム の 重 複 、 遺 伝 子 の 重 複 と 遺 伝 子 レ パ ー ト リ ー の 増 加
オ ル ソ ロ グ と パ ラ ロ グ の 発 生
遺 伝 子 の 並 行 進 化
宿 題 ( 3 ) 配 布
第 8 回 11 月 21日
代 謝 経 路 デ ー タ ベ ー ス ( KEGG ) の 利 用
KEGG を 使 っ た 演 習
例 : デ ー タ ベ ー ス を 使 っ て 、 dopamine の 合 成 経 路 、 合 成
部 位 、 作 用 機 序 、 薬 剤 等 に つ い て 情 報 収 集 す る
宿 題 ( 2 ) 提 出
第 9 回 11 月 28日
論 文 の 構 成 、 総 説 の 内 容
研 究 計 画 立 案 、 レ ポ ー ト ・ 論 文 作 成 に 必 要 な 文 献 情 報 収 集
文 献 検 索 ( PubMed, 大 学 図 書 館 On line journals )
EndNote に つ い て
宿 題 ( 4 ) 配 布
第 10 回 12 月 5日
酒 井 義 文 先 生 ( 本 学 工 学 研 究 科 情 報 科 学 出 身 ) に よ る 解 説
last 検 索 、 ClustalW 、 分 子 系 統 樹 の ア ル ゴ リ ズ ム と 原 理
( 鈴 木 : 分 子 生 物 学 会 に 出 席 )
第 11 回 12 月 12日
タ ン パ ク 質 の 構 造 に つ い て の 解 説 ( シ グ ナ ル ペ プ チ ド 、 疎 水 ・ 親 水
性 プ ロ ッ ト 、 ド メ イ ン 構 造 )
ウ ェ ブ サ イ ト を 使 っ た タ ン パ ク 質 の 構 造 解 析
塩 基 配 列 か ら ア ミ ノ 酸 配 列 へ の 変 換
分 子 量 と 等 電 点 の 予 測
シ グ ナ ル ペ プ チ ド の 予 測
ド メ イ ン 構 造 の 予 測
糖 鎖 結 合 部 位 の 予 測
“ 宿 題 ( 3 ) 提 出 ”
3
第 12 回 12 月 19日
ポ ス ト ゲ ノ ム 研 究 に つ い て : 21 世 紀 の 分 子 生 物 学
ポ ス ト ゲ ノ ム 研 究 - 1 : ゲ ノ ム編集 ( 遺 伝 子編集 )技術
CRISPR/Cas9 に よ る ゲ ノ ム編集 の 原 理 (動画 を 使 っ た 説 明 )
ゲ ノ ム編集 の農学 、医療へ の応用
プ ロ グ ラ ム を 使 っ て オ フ タ ー ゲ ッ ト の な い タ ー ゲ ッ ト 配 列 を設計
す る
ポ ス ト ゲ ノ ム 研 究 - 2 :次世 代 シ ー ケ ン ス 解 析
次世 代 シ ー ケ ン ス の 原 理
次世 代 シ ー ケ ン スで読 み 取 ら れ た リ ー ド の 情 報処理 ( 遺 伝 研 パ イ
プ ラ イ ン )
宿 題 (5) 配 布
12 月 2
6日
休講
第 13 回 1 月 9 日 次世 代 シ ー ケ ン ス 解 析 - 利 用 (1/ 4 )ゲ ノ ム 解 読 (参照ゲ ノ ム有=リ シ ー ケ ン ス.新規= de novoシ ー ケ ン ス )
ト ラ ン ス ク リ プ ト ー ム 解 析
次世代シーケンス解析-利用 (2/ 4)De novo ゲ ノ ム シ ー ケ ン ス の 遺 伝形質 解 析 へ の応用
ト ラ ン ス ク リ プ ト ー ム 解 析 の 生 物 研 究 へ の応用
ゲ ノ ム ブ ラ ウザEnsembl Genome Browser の 利 用
ゲ ノ ム 塩 基 配 列 を ゲ ノ ム デ ー タ ベ ー ス か ら 取 り 出 す
取 り 出 し た プ ロ モ ー タ ー 配 列 か ら 転 写 因 子 が 結 合 す る
Consensus配 列 を 予 測 す る
“ 宿 題 ( 4 ) 提 出 ”
4
第 14 回 1 月 16日
次世代シーケンス解析-利用 (3/ 4)Exome 解 析 : エ ク ソ ン の み に絞っ て 配 列 を比較す る こ と に よ
る 、 遺 伝形質 の 原因遺 伝 子 の同定 ( 一遺 伝 子 の 変異でメ ン デ ル
遺 伝 す る 遺 伝 子疾患に有効 )Genome Wide Association Study (GWAS) : SNP マーカー を
使 っ た 遺 伝形質 の責任遺 伝 子 の同定 ( 複数遺 伝 子 が 関与し 、 こ
れ まで解 析困難であ っ た 遺 伝形質 にも有効 )
次世 代 シ ー ケ ン ス 解 析 - 利 用 ( 4 / 4 ) :
RADシ ー ケ ン ス :簡便で高速な ゲ ノ ム 全体にわた る SNP マ ー
カー の 収 集 と 遺 伝形質 の責任遺 伝 子 の同定 → マ ーカー ア シ
ス ト育種に有効 ( 農林水産で有効 )
バ イ オ デ ー タ ベ ー ス の 利 用 ( 遺 伝 子 の 機 能 、 発現、 遺 伝 子疾患)
OMIM (Online Menderian Inheritance in Man)MGI (Mouse Genome Informatics)ZFIN (The Zebrafish Model Organism Database)
第 1 5回
最終回
1 月 2 3
日
ポ ス ト ゲ ノ ム 研 究 - 3 :比較ゲ ノ ム ( Comparative Genomics )
進 化 に伴う染色体構 造 の 変 化 ( 繰り返し 配 列 の 発 生 、 シ ン テ
ニー領域)
CNE(Conserved Noncoding element) : 進 化的に隔た っ た 生 物
間で高度に保存さ れ た非翻訳領域( 特 に 重 要 な転写調節領域)
プ ロ グ ラ ム を 使 っ て シ ン テニー を調べる
プ ロ グ ラ ム を 使 っ て CNE を調べる
“ 宿 題 (5) 提 出 ”
授 業評価
推薦図 書 とおもだっ た ウ ェ ブ サ イ ト は こ の ファイ ル の最後に掲示 し て あ り ま す 。
5
10 月 3 日 ( 第 1 回 )
講 義
1 ) 授 業 の 予 定 と 進め方
2 ) 「バ イ オ イ ン フ ォ マ テ ィ ッ ク ス」と は ?
3 ) 遺 伝 子 の 構 造 に つ い て の 復 習 : パ ワ ー ポ イ ン ト の ファイ ル を参照
4 ) 遺 伝 子 、転写、翻訳の 復 習 ( DVD を 使 っ て )
5) ゲ ノ ム デ ー タ ベ ー ス (動物 、植物 、菌類、 バ ク テ リ ア ) を のぞい て み る
6) どの ような デ ー タ ベ ー ス が 利 用できる か
使 用 す る DVD : 講談社ブ ル ー バ ッ ク ス B1582 「見 てわか る DNA の しくみ」
今日 は 第一回目の 授 業です ので、最初に今年の 授 業 予 定 を紹介し ま す 。 こ の 授 業 は 、 コ ン
ピュー タ ー を 使 っ た 実 習 と 講 義で進めま す 。 実 習では 、 ウ ェ ブ上で公開さ れ て い る デ ー タ ベ ー
スや配 列 解 析 プ ロ グ ラ ム を 使 い ま す 。
現在では 、 多様な 生 物 の ゲ ノ ム 配 列 が 解 読 さ れ 、 配 列 は一般にも利 用できる ように 整備さ れ
て い ま す 。 ど の よ う な 生 物 で ゲ ノ ム 解 読 が 行 わ れ て い る の か 、 ウ ェ ブ サ イ ト ( NCBI, Ensembl ) を 使 っ て少し のぞい て み ま しょう。 ま た 生 物 学 、 分 子 生 物 学 、農学 研 究 に 利 用でき
る デ ー タ ベ ー ス にどの ようなもの が あ る か を紹介し ま す 。
なおこ の テ キ ス トでは 、その 日 の 授 業で行う講 義 内 容 と コ ンピュー タ ー を 使 っ た 実 習 に つ い
て 、操作 方法を含めて簡単に 説 明 し て あ り ま す 。 必 要 に応じて 、 コピー 、 プ リ ン ト ア ウ ト し て
下さ い 。 講 義で使うパ ワ ー ポ イ ン ト の 図 は プ リ ン ト し たもの を資料と し て 配 布 し ま す 。 毎 回 、
翌週の プ リ ン ト を 配 り ま す 。 こ の テ キ ス ト と 配 布資料を 使 っ て 、 予 習 ・ 復 習 し て下さ い 。
————————————————————————————————
実 習
2 つ の ウ ェ ブ サ イ ト を開い て 、どの ような 生 物でゲ ノ ム 情 報 が 利 用できる か調べて み よう
1. NCBI (National Center for Biotechnology): http://www.ncbi.nlm.nih.gov/2. Ensembl Genome Browser: http://asia.ensembl.org/index.html
6
10 月 10 日 ( 第 2 回 )
今日 の 授 業 内 容
1. 実 習 : デ ー タ ベ ー ス か ら の ア ミ ノ 酸 配 列 、 塩 基 配 列 の 取 り 出 し 方
2. 実 習 : 配 列 エ ン ト リ ー に 示 さ れ て い る 情 報 に つ い て
3. 講 義 : ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 1/2 )
実 習
塩 基 配 列 ・ ア ミ ノ 酸 配 列 の 収 集
配 列 デ ー タ ベ ー ス か ら 必 要 な タ ン パ ク 質 の ア ミ ノ 酸 配 列 、 遺 伝 子 の 塩 基 配 列 の 取 り 出 し 方 を 実
習 し ま す .
ア ミ ノ 酸 の 取 り 出 し 方
使 用 す る ウ ェ ブ サ イ ト : NCBI.先頭ペ ー ジ右側に あ る Popular Resources の中の「 Protein 」を 使 用 す る .あ る い は左上( All databases ) か ら選ぶこ とも可 能 .
キ ー ワ ー ド に よ る 検 索
例 : cow, prion でキ ー ワ ー ド 検 索 し て み よう
cow, prion と 関 連 す る タ ン パ ク 質 が 多数リ ス ト さ れ る が 、 先頭の 2 つ が目的の
配 列
タ ン パ ク 質名( 青 字 ) を ク リ ッ ク す る と 配 列 エ ン ト リ ー が表示 さ れ る ( 見 方 は
配付資料を参照)
FASTA を ク リ ッ ク す る と 配 列 が FASTA format で表示 さ れ る
配 列 は 、別の ファイ ル に コピーできる .Graphics では 、 タ ン パ ク の 構 造 が表示 さ れ る
Identical Proteins では 、別の名前が付け ら れ て い る同一タ ン パ ク 質 が表示 さ
れ る
Related Sequences では 、 関 連 す る タ ン パ ク 質 が表示 さ れ る
FASTA format 塩 基 配 列 と ア ミ ノ 酸 配 列 の ファイ ル フ ォ ー ム
「> 」で始ま る 1 行 が コ メ ン ト ( 遺 伝 子名や任意の番号やコ メ ン ト ) を記述す る た
めに 用意さ れ ており 、続く2 行目か ら 塩 基 配 列 あ る い は ア ミ ノ 酸 配 列 を記述す る 。
最後に改行 し て「 // 」を記載し 、 1 つ の 配 列 の記述が完了す る ( 記号「 // 」は なく
てもよ い )ホ モ ロ ジ ー 検 索 、 多 重 ア ラ イ メ ン ト 、 分 子 系 統 樹 作 成 等で使うフ ォ ー ム .
>NP_001258555.1 major prion protein preproprotein [Bos taurus]MVKSHIGSWILVLFVAMWSDVGLCKKRPKPGGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWG
7
QPHGGGWGQPHGGGWGQPHGGGWGQPHGGGGWGQGGTHGQWNKPSKPKTNMKHVAGAAAAGAVVGGLGGYMLGSAMSRPLIHFGSDYEDRYYRENMHRYPNQVYYRPVDQYSNQNNFVHDCVNITVKEHTVTTTTKGENFTETDIKMMERVVEQMCITQYQRESQAYYQRGASVILFSSPPVILLISFLIFLIVG//
塩 基 配 列 の 取 り 出 し 方
使 用 す る ウ ェ ブ サ イ ト : NCBI. Popular Resources の中の「Nucleotide」を 使 用 す る
1. キ ー ワ ー ド に よ る 検 索
例 : cow, prion でキ ー ワ ー ド 検 索 し て み よう
cow, prion の 配 列だけでなく、 関 連 遺 伝 子も多数検 索 さ れ てくる ため、 必 要 な
配 列 を 見 つ け る 必 要 が あ る .Bos taurus prion (PRNP), mRNA が今回 、欲し い 配 列
であ る .上の 遺 伝 子 質名を ク リ ッ ク す る と 配 列 エ ン ト リ ー が表示 さ れ る ( デ ー タ の 見 方
は 配付資料を参照の こ と )
FASTA を ク リ ッ ク す る と 配 列 が FASTA format で表示 さ れ る
配 列 は 、別の ファイ ル に コピーできる .Graphic では 、 ゲ ノ ム上の 位置が表示 さ れ る
2.ア ク セ ッ シ ョ ン番号に よ る 検 索
accession number=DDBJ/EMBL/GenBank 国際 塩 基 配 列 デ ー タ ベ ー ス におい て各登録
単 位 ( エ ン ト リ ー ; 各 遺 伝 子 ) に 発 行 さ れ る エ ン ト リ ー 識 別 子 ( entry identification, ID ) を指す 。
例 : NM_001271626 ( entry identification, ID )で検 索 し て み よう
なお表示 結 果 の詳細な 説 明 は 、次の サ イ トで閲覧できま す 。
http://hinv.ddbj.nig.ac.jp/manual_cdna-j.html
配 列 エ ン ト リ ー に 示 さ れ て い る デ ー タ
遺 伝 子名、 生 物名、 学名、 遺 伝 子座、 遺 伝 子 ク ロ ーニン グ を 行 っ た 論 文 リ ス ト 、翻訳
開始・終了点 、 ド メ イ ン 構 造 、 塩 基 配 列 、 ア ミ ノ 酸 配 列 ( 配付資料では 、 zebrafish, prion (NM_205586) を 使 っ て 説 明 し て あ り ま す )
講 義
ヒ ト ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 1/3 )
国際 研 究 プ ロ ジ ェ ク ト に よ る ヒ ト ゲ ノ ム 計 画 (Human Genome Project) は 1990 年に着手
さ れ 、 13 年後の 2003 年に 解 読完了が宣言さ れ ま し た.ヒ ト ゲ ノ ム 計 画 は 、階層的シ ョ ッ ト
ガ ン法と呼ばれ る手法で行われ ま し た 。 す なわち連 鎖 地 図 の 作 成 か ら BAC ク ロ ー ン の 整 列 化 の
過程を 経 た のち、染色体上に マ ッ プ さ れ た BAC ク ロ ー ン を シ ョ ッ ト ガ ン法で解 読 し 、染色体レ
ベ ル に まで塩 基 配 列 を繋ぐと いう過程を 経 て 、 ゲ ノ ム 塩 基 配 列 の完全 解 読 に まで到達し ま し た 。
こ の プ ロ ジ ェ ク ト の間に 塩 基 配 列 の 解 析 能力( DNA シ ー ク エ ン サ ー ) は 大幅に ア ッ プ し 、同時
8
に 塩 基 配 列 を つ なぎ合わせる コ ンピュー タ ー の処理 能力も著しく進歩し た こ と に よ り 、 連 鎖 地
図 作 製 を省略し て 、 全 ゲ ノ ム を いきな り シ ョ ッ ト ガ ン法で読むこ と が 可 能 と な り ま し た.民間
企業 の シ エ ラ社は 、数年の あ いだに 全 ゲ ノ ム シ ョ ッ ト ガ ン法に よ り ヒ ト ゲ ノ ム を 解 読 す る こ と
に 成功し ま し た 。最終的に は 、国際 研 究 プ ロ ジ ェ ク ト と シ エ ラ社の間で協議の 結 果 、 解 読 成 果
が同時に公表さ れ ま し た.
ヒ ト ゲ ノ ム 計 画 の終了と前後し て 、 多くの 生 物で全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト が始めら れ 、最
近では 、次世 代 シ ー ケ ン サ ー の登場に よ り 、数ヶ月でゲ ノ ム 解 読 が 可 能 と な り ま し た.その た
め、既に数百種の動物で全 ゲ ノ ム 配 列 の 解 読 が終了し 、現在も新し い 生 物 の ゲ ノ ム 解 読 が次々
に完了し て い ま す.
ゲ ノ ム 情 報 は 、 遺 伝 子 の 機 能 解 析 の有力なツー ル に な る こ と は言うまでもあ り ませんが 、 生
物間でゲ ノ ム 構 造 を比較す る こ と に よ り 、無脊椎動物 か ら脊椎動物 の 進 化 の過程で起こ っ た ゲ
ノ ム 構 造 の 変 化 等も明 ら か に な り ま し た.ま た哺乳類の中でも単孔類(カモ ノハシ ) 、有袋類
( オ ポ ッ サ ム ) か ら有胎盤類に至る 進 化 の過程や、 ま た チ ン パ ン ジ ー と ヒ トでの知能 の差を ゲ
ノ ム 構 造 の 進 化 の観点 か ら議論 さ れ て い ま す.
全 ゲ ノ ム 塩 基 配 列 が 利 用できる と いう条件のもとで、 進めら れ る 遺 伝 子 機 能やゲ ノ ム 研 究 が
ポ ス ト ゲ ノ ム 研 究です.既に家畜や野菜や穀物植物 の ゲ ノ ムもほとんどの種で解 読 さ れ て い ま
す 。農学でも新し い 研 究 分野を開拓す る ために は 、 ゲ ノ ム 情 報 を有効に 利 用できる がどうか が 、
極めて 重 要 な素養と な り ま す.
ゲ ノ ム 解 読 に は 、階層的シ ョ ッ ト ガ ン法と 全 ゲ ノ ム シ ョ ッ ト ガ ン法の 2 通り の 方法が あ り 、
現在では 全 ゲ ノ ム シ ョ ッ ト ガ ン法が主流と な っ て い ま す 。 ま た こ の数年の間に 、次世 代 シ ー ケ
ン サ ー (NGS) が 実 用 化 さ れ 、既に ゲ ノ ム 解 読 は NGS を 使 っ て 、 全 ゲ ノ ム シ ョ ッ ト ガ ン法で解 読
す る の が主流と な っ て い ま す.NGS に よ る シ ー ケ ン ス の超高速化 に よ り 、様々な 生 物でゲ ノ ム
解 読 が 行われ て い ま す.NGS の 原 理 と 利 用法に つ い て は 授 業 の後半で解 説 し ま す.
**********************************************************************ゲ ノ ム 解 読 プ ロ ジ ェ ク トで解 析 さ れ た ゲ ノ ム DNA 配 列 情 報 は 、 NCBI と Ensemblで一般に
利 用できる よう整備さ れ て い ま す 。 遺 伝 子 の染色体上の 位置や類似遺 伝 子 の 検 索 に は NCBIが便利です 。 ゲ ノ ム の 塩 基 配 列 を デ ー タ ベ ー ス か ら 取 り 出 す場合 に は 、 NCBI あ る い は
Ensemblを 使 い ま す 。 NCBI と Ensemblの 使 い 方 は 、 授 業で実 習 し ま す 。 ゲ ノ ム 情 報 が い
か に強力なツー ル に な る か を体験し 、 実感し てもらおうと考えて い ま す 。
————————————————————————————————ゲ ノ ム 解 読 の 歴 史的な背景と 、 ゲ ノ ム 解 読 の 方法論 を 理 解 し てもらうために 、 授 業では階層
的シ ョ ッ ト ガ ン法で解 読 さ れ た ヒ ト ゲ ノ ム プ ロ ジ ェ ク ト を 例 に し て ゲ ノ ム 解 読 の道筋を 解 説 し
ま す.もはや、 歴 史 を振り返る ような感もあ り ま す が 、 ゲ ノ ム を 理 解 す る の にもよ い ので3 回
に 分 け て 解 説 し ま す 。
ヒ ト 全 ゲ ノ ム 塩 基 配 列 解 読 の 行程( 1/ 3 )
1 ) 連 鎖 地 図
2 ) BAC ラ イ ブ ラ リ ー 作 製
3 ) BAC ラ イ ブ ラ リ ー 整 列 化 ( 物 理 地 図 )
4 ) シ ョ ッ ト ガ ン シ ー ク エ ン ス
5) ア セ ン ブ ル
6) ア ノ テ ー シ ョ ン
9
10 月 17 日 ( 第 3 回 )
今日 の 授 業 内 容
1. 実 習 : ホ モ ロ ジ ー 検 索 BLASTP2. 実 習 : 検 索 結 果 の 見 方
3. 講 義 : ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 2 /3)
実 習
ホ モ ロ ジ ー 検 索 ( BLAST検 索 ) 1/2 遺 伝 子やゲ ノ ム を扱う研 究で使 用 す る 機 会 が最も多 い プ ロ グ ラ ム が 、 塩 基 配 列やア ミ ノ 酸
配 列 の ホ モ ロ ジ ー (相同性 ) 検 索 プ ロ グ ラ ムです.実験で新し い 塩 基 配 列 が得ら れ た時に 、
遺 伝 子 を同定 す る ために 、最初に 行う操作 が相同性 検 索でだか らです.相同性 検 索 に よ り 、
ク ロ ーニン グ し た 遺 伝 子 が 、 デ ー タ ベ ー ス に登録さ れ て い るどの 遺 伝 子 と類似し て い る か を
調べる こ と ができま す.
次世 代 シ ー ク エ ン ス 解 析で得ら れ た 配 列 を ゲ ノ ム 配 列 に マ ッ プ す る 際 にもBLAST 検 索 が 用
い ら れ ま す.ゲ ノ ム 解 読 さ れ て い る 生 物であ れば、 100bp の短い 配 列 (次世 代 シ ー ケ ン サ ー
の 解 析では 、 1 リ ー ド は 100-120bp )でもゲ ノ ム のどの 位置に あ る か を調べる こ ともできま
す.ま た次世 代 シ ー ク エ ン ス 解 析 を 使 っ た ト ラ ン ス ク リ プ ト ー ム 解 析 (組織に 発現す る 遺 伝
子 を 網羅的に 配 列 解 読 と 遺 伝 子名の 特 定 、 発現量 の 解 析 ができる )では 、 解 読 し た 配 列 は ホ
モ ロ ジ ー (相同性 ) 検 索 の BLASTX で遺 伝 子名が判別さ れ ま す.
授 業では 、 BLAST (Basic Local Alignment Search Tool) プ ロ グ ラ ム を 用 い ま す 。今日 は 、
塩 基 配 列 ・ ア ミ ノ 酸 配 列 の デ ー タ ベ ー ス 、問い 合わせ配 列 と デ ー タ ベ ー ス の組合せ、各組合
せで使う BLAST プ ロ グ ラ ム に つ い て 説 明 し ま す.その あ と テ ス ト 配 列 ( ア ミ ノ 酸 配 列 ) を
使 っ て 、 実 際 に BLAST 検 索 を 行 い ま す.
ホ モ ロ ジ ー ( homology ) 検 索 、 と は ?
問い 合わせ配 列 (query sequence) に対し 、類似し た 配 列 を デ ー タ ベ ー ス か ら探し 出 す
操作.最も高頻度に 利 用 さ れ る バ イ オ イ ン フ ォ マ テ ィ ッ ク ス の手法のひと つ.
検 索 内 容 :
例 ) 実験でク ロ ーニン グ し た 遺 伝 子 の種類を 特 定 す る 。それ が コ ー ド す る ア ミ ノ 酸 配
列 が デ ー タ ベ ー ス に登録さ れ て い る 遺 伝 子 、蛋白質 のどれ と 、 ま たどの程度類似す る
か ?
遺 伝 子 配 列 デ ー タ ベ ー ス : GenBank, DDBJ, EMBL
最 も 広 く利 用 さ れ ており 、 検 索 が高 速 な プ ロ グ ラ ム が BLAST(Basic Local Alignment Search Tool) です (昔、 FASTと言うプ ロ グ ラ ムも使われ て い た が 、現在はほとんど見
か け な い )
--------------------------------------------------------――――――――――――――――――-------------10
検 索 の組合せ 問い 合わせ配 列 対 デ ー タ ベ ー ス
----------------------------------------------------――――――――――――――――――-----------------BLASTN 塩 基 配 列 対 塩 基 配 列 デ ー タ ベ ー ス
BLASTP ア ミ ノ 酸 配 列 対 ア ミ ノ 酸 配 列 デ ー タ ベ ー ス
BLASTX 塩 基 配 列 ( ア ミ ノ 酸 配 列 に置換 ) 対 ア ミ ノ 酸 配 列 デ ー タ ベ ー ス
TBLASTN ア ミ ノ 酸 配 列 対 塩 基 配 列 デ ー タ ベ ー ス ( ア ミ ノ 酸
配 列 に置換 )
TBLASTX 塩 基 配 列 ( ア ミ ノ 酸 配 列 に置換 ) 対 塩 基 配 列 デ ー タ ベ ー ス 塩 基 配 列 ( ア ミ ノ
酸 配 列 に置換 )
----------------------------------------------------――――――――――――――――――-----------------
配 列 の種間変異の激し い 遺 伝 子 の場合 ( サ イ トカイ ン 等 ) 、 塩 基 配 列 を BLASTN 検 索 し て
も相同遺 伝 子 が デ ー タ ベ ー ス か ら 検 出 さ れ な い こ と が あ る.その場合でも、 BLASTX な ら
相同遺 伝 子 が ヒ ッ ト す る こ と が 多 い.その ため、 塩基配列で 相同遺伝子を 検索する 場合、一般に BLASTN よ り も BLASTX が 用い ら れ る .
**************************************************************************
BLAST 検 索 の 原 理 1. ホ モ ロ ジ ー が観察さ れ る 配 列間の局所ア ラ イ メ ン ト に は 、 多くの場合 、ギャッ プ を含ま
な い保存領域が存在す る 。 BLAST では 、その ような局所保存領域( ワ ー ド ) を まず高速
に 検 索 す る 。
2. 一致し た ワ ー ド か ら ア ラ イ メ ン ト を 配 列 に沿っ てそれぞれ の 方向に拡張し て いき、 ス コ
ア が 増 加 す る まで続け る 。拡張処理 は 、 ス コ ア の 増 加 が止ま り 、伸ばす前の ベ ス ト ス コ
ア よ り減少し始めた時に終了す る 。 こ の時点で、 HSP (high-scoring segment pair) と呼ば
れ る 、 大きな 配 列領域が 見 つ か る 。 こ の時点でギャッ プ が あ る とそこ か ら 先 に は伸長し
て い な い 。
3. 一般に 、 ア ミ ノ 酸 配 列 と 塩 基 配 列 に はギャッ プ が 生じて い る ため、 HSP の みでは類似領
域の 検 索 と し て不十分であ る 。そこで、 BLAST では 、 HSP におい て対応す る 位置に存在
す る 1 組の記号の ペ ア を適切に選び、類似度の高い領域は こ の ペ ア を含むもの と仮定 し
て 、動的計 画法と呼ばれ る 方法を 用 い て類似領域を探索 す る 。 HSP か ら選んだペ ア を起
点 と し て探索範囲を狭く取 る こ と に よ っ て 、類似度の最適性 は保証さ れ な いもの の 、従
来の動的計 画法と比較し て高速な類似領域の探索 を 実現し て い る 。
(詳細は 、 12 月 5 日 に 酒 井 先 生 が 解 説 し ま す 。 )
ス コ アア ミ ノ 酸 配 列 の場合 : BLOSUM62 ス コ ア ( ア ミ ノ 酸 の組合せに よ っ て値が決めら れ て い る )
塩 基 配 列 の場合 :値は同じ塩 基 、異な る 塩 基 の組合せでの み決めら れ て い る
————————————————————————————————
BLASTP 実 習
>test_DNA_sequence-1 (私の 研 究 グ ル ー プで単離し た 遺 伝 子で、既に デ ー タ ベ ー ス に登録
済みであ る :由来生 物 zebrafish .遺 伝 子名 charon 、 機 能=内臓・脳の非対称性制御) と ア
ミ ノ 酸 配 列 を下に 示 し ま し た 。試し に こ の ア ミ ノ 酸 配 列でBLASTP 検 索 し て み よう .11
BLASTP の操作手順
1.NCBI 先頭ペ ー ジ右上 Popular Resources か ら BLASTを選択す る 。 Basic BLASTに上記 5 種類の BLAST プ ロ グ ラ ム の ア イ コ ン が あ る.
2. protein blastを ク リ ッ ク す る 。 ア ミ ノ 酸 配 列 (FASTA format) を枠内 に コピー す
る 。 Database (non-redundant protein sequences (nr) ), Algorithm (blastp; protein-protein BLAST) は 、 デ フ ォ ル ト の ま までよ い.
3.BLASTのボタ ン を押し て 、 検 索 を開始す る 。
>test_DNA_sequence-1(zebrafish_charon)_protein-seq
MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFP
AFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETV
TVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLIVEECKCETSSEEAKVQNTDMFNL
デ ー タ ベ ー ス に登録さ れ て い る
PSI-BLASTP, PHI-BLAST: 比較的最近開発 さ れ た プ ロ グ ラ ムで、 系 統的に離れ た 生 物 あ
る い は 関 連 遺 伝 子 を 検 索 す る場合 に 利 用 す る . 種間の保存性 が低い 遺 伝 子 の場合 に
利 用価値が高い .
検 索 結 果 の 見 方 :
グ ラ フ ィ ッ ク の次に 示 さ れ て い る数値の 説 明
E-value : 検 索 結 果 は 、 Query 配 列 と相同性 を 示 す 配 列 の ア ラ イ メ ン ト 結 果 が表示
さ れ る 。 e-value は 、 検 索 に 使 っ た デ ー タ ベ ー ス の な かで、 Query の局所配 列 と
検 索 配 列 の組合わせが 、偶然に み つ か る個数を 示 す 。相同性 が高いほど、値は 0に近づく(最も重 要 な デ ー タ :蛋白質 の場合 、 e-5あ た り が 関 連 遺 伝 子 か 、そうで
な い か を判断す る 基準と な る ) 。 検 索 結 果 の数値のうち、最も重 要であ る.
Total score (bits): 検 索 さ れ てきた局所配 列 の長さ をビッ ト形式で示 し たもの 。値
が 大きいほど、相同性 を 示 す領域が長い 。
Query cover: 問合せ配 列 の 全長のうち、 検 索 配 列 と 配 列 が一致し て い る領域の%
Identities: ア ミ ノ 酸 配 列で、相同領域の な かで一致し て い る ア ミ ノ 酸 の比率
ア ラ イ メ ン ト の添えら れ て い る数字
Identities: ア ミ ノ 酸 配 列で、相同領域の な かで一致し て い る ア ミ ノ 酸 の比率
Positives: ア ミ ノ 酸 配 列 の場合 に 、一致し て い る ア ミ ノ 酸+化 学的に類似す る ア ミ
ノ 酸 の比率
Gaps: ア ラ イ メ ン ト さ れ た 配 列で、片一方で欠損し て い る 塩 基 あ る い は ア ミ ノ 酸 の
総 計
講 義
12
ヒ ト 全 ゲ ノ ム 塩 基 配 列 解 読 の 行程( 2/ 3 )
1 ) 連 鎖 地 図 ・ 物 理 地 図 ( Radiation hybrid panel )
2 ) BAC ラ イ ブ ラ リ ー 作 製
3 ) BAC ラ イ ブ ラ リ ー の 整 列 化
4 ) シ ョ ッ ト ガ ン シ ー ク エ ン ス
5) ア セ ン ブ ル
6) ア ノ テ ー シ ョ ン
完全長 cDNA 配 列 解 読 プ ロ ジ ェ ク ト 、 EST ( expressed sequence tags ) プ ロ ジ ェ ク ト
に つ い て の 解 説
13
10 月 24 日 ( 第 4 回 )
今日 の 授 業 内 容
1. 実 習 : BLAST検 索 ( BLASTN, BLASTX, TBLASTX )
2. 講 義 : ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 3/3 )
実 習ホ モ ロ ジ ー 検 索 ( BLAST検 索 ) 2/2
BLASTN 実 習
blastn を 使 っ て 、 >test_DNA_sequence-1 の相同遺 伝 子 を 検 索 し て み よう
BLASTN の 検 索手順
1.NCBI 、 Popular Resources の中か ら BLASTを選択す る 。 Basic BLAST に上記
5 種類の BLAST プ ロ グ ラ ム の ア イ コ ン が あ る 。
2 .nucleotide blast を ク リ ッ ク す る 。
「Database」が 、 デ フ ォ ル トでは nucleotide collection (nr/nt) で、 こ の ま
までよ い 。
注 意 : Program selection で somewhat similar sequences (blastn) を 選 択 す る 。
3 . 塩 基 配 列 (FASTA format) を枠内 に コピー す る 。
4 .BLAST のボタ ン を押し て 、 検 索 を開始す る 。
>test_DNA_sequence-1(zebrafish_charon)
AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTT
CTTTTTTGTAAAATTCTATAATTTAGCTAAAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGG
CGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTTGAATCCTCCGGGAATGGACCAGA
CGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTT
CAGAAATTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAA
ACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGA
GCGAAAAAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACA
GCGCATAACGGAGGAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCC
CTCCAGCGGAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCA
CCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAACCAGCAGCGAAGAGGC
CAAAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA
>test_DNA_sequence-1(zebrafish_charon)_protein-seq
MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFP
AFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETV
TVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLIVEECKCETSSEEAKVQNTDMFNL
14
Blastn の 利 用 例 :
と り あえず調べた い 遺 伝 子 が 、既知のどの 遺 伝 子 に類似す る か ? を調べる時等 に
使う。 ただし 、 生 物間で変異の激し い 遺 伝 子 ( 実 習で使う charon が一例 ) の場合
に は 、 Blastn では相同遺 伝 子 が十分 に 検 索 さ れ て こ な い こ と が あ る ので、 遺 伝 子
を 特 定 す る ために は 、次の Blastx を 使う方 が よ い 。
次世 代 シ ー ケ ン ス 解 析で得ら れ た断片( 100bp ) を ゲ ノ ム に マ ッ プ す る時は
Blastn を 用 い る 。
同じ遺 伝 子 の 配 列 >test_DNA_sequence-1(zebrafish_charon) な の に 、 blastpと blastnで検 索 さ れ てくる 遺 伝 子 ・蛋白質 の数が違うこ と に注意!(その 理由を 理 解 し て下さ い )
BLASTX 実 習
blastXを 使 っ て 、 >test_DNA_sequence-1 の相同遺 伝 子 を 検 索 し て み よう
blastx の 特 性 :
こ の プ ロ グ ラ ムでは 、 遺 伝 子 が コ ー ド す る ア ミ ノ 酸 配 列 と相同性 の高い蛋白質 を
探す 。問い 合わせ塩 基 配 列 は 、一度 6 フ レ ー ムで翻訳さ れ 、翻訳さ れ た 配 列 が ア
ミ ノ 酸 配 列 デ ー タ ベ ー ス に対し て 検 索 に か け ら れ て い る 。 --- タ ン パ ク の 配 列で
BLASTP 検 索 し た時と同じ検 索 結 果 が得ら れ て い る
ア ミ ノ 酸置換 の激し い 遺 伝 子 の相同性 検 索 に非常に有効
進 化的に離れ た 生 物 か ら相同遺 伝 子 を探す場合 にも有効
次世 代 シ ー ケ ン サ ー を 使 っ た de novo ト ラ ン ス ク リ プ ト ー ム 解 析で得ら れ た 配
列 を同定 す る場合 、 BLASTX が 使 用 さ れ る
ヒ ト の ゲ ノ ム デ ー タ ベ ー ス に 対 し て 、>test_DNA_sequence-1(zebrafish_charon)配 列 を 問 合 せ 配 列に し て 、 blastn, blastx 検 索 を 行 い 、 得 ら れ る デ ータ の 違 い を 理 解 し よ う .
TBLASTN 実 習
tblastx を 使 っ て 、 >test_DNA_sequence-1 の相同性 検 索 を試し て み よう
tblastx の 特 性 :
問い 合わせの 塩 基 配 列 、 デ ー タ ベ ー ス の 塩 基 配 列 とも3 フ レ ー ムで翻訳さ れ 、 検
索 に か け ら れ て い る 。
Tblastx の 利 用 例 :
単離し た 遺 伝 子 が コ ー ド す る ア ミ ノ 酸 配 列 と相同性 の高い ア ミ ノ 酸 配 列 を コ ー ド
す る 塩 基 配 列 を探す 。 配 列 の 変異が激し い 遺 伝 子種の場合 に有効。
15
練習
PCNA は DNA 複 製で働くタ ン パ ク 質で、 バ ク テ リ ア か ら ヒ ト まで配 列 の保存性 が非常
に高い 。 こ の 配 列でBLASTN 検 索 し て 、 >test_DNA_sequence-1 の 検 索 結 果 と の違い を
考えて み よう。
対象生 物 を イネに限定 し て 、 イネゲ ノ ム に相同遺 伝 子 が存在す る か調べて み よう。 ま
た 、 バ ク テ リ ア の ゲ ノ ムで試し て み よう。
>zebrafish_PCNA_cDNA
ACTTTAGTTCCTCCTACTCCAAACTAAGAAAGCAGCACAATGTTTGAGGCACGTCTGGTTCAGGGATCTATCCTTAAGAAG
GTCCTGGAGGCTCTGAAAGACCTGATCACCGAGGCTTGCTGGGATGTGAGCTCGTCGGGCATTTCTCTGCAGAGTATGGAC
TCCTCTCATGTGTCTCTGGTGCAGCTGACGCTCCGGAGTGACGGGTTCGACTCCTACCGCTGCGACAGAAACCTAGCCATG
GGGGTCAATCTGAGCAGCATGTCGAAGATTCTGAAGTGTGCTGGAAATGAAGACATCCAGACACTTAGAGCTGAAGACAAT
GCTGACACGCTGGCACTGGTCTTTGAAGCTCAAAATCAGGAGAAAGTGTCCGACTATGAGATGAAACTGATGGATCTGGAT
GTGGAGCAGCTTGGCATTCCAGAGCAGGAATACAGTTGTGTGGTGAAGATGCCGTCGGGTGAGTTTGCCCGCATCTGCAGG
GATCTGTCACAGATTGGTGATGCTGTCATGATCTCGTGTGCCAAGGATGGCGTGAAGTTCTCTGCTAGCGGAGAGCTGGGC
ACAGGCAACATCAAGCTCTCACAGACCAGCAATGTCGACAAGGAGGATGAAGCGGTAACAATTGAGATGAATGAGCCAGTG
CAGCTCATTTTTGCATTGAACTACCTGAACTTCTTCACCAAGCCAACTCCTCTGTCCAGAACGGTCACACTTAGAATGTCC
GCACATATTCCACTAGTGGTTGAGGACAAAATTGCAGACCTTGAACACGTAAAATATTACCTGGCGCCCCAGATCGAGGAT
GAAGAGTCCTCCTAATCCAAGCAGAAGAGCGAAGCCTGTCATCTGTGGGATTTTCATTCTGCAACTCAGAAGTTATTGCAT
AGATGTTTTGGGAAAATGCATTTTATTACTCAGTGTCTGCTGTGGTTTCCAGTTCAATGGATTCCCGATTGTGACCCTCTA
AAGCCATTACATATCATTGGCAGAATTGCGGGCGCACTTATTAAATGATGGTAGTTTGGGCCTTAGCTTTACCAGGCGCTC
CGTGGGCTGAATCTAGAGTGCTCTCATGTACATACTCCACATTCAGTCTTGTTTTTCTCCCTTTTTGCCGTTGTCCTCTTG
TGTCCATTTCAGGTTTTGTCCAACTGCTCATTCCAATGTGTAGATAATTGTCTGTAAATATGCTAATTGGACACCGTTCAT
CCAGTCAACCCGTAATAAAACTGTTGTATCGG
>zebrafish_PCNA_Protein
MFEARLVQGSILKKVLEALKDLITEACWDVSSSGISLQSMDSSHVSLVQLTLRSDGFDSYRCDRNLAMGVNLSSMSKILKC
AGNEDIITLRAEDNADALALVFETLNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSQIGDAVMISC
AKDGVKFSASGELGTGNIKLSQTSNVDKEDEAVTIEMNEPVQLIFALNYLNFFTKATPLSKTVTLSMSADIPLVVEYKIAD
MGHVKYYLAPKIDEESS
講 義
ヒ ト 全 ゲ ノ ム 塩 基 配 列 解 読 の 行程( 3/ 3 )
1 ) 連 鎖 地 図 ・ 物 理 地 図 ( Radiation hybrid panel )
2 ) BAC ラ イ ブ ラ リ ー 作 製
3 ) BAC ラ イ ブ ラ リ ー の 整 列 化
4 ) シ ョ ッ ト ガ ン シ ー ク エ ン ス
5) ア セ ン ブ ル
16
6) ア ノ テ ー シ ョ ン
完全長 cDNA 配 列 解 読 プ ロ ジ ェ ク ト 、 EST ( expressed sequence tags ) プ ロ ジ ェ ク ト に
つ い て の 解 説
17
10 月 31 日 ( 第5回 )
今日 の 授 業 内 容
1. 実 習 : NCBI の ゲ ノ ム デ ー タ ベ ー ス (Map Viewer) での BLAST検 索
2. 講 義 : Whole genome shotgun sequence
3. 講 義 : ゲ ノ ム 解 読で分 か っ た ヒ ト ゲ ノ ム の 特 性
実 習—NCBI Map Viewer の 利 用 —
NCBIの Map Viewerでは ゲ ノ ム 解 読 が 行われ た 生 物種ごと に 、 遺 伝 子 の染色体上の 位置を調べる
こ とや、 BLAST 検 索 を 行うこ と ができま す 。 授 業では 、 Map Viewer を 使 っ て 、 4 つ の 使 用法を
実 習 し ま す 。
NCBI Map Viewerの 利 用 ( 1 /4)
— 遺 伝 子 の染色体上の 位置を調べる ー
1.NCBI 先頭ペ ー ジ All resources の中か ら Map Viewer を選択す る
2.ゲ ノ ム 塩 基 配 列 が公開さ れ て い る 分類に 分 け て 生 物種一覧が表示 さ れ る : toolsに
虫眼鏡マ ー ク ( 遺 伝 子 の染色体上の 位置を調べる ) と B マ ー ク ( BLAST 検 索 ) が あ る
3.虫眼鏡マ ー ク を ク リ ッ ク
4. Search for の枠に 遺 伝 子名を記入し 、 リ タ ー ン キ ー ( or Find ) を押す
5.遺 伝 子 の 位置が染色体上に赤く示 さ れ る 。下の Map element を選択す れば、 よ り
詳細な ゲ ノ ム 情 報 が表示 さ れ る 。
ヒ ト染色体におけ る 遺 伝 子 の 位置( 遺 伝 子座) を 検 索 し て み よう
練習 : sonic hedghog (shh) を 検 索 し て み よう
1.NCBI で Map Viewer を開け る
2.Homo sapiens (human) の Tools に虫眼鏡マ ー ク を選択
3. Search for に shh を記入し て 、 Return4.Map element の な か か ら SHH( NM_000193.2 ) を選んでク リ ッ ク
5. shh の染色体上の 位置、周辺の 遺 伝 子 が表示 さ れ る
6. Zoom out、 Zoom in し て み よう
7. SHH を ク リ ッ ク す る と 、 SHH 遺 伝 子 の イ ン ト ロ ン ・ エ ク ソ ン 構 造 、 変
異に よ る病状等 に つ い て の 情 報 が得ら れ る
8 . OMIM (OMIM は KEGG に も リ ン ク ), HGNC (HUGO nomenclature committee; HUG0=human genome organization) を開け る と 、 変異に よ る異
常や分 子 構 造 の 特 性 に 関 す る 情 報 が得ら れ る
ウ シ 、ニワ ト リ 、ゼブ ラ フ ィ ッ シュでも shh でキ ー ワ ー ド 検 索 し て み よう
NCBI Map Viewerの 利 用 ( 2/4 )
18
— さ ま ざ ま な 生 物 の ゲ ノ ム デ ー タ ベ ー ス の 利 用—
NCBI, Map Viewer では 、 バ ク テ リ ア か ら植物 、哺乳類に至る まで多様な 生 物 の ゲ ノ ム 情 報 が
利 用できま す 。 ヒ ト が持っ て い る 遺 伝 子 の相同遺 伝 子 を 進 化的に たどっ て 、どの 生 物 に まで存
在し て い る か と言う疑問に つ い ても、 BLAST 検 索 に よ っ て調べる こ と ができま す 。
練習 : ヒ ト の 増殖細胞核抗原 ( PCNA: proliferating nuclear antigen ) の相同遺 伝 子 を イネゲ ノ ム
( Oryza sativa (japonica cultivar-group) ) 、 バ ク テ リ ア か ら探し て み よう。
マ ウ スビタ ミ ン D受容体の相同遺 伝 子 が 、 シ ョ ウ ジ ョ ウ バ エ 、 原 生動物 ( ア メ ー バ ー ) 、 イ
ネに存在す る かどうかも試し て み よう。
バ ク テ リ ア の ゲ ノ ム 検 索では 、 small genome に入り 、種を指定 し 、 検 索 す る 。
>human_pcna
MFEGRLVQGSILKKVLEALKDLINEACWDISSSGVNLQSMDSSHVSLVQLTLRSEGFDTYRCDRNLAMGVNLTSMSKILKCAGNE
DIITLRAEDNADTLALVFEAPNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSHIGDAVVISCAKDGVKFS
ASGELGNGNIKLSQTSNVDKEEEAVTIEMNEPVQLTFALRYLNFFTKATPLSSTVTLSMSADVPLVVEYKIADMGHLKYNLAPKI
EDEEGS
NCBI Map Viewer の 利 用 ( 3/4 )
— 特 定 の 生 物 の ゲ ノ ム に存在す る 遺 伝 子 ファミ リ ー の メ ン バ ー の 検 索—
多くの 遺 伝 子 に は 、 生 物 進 化 の過程で共通の 遺 伝 子 か ら派生 し た兄弟遺 伝 子 が存在し ま す 。
ま たその メ ン バ ー は 進 化 に伴っ て 増える傾向に あ り ま す 。 マ ウ ス な ら マ ウ ス の ゲ ノ ム に対し て 、
あ る メ ン バ ーでゲ ノ ム を 検 索 す る こ と に よ り 、 進 化的に 関 連 し て 部 分的にでも共通の 配 列 を持
つ メ ン バ ー を 全 て 検 索 す る こ と ができま す 。今回 は 、 マ ウ ス ゲ ノ ム に存在す る核レ セ プ タ ー
ファミ リ ー の メ ン バ ー 、及びG タ ン パ ク共役受容体の メ ン バ ー を探す操作 を 実 習 し ま す 。
練習 : マ ウ ス ゲ ノ ム に核受容体ファミ リ ー の メ ン バ ー が幾つ存在す る か ?
1.NCBI の Map Viewer ( ペ ー ジ下、 POPULAR ) を開け る
2.Mus musculus の Tools か ら B ( BLAST ) を選択3 . mouse_vitamin_D_receptor の 配 列 を 枠 に コ ピ ー し 、 Program か ら
BLASTP を選択し 、 Begin Search を ク リ ッ ク
4.マ ウ ス ゲ ノ ム に存在す る核レ セ プ タ ー ファミ リ ー の 全 て の メ ン バ ー が 検
索 さ れ てくる 。 60 種類あ ま り存在す る こ と が 分 か る
5.上の 方 に あ る Genome View を ク リ ッ ク し て み よう: 検 索 さ れ てきた 遺 伝
子 の染色体上の 位置が表示 さ れ る
>mouse_vitamin_D_receptor
MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKD
NRRHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKT
YDPTYADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVT
19
LDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCG
SQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLS
NTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS
G-protein coupled receptor の メ ン バ ーで試し て み よう。
>human_MC4R
MVNSTHRGMHTSLHLWNRSSYRLHSNASESLGKGYSDGGCYEQLFVSPEVFVTLGVISLLENILVIVAIAK
NKNLHSPMYFFICSLAVADMLVSVSNGSETIVITLLNSTDTDAQSFTVNIDNVIDSVICSSLLASICSLLS
IAVDRYFTIFYALQYHNIMTVKRVGIIISCIWAACTVSGILFIIYSDSSAVIICLITMFFTMLALMASLYV
HMFLMARLHIKRIAVLPGTGAIRQGANMKGAITLTILIGVFVVCWAPFFLHLIFYISCPQNPYCVCFMSHF
NLYLILIMCNSIIDPLIYALRSQELRKTFKEIICCYPLGGLCDLSSRY
練習 : シ ョ ウ ジ ョ ウ バ エ の ゲ ノ ム に は 、核受容体ファミ リ ー の メ ン バ ー が幾つ存在す
るでしょうか ?
ホヤ( Ciona intestinalis )でも検 索 し て み よう
NCBI Map Viewerの 利 用 ( 4/4 )
—次世 代 シ ー ケ ン ス 解 析で得ら れ た 配 列 の染色体へ の マ ッピン グ—
最も汎用 さ れ て い る次世 代 シ ー ケ ン サ ーであ る Illumina2000 では 、一度の 解 析で 100bの断片配 列 が約 4000 万個得ら れ ま す 。 ゲ ノ ム 解 析 が 行われ て い る 生 物では 、 こ の ような
短い断片でも染色体に マ ッピン グできま す 。 さ ら に参照ゲ ノ ム と 塩 基 配 列 の違い が あ る か
どうか 、 遺 伝 子疾患の 原因が 解 析 さ れ た個人の ゲ ノ ム に存在し て い る かどうかも判定 可 能
です 。
練習 :
BLAST 検 索で human を選択し て 、次の 配 列 を ゲ ノ ム に マ ッピン グ し て み よう。
>human_100bp_fragment
CCAAATTTAATTGATAATGGAAGCTGGCCAGCCACCACCATACAGAATTCTGTAGCTTTGAAGAATGCAGGTTTAATATCC
ACTTTGAAAAAGAAAACAA
20
11 月 7 日 ( 第6回 )
今日 の 授 業 内 容
1. 実 習 : 配 列 ア ラ イ メ ン ト
2. 講 義 : 分 子 系 統 樹 に つ い て
講 義
2 つ以上の 塩 基 配 列 あ る い は ア ミ ノ 酸 配 列 の一致度を調べる場合 、 ア ラ イ メ ン ト プ ロ グ ラ ム
を 使 い ま す 。 タ ン パ ク 質 の場合 、異な る 生 物間でア ミ ノ 酸 配 列 を ア ラ イ メ ン ト す る こ と に よ り 、
保存性 の高い領域を 特 定 す る こ と ができま す 。 系 統的に隔た っ た 生 物間( 例えば、 マ ウ ス とゼ
ブ ラ フ ィ ッ シュ、 あ る い は マ ウ ス と酵母の 関 係 等 )で保存性 が高い領域は 、 タ ン パ ク 質 の 機 能
で重 要 な役割を持っ た領域であ る と考えら れ ま す 。 ま た シ ス テ イ ン残基 は 、 タ ン パ ク 質 の高次
構 造 に深く関わる ジ ス ル フ ィ ド ( S-S ) 結 合 を 作 る場合 が 多 い ため、保存さ れ て い る こ と が 多
く、異な る 生 物 の タ ン パ ク 質 を ア ラ イ メ ン ト す る こ とで重 要で保存さ れ た ジ ス ル フ ィ ド 結 合 の
位置を 予 測できま す 。
ClustalW プ ロ グ ラ ム を 使うと 、 多 重 ( マ ル チ プ ル ) ア ラ イ メ ン ト の 結 果 か ら 分 子 系 統 樹 を 作
成できま す 。 分 子 系 統 樹では 、 遺 伝 子 の種間あ る い は同種間におけ る 進 化的関 係 を 予 測 す る こ
と ができま す 。種間の 進 化的関 係では 、異な る 生 物間におけ る相同遺 伝 子 ( オ ー ソ ロ グ ) を同
定 す る こ と が 可 能です 。同種間で関 連 遺 伝 子 の 系 統 樹 を 作 成 す る と 、 遺 伝 子 ファミ リ ー の メ ン
バ ー の 進 化的関 係 が 分 か り ま す 。 ま た モ デ ル 生 物 ( マ ウ ス 、ゼブ ラ フ ィ ッ シュ) の 配 列 を 分 子
系 統 樹 に 加える こ とで、 研 究対象の 遺 伝 子 に対す る モ デ ル 生 物 の オ ー ソ ロ グ を 検 索 し 、 モ デ ル
生 物 の 情 報 か ら か ら 、 研 究対象の 遺 伝 子 の 機 能 に つ い ておおよその 情 報 を得る こ と ができま す 。
授 業では 、 ペ ア ワ イ ズ ア ラ イ メ ン ト ( 2 つ の 配 列 を比較) 、 マ ル チ プ ル ア ラ イ メ ン ト ( 3 つ
以上の 配 列 を比較)および分 子 系 統 樹 の 作 成 (来週) を 実 習 し ま す 。
配 列 ア ラ イ ン メ ン ト
配 列 ア ラ イ ン メ ン ト と は 、 配 列中で同じ並び方 を し て い る 文 字 列 を探す こ とであ る 。同一
もしくは似た 文 字 は同じ列 に置き、同一でな い 文 字 は同じ列 に不一致と し て置くか 、
ギャッ プ を入れ る 。
ペ ア ワ イ ズ ア ラ イ ン メ ン ト (pairwise alignment) : 2 つ の 配 列 の比較
大域的ア ラ イ ン メ ン ト (global pairwise alignment)局所的ア ラ イ ン メ ン ト (local pairwise alignment)
多 重 配 列 ア ラ イ ン メ ン ト (multiple alignment) : 3 つ以上の 配 列 の比較
************************************************************************
実 習21
AlignmentPairwise alignment
1 ) 使 用 す る ウ ェ ブ サ イ ト : The European Bioinformatics Institute (EBI )http://www.ebi.ac.uk/Information/ ( Internet explorerを 使 っ て EBI で検 索 )
2 ) Services の中 か ら Proteins を選 択。 →左 下の See all toolsを開 け 、 リ ス ト の中か ら
EMBOSS を選択
Local alignment → Matcher (protein)2 つ の枠内 に 配 列 を ペ ー ス ト し て Submit練習 :
下の gnrh ( gonadotropin-releasing hormone; 生腺腺刺激ホ ル モ ン ) か ら ヒ ト とゼブ ラ フ ィ
シュを選んでア ラ イ ン メ ン ト を 実 行 し て み よう。
次に 、 ヒ ト と ホヤ( Ciona )で実 行 し て み よう
Global alignment → Needle (protein)Needle, Protein を選択し 2 つ の枠内 に 配 列 を ペ ー ス ト し て Submit練習 :上と同じ入力を 行 い 、 結 果 の違い を 理 解 し よう
>human_GNRH1
MKPIQKLLAGLILLTSCVEGCSS
QHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI
>mouse_Gnrh
MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEA
RQKKM
>chicken_Gnrh1
MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEG
EARRKEI
>xenopus_GnRH1
MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGEN
RKKI
>zebrafish_gnrh2
MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKR
K
>ciona_gnrh1
MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVN
ARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGM
PEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE
GNRH: 生腺刺激ホ ル モ ン放出 ホ ル モ ン . 視床下部で合 成 さ れ 、下垂体門脈経 路 を介し て下垂体
前葉に運ばれ 、 生腺刺激ホ ル モ ンであ る 黄体形成 ホ ル モ ン (LH) と濾法刺激ホ ル モ ン (FS
H) の産生 と放出 を促進 す る神経 性 ペ プ チ ド ホ ル モ ン . ホ ル モ ン前駆体と し て 合 成 さ れ た あ と
酵素に よ り切断さ れ 、 ヒ トでは HWSYGLRPG ペ プ チ ド が ホ ル モ ン と し て 機 能 す る 。
22
Ciona: カタユレ イボヤ( ホヤの仲間で日 本 の 研 究 グ ル ー プ に よ っ て ゲ ノ ム シ ー ク エ ン ス が 解 読
さ れ た )
講 義分 子 系 統 樹 : Phylogenetic tree, Evolutionary tree
分 子 系 統 樹 ( 進 化 系 統 樹 ) (molecular phylogenetic tree, evolutionary tree)塩 基 配 列やア ミ ノ 酸 配 列 を 基 に 分岐位置と 分岐時間を推定 し 、 構築さ れ た 系 統 樹
近接接合法 (neighbor-joining method): 距離行 列法で作 成 す る 分 子 系 統 樹 の 作 成 方
法で、 生 物 分野で最も一般的に 利 用 さ れ る 。
キ ー ワ ー ド
節、枝、 ク ラ ス タ ー (cluster) あ る い は ク レ ー ド (clade)Outgroup 、 Bootstrap value ( ブ ーツス ト ラ ッ プ値) 、 Evolutionary distance
分 子 系 統 樹 の 利 用
( 1 ) 遺 伝 子 の同種間、異種間での 系 統 関 係 の 解 析
( 2 ) 遺 伝 子 ファミ リ ー に属す る メ ン バ ー の 系 統 関 係 の 解 析
( 3 ) 重 複 遺 伝 子 の 重 複時期と 進 化的関 係 の 解 析
( 4 ) 種や系 統 の 進 化的関 係 の推定
分 子 系 統 樹 か ら 、様々な 情 報 を 読 み 取 る こ と ができま す 。異な る 生 物達の 関 連 ( ホ モ ロ グ )
遺 伝 子で分 子 系 統 樹 を 作 製 す る と 、 遺 伝 子 の 進 化的関 係 を 予 測 す る こ と ができま す 。 ま た ミ ト
コ ン ド リ ア DNA の 配 列 を 使うと 、人種の類縁関 係や進 化的関 係 を 解 析 す る こ と が 可 能です 。 授
業では 、 分 子 系 統 樹 の 作 製 方法と デ ー タ の 見 方 を 講 義 し ま す 。
実 習
分 子 系 統 樹 の 作 製
ClustalW を 使 っ た Multiple alignmen と 分 子 系 統 の 作 成 1 ) 使 用 す る ウ ェ ブ サ イ ト ClustalW http://clustalw.genome.jp/2 ) Fasta format で並べた 配 列 を枠内 に ペ ー ス ト し 、 execute multiple alignment を押
す (各種ボタ ン は デ フ ォ ル トでよ い )
練 習 : 下 の gnrh (gonadotropin-releasing hormone) のうち、 >ciona_gnrh1 ( ホ
ヤ) を除く配 列でア ラ イ ン メ ン ト を 実 行 し て み よう。次に 、 >ciona_gnrh1 を入
れ て ア ラ イ ン メ ン ト を 実 行 し 、 結 果 を比べて み よう。
上に Multiple sequence alignments の 結 果 が表示 さ れ る 。
その下に あ る select tree menuで表示形式を選択し て 、 Exec を ク リ ッ ク す る
23
表示形式、 N-J tree branch length と Unrooted dendrogram の 結 果 を比較
し て み よう
>human_GNRH1
MKPIQKLLAGLILLTSCVEGCSS
QHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI
>mouse_Gnrh
MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEA
RQKKM
>chicken_Gnrh1
MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEG
EARRKEI
>xenopus_GnRH1
MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGEN
RKKI
>zebrafish_gnrh2
MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKR
K
>ciona_gnrh1
MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVN
ARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGM
PEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE
こ の サ イ トでの 検 索 結 果では 、 Bootstrap value, evolutionary distance の値は表示 さ れ な い 。
DDBJ の ClustalW を 使えば、 こ れ ら の値が求めら れ る 。 ただし 、 ま た 結 果 の 図形を表示 す
る ために 、 Tree View と言う無料ソ フ ト をダウ ン ロ ー ド す る 必 要 が あ る 。教室の コ ン
ピュー タ ーでは 、 ソ フ ト ウ ェ ア のダウ ン ロ ー ド は ためらわれ る ので、各自の パ ソ コ ンで
DDBJ を試し て下さ い 。
あ る い は 、 ClustalX の プ ロ グ ラ ム をダウ ン ロ ー ド し て 解 析 す る (下記 URL ) 。
http://www.cbs.dtu.dk/courses/humanbio/2010/exercises/ExMulPhyl/Ex_Phylo.php
NCBI を 使 っ た Multiple alignment と 系 統 樹 の 作 成
1 . NCB→BLAST→ 下に あ る Multiple Alignment を選択
2. 枠内 に 配 列 を Fasta format でコピー
3 . Align を ク リ ッ ク し て 検 索
4. 検 索 画面上の Phylogenetic Tree を ク リ ッ ク
5 . Evolutionary distance を反映し た 系 統 樹 が表示 さ れ る
6 . Tools か ら Layout 、 Radial tree を選択す る と無根系 統 樹 が表示 さ れ る
プ ロ グ ラ ム に は 、 2007 年に開発 さ れ た 、 COBALT: constraint-based alignment tool for multiple protein sequences が 使われ て い る
24
>drosophila_hh
MDNHSSVPWASAASVTCLSLDAKCHSSSSSSSSKSAASSISAIPQEETQTMRHIAHTQRCLSRLTSLVALLLIVLPMVFSPAHSCGPGRGLGRHRA
RNLYPLVLKQTIPNLSEYTNSASGPLEGVIRRDSPKFKDLVPNYNRDILFRDEEGTGADRLMSKRCKEKLNVLAYSVMNEWPGIRLLVTESWDEDY
HHGQESLHYEGRAVTIATSDRDQSKYGMLARLAVEAGFDWVSYVSRRHIYCSVKSDSSISSHVHGCFTPESTALLESGVRKPLGELSIGDRVLSMT
ANGQAVYSEVILFMDRNLEQMQNFVQLHTDGGAVLTVTPAHLVSVWQPESQKLTFVFADRIEEKNQVLVRDVETGELRPQRVVKVGSVRSKGVVAP
LTREGTIVVNSVAASCYAVINSQSLAHWGLAPMRLLSTLEAWLPAKEQLHSSPKVVSSAQQQNGIHWYANALYKVKDYVLPQSWRHD
>mouse_dhh
MALPASLLPLCCLALLALSAQSCGPGRGPVGRRRYVRKQLVPLLYKQFVPSMPERTLGASGPAEGRVTRGSERFRDLVPNYNPDIIFKDEENSGAD
RLMTERCKERVNALAIAVMNMWPGVRLRVTEGWDEDGHHAQDSLHYEGRALDITTSDRDRNKYGLLARLAVEAGFDWVYYESRNHIHVSVKADNSL
AVRAGGCFPGNATVRLRSGERKGLRELHRGDWVLAADAAGRVVPTPVLLFLDRDLQRRASFVAVETERPPRKLLLTPWHLVFAARGPAPAPGDFAP
VFARRLRAGDSVLAPGGDALQPARVARVAREEAVGVFAPLTAHGTLLVNDVLASCYAVLESHQWAHRAFAPLRLLHALGALLPGGAVQPTGMHWYS
RLLYRLAEELMG
>mouse_ishh
MSPAWLRPRLRFCLFLLLLLLVPAARGCGPGRVVGSRRRPPRKLVPLAYKQFSPNVPEKTLGASGRYEGKIARSSERFKELTPNYNPDIIFKDEEN
TGADRLMTQRCKDRLNSLAISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRNKYGLLARLAVEAGFDWVYYESKAHVHCSVKS
EHSAAAKTGGCFPAGAQVRLENGERVALSAVKPGDRVLAMGEDGTPTFSDVLIFLDREPNRLRAFQVIETQDPPRRLALTPAHLLFIADNHTEPAA
HFRATFASHVQPGQYVLVSGVPGLQPARVAAVSTHVALGSYAPLTRHGTLVVEDVVASCFAAVADHHLAQLAFWPLRLFPSLAWGSWTPSEGVHWY
PQMLYRLGRLLLEESTFHPLGMSGAGS
>mouse_shh
MLLLLARCFLVILASSLLVCPGLACGPGRGFGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSERFKELTPNYNPDIIFKDEENTGAD
RLMTQRCKDKLNALAISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRSKYGMLARLAVEAGFDWVYYESKAHIHCSVKAENSV
AAKSGGCFPGSATVHLEQGGTKLVKDLRPGDRVLAADDQGRLLYSDFLTFLDRDEGAKKVFYVIETLEPRERLLLTAAHLLFVAPHNDSGPTPGPS
ALFASRVRPGQRVYVVAERGGDRRLLPAAVHSVTLREEEAGAYAPLTAHGTILINRVLASCYAVIEEHSWAHRAFAPFRLAHALLAALAPARTDGG
GGGSIPAAQSATEARGAEPTAGIHWYSQLLYHIGTWLLDSETMHPLGMAVKSS
>xenopus_shh
MLVATQSLLLLSFICTLVTPPGLACGPGRGIGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSDCFKELTPNYNPDIMFKDEESTGAD
RLMTQRCKDKLNALAISVMNQWPGVKLRVTEGWDEDGHHLEESLHYEGRAVDITTSDRDRSKYGMLGRLAVEAGFDWVYYESKAHIHCSVKAENSV
AAKSGGCFPAGARVMVEFGGTKAVKDLRPGDRVLSSDPQGNLLYSDFLMFIDQERDVKKLFYVIETSQRKIRLTAAHLLFVAQTKVNGTRSFKSVF
ASNIQPGDLIYTADPKTMTLKAVKVEKVDLEEDTGAYAPLTAHGTVVIDQVLASCYAVIEEHTWAHLAFAPLRFGMSLSSYIYPRDSSPPSGLQPH
HQVDLQSHHQVDLQSHHQVDLQSHHQLEGIHWYSQLLYQIGTWLLDSNSLHPLGMATKSS
>xenopus_dhh
MPAVRIVILAICCGLLLVPVRCCGPGRGPVGRRRYMRKLVPLHYKQFVPNVPEKTLGASGKSEGKIHRGSERFIELVPNYNPDIIFKDEEKTGADR
LMTERCKDRVNALAISVMNMWPGVKLRVTEGWDEDGHHAHDSLHYEGRALDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHVSVKADNSLG
VRSGGCFPGTAMVMMGTGERKPLSELKIGDTVYTTDETGQLITSVVLLFLHRNPYKTATFVLIEAEGHPSKLLVTPNHLLFIQSSSSAGFLPFAYR
VQIGDLVQIYVNGTQVQSSKVVRVSLEEQTGVYAPMTEHGTLLVDGVLTSCYATVESHTLAHVSLAPLRLFQGIASMLPDLDMSDGVHWYCHILYV
LAKYVLWWDMP
>xenopus_ihh
MQLPKVVLLLCAAALLLSGAVRGCGPGRVVGRRRRPTKLSPLSYKQFSPNVPEKTLGASGRYEGKISRNSERFKELTPNYNPDIIFKDEEITGADR
LMTQRCKDRLNSLAISVMNQWPGVKLRVTEGWDEDGHHFEESLHYEGRAVDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHCSVKSEHSAA
AKTGGCFPGEALATLESGEKIPVSQLSPGLRVLAMDNSGRPTYSDFLSFLDHSPKEEHMFQVIKTQDPHRRLFLTPAHLIFVSDNYSTPASEFQAV
FASSVRPGQYILVSNVVGLIPAKVRSVNTQTNYGAYAPLTQHGTLVVDDVVVSCFALVQKQRLAQIVYWPLRVLYNLGIIAGTQPSQQMGIHWYSK
ALYHLGRLILHGNEFHPLGIVQLES
25
26
11 月 14 日 ( 第 7 回 )
実 習
分 子 系 統 樹 の 作 成
シ ョ ウ ジ ョ ウ バ エ ( Drosophila ) の hedgehog タ ン パ ク 質 に 対 す る 、 マ ウ ス ( Mus musculus) とツメ ガ エ ル ( Xenopus tropicalis ) の類似遺 伝 子 を 検 索 し て 分 子 系 統 樹 を 作 成
す る 。
配 列 は メ モ帳( Text ファイ ル ) に コピー す る 。
手順は以下の ように 行う
1 . シ ョ ウ ジ ョ ウ バ エ ( Drosophila ) の hedgehog タ ン パ ク 質 の ア ミ ノ 酸 配 列 を 、
proteinデ ー タ ベ ー ス か ら キ ー ワ ー ド 検 索 す る (Accession number: AAF56102) 。 FASTA ボタ
ン を押す と 、 FASTA フ ォ ー ム の 配 列 が表示 さ れ る 。 ア ミ ノ 酸 配 列 を Word に コピー す る 。
> 名前を付け て 、 Fasta format と す る ( ス ペ ー ス と数字 は 、 検 索時に削除さ れ て 計算さ
れ る ので、その ま ま に し てもか まわな い ) 。
2.マ ウ ス の hedgehog ホ モ ロ グ を 検 索 し て 、 配 列 を 取 り 出 す
NCBI先頭ペ ー ジ下側 Features に あ る Map viewer でマ ウ ス Mus musculus の B (blast) ボタ ン
を ク リ ッ ク 。 マ ウ ス ゲ ノ ム に対す る BLAST が開くので、 Bastp を選択し て 検 索 す る ( マ
ウ ス ゲ ノ ム に コ ー ド さ れ る 全 て の タ ン パ ク 質 ア ミ ノ 酸 情 報 に対し て 検 索 ) 。
検 索 に よ り 表 示 さ れ た 3 種 類 の hedgehog の 配 列 を 取 り 出 す 。 取 り 出 し 方 は 、
Accession 番号を ク リ ッ ク し 、表示 さ れ た 配 列 情 報 ペ ー ジ の上に あ る FASTA ボタ ン を押
す 。 FASTA フ ォ ー ム の 配 列 が表示 さ れ るで、 コピー す る 。
3. Xenopus の hedgehog ホ モ ロ グ を 検 索 し て 、 配 列 を 取 り 出 す
Map viewer でXenopus tropicalis を選ぶ。以下、 2 の操作 と同じ。
4. ClustalW ( http://clustalw.genome.jp/ ) を 使 っ て 、枠内 に7つ の 遺 伝 子 の 全 配 列 を コ
ピー し 、 マ ル チ プ ル ア ラ イ メ ン ト を 実施す る 。 マ ウ ス と Xenopus の間で配 列 の保存性 を
注意深くみ て 、保存性 の 特 徴 を 理 解 す る 。
5.分 子 系 統 樹 を 作 成 す る 。 N-J tree branch length と Unrooted dendrogram の 結 果
を比較
4 の 結 果 と あわせて 、 Outgroup, Paralog, Ortholog の 関 係 を 理 解 す る 。 ヒ ト 遺 伝 子間の パ
ラ ロ グ よ りも、 ヒ ト と Xenopus の オ ル ソ ロ グ間の 方 が保存性 の高い こ と に注意 。 こ れ は
祖先 遺 伝 子 が 重 複 し て 2 つ の 遺 伝 子 ( パ ラ ロ グ と な る ) を形成 し 、その あ と に種分 化 が
起こ っ た ためであ る 。
講 義
27
オ ル ソ ロ グ と パ ラ ロ グ 、 ホ モ ロ グ の 関 係 に つ い て
無 脊椎 動 物 か ら脊椎 動 物 へ の 進 化 の過 程で、 全 ゲ ノ ム ( 全 て の染 色体 ) の 重 複 ( whole genome duplication: WGD ) が 2 回起こ っ て い ま す 。その ため原 索動物 ( ナ メ ク ジ ウ オ 等 が含ま
れ 、無脊椎動物 の な かで脊椎動物 に最も近い )で 1 種類であ っ た 遺 伝 子 は 、一度 4 つ に数が 増
えて い ま す ( 遺 伝 子 に よ っ て は 4 つ に 増えた あ と 、 4 つ とも残っ て い るもの 、 1 つ消失し て 3つ が残っ て い るもの 、 2 つ消失し て 2 つ が残っ て い るもの 、 3 つ が消失し て 1 種類だけ残っ て
い るものもあ り ま す ) 。一つ の 遺 伝 子 か ら 、 ゲ ノ ム 重 複 に よ り誕生 し た 重 複産物 の種内での 関
係 は パ ラ ロ グ ( Paralog ) と呼ばれ ま す 。現存の脊椎動物 (円口類を除く) は 2 回 の ゲ ノ ム の
重 複 が起こ っ て か ら 、 多様な種に 分岐し て い ま す 。その ため、脊椎動物 の 生 物種間で相同な 重
複 遺 伝 子 が存在し ており 、それ ら は ( Ortholog ) と呼ばれ 、 パ ラ ロ グ と区別さ れ ま す 。 オ ル ソ
ロ グ の 関 係 に あ る 遺 伝 子 は 、種が異な っ ても( 例えば哺乳類と魚類) 機 能 が良く保存さ れ て い
ま す 。一方 、 パ ラ ロ グ の 関 係 に あ る 遺 伝 子では 、 機 能 分担が起こ っ て い ま す 。 オ ル ソ ロ グ と パ
ラ ロ グ と の 関 係 は 、 分 子 系 統 樹 を 作 製 す る こ と に よ り 理 解できま す 。 ホ モ ロ グ ( 関 連 遺 伝 子 )
は 、共通祖先 か ら 発 生 し た 遺 伝 子 の 総称で、 オ ル ソ ロ グ と パ ラ ロ グもホ モ ロ グ に含ま れ ま す 。
オ ル ソ ロ グ と パ ラ ロ グ の 関 係 を 理 解 す る ために 、 生 物 の 進 化 の 歴 史 、 遺 伝 子 重 複 の 歴 史 に つ
い て 解 説 し ま す 。 ま た hedgehog 遺 伝 子 を モ デ ル と し て 、 分 子 系 統 樹 を 作 製 し 、 ホ モ ロ グ と パ
ラ ロ グ の 関 係 を 説 明 し ま す 。
無脊椎動物 か ら脊椎動物 に 進 化 す る過程で発 生 し た ゲ ノ ム 重 複 に つ い て少し詳しく説 明 し ま
す 。 hox 遺 伝 子 、核内受容体遺 伝 子 を 例 に し て 、 ゲ ノ ム に刻ま れ た 遺 伝 子 重 複 の 歴 史 を 解 説 し
ま す ( こ こでは 、 配付資料を参考に し て 説 明 し ま す ) 。
28
11 月 21 日 ( 第 8 回 )
実 習
代 謝 経 路 デ ー タ ベ ー ス の 利 用
無料で公開さ れ て い る 代 謝 経 路 の デ ー タ ベ ー ス と し て最も充実 し て い る の が 、京都大 学 化 学
研 究所が 統括し て い る KEGG (Kyoto Encyclopedia of Genes and Genomics) であ る 。 代 謝 経 路
の マ ッ プ を調べる こ と ができるだけでなく、 遺 伝 子 の 機 能 、 配 列 、 タ ン パ ク 質 の 立体構 造も検
索できる 。 ク ロ ーニン グ し た 遺 伝 子 がどの ような 代 謝 経 路で機 能 し て い る か 、 あ る い は 代 謝異
常の メカニズ ム なども調べる こ と ができる 。
ま た さ ま ざ ま な 化 合 物 (抗生 物 質 等 )や市販の医薬品の 構 造 、 薬 理 作 用 、副作 用 を 検 索 す る
こ ともできる 。 遺 伝 子や化 合 物 の 機 能や相互作 用 を調べる場合 、 ま た レ ポ ー ト 作 成 等 にも役立
つ 。 日 本語表記の サ イ トも利 用できる 。
KEGG MEDICUS と名付け ら れ た 、医薬品・疾患・ パ ス ウ ェ ー の 統 合 デ ー タ ベ ー スも公開さ
れ て い る 。疾患・医薬品・環境物 質 など社会的ニー ズ の高い デ ー タ を 、 ゲ ノ ム 情 報 を 基盤と し
た 生体シ ス テ ム 情 報 と い て 統 合 し た リ ソ ー スで、 研 究者だけでなく、医療従事者や一般の人に
も情 報 を 提供し て い る 。
KEGG ブ ラ ウザ: http://www.genome.jp/kegg/pathway.html
KEGG Pathway を開け て み よう。 パ ス ウ ェ ー の項目は 、以下ように 分類さ れ て い る 。
1. Metabolism ;代 謝 経 路 (ビタ ミ ン A, retinol metabolism, の 代 謝 経 路 を調べて み よ
う。 代 謝産物 を 示 す が ア ク テ ィ ブで構 造 等 が表示 さ れ る 。 ま た 代 謝 を司る酵素名も◯ア ク テ ィ ブで、 配 列 情 報 等 が表示 さ れ る )
2. Genetic Information Processing ;遺 伝 子 か ら蛋白質 合 成 経 路 ・蛋白の修飾と 分
解 ・ ゲ ノ ム の修復 等 ( homologous recombination と non-homologous end-joining の 経 路
を比較し て み よう)
3. Environmental Information Processing ;細胞内 シ グ ナ ル 伝達経 路 ・ 分泌性 シ グ ナ
ル因子 を介し た細胞間相互作 用 ( TGF-beta の細胞内 伝達系 を調べて み よう。 発現の促
進 と抑制( ア ゴニス ト ) の 関 係 が 分 か る )
4. Cellular Processes :細胞の活動、細胞分裂サ イ ク ル 等 ( Oocyte meiosis (卵母細
胞減数分裂) を調べて み よう)
5. Organismal system;免疫系 ・ 内 分泌制御経 路 等 ( GnRH 、 生殖腺刺激ホ ル モ ン放
出 ホ ル モ ン 、 の 内 分泌経 路 を調べて み よう)
6. Human Deseases : 発 ガ ン 経 路 ・ 代 謝異常等 ( Melanoma, プ リ オ ン病 , diabetes( 1型糖尿病、 2 型糖尿病) の 発症経 路 を調べて み よう)
7. Drug Development :抗生 物 質 ・ 薬 剤 の 化 学 構 造 ( penicillin, antidepressants を調べ
て み よう。 合 成 経 路 、 薬 剤 の 分 解酵素等も表示 さ れ る )
遺 伝 子 の キ ー ワ ー ドでパ ス ウ ェ ー を 検 索 す る時の操作 は下記の通り ( 遺 伝 子名か ら パ ス
29
ウ ェ ー に入る )
練習 に hh; hedgehog の シ グ ナ ル パ ス ウ ェ ー を 見 よう
1. 先頭ペ ー ジで KEGG PATHWAT を ク リ ッ ク
2. 枠に hedgehog を入力し て GO3 . hedgehog が 関与す る パ ス ウ ェ ー ( Entry ) が 複数表示 さ れ る
4. 試し に map04340 を選択し て み よう。
5. パ ス ウ ェ ー が拡大 さ れ る 。各遺 伝 子 が ア ク テ ィ ブで、 配 列 ・ 機 能 情 報 に リ
ン ク し て い る 。
6. 上の HEDGEHOG SIGNALLING PATHWAY を選択す る と 、 こ の シ グ ナ ル の 説 明
を 見 る こ と ができる 。
練習 に estradiol の 合 成 経 路 を調べて み よう
1. 先頭ペ ー ジで KEGG PATHWAT を ク リ ッ ク
2. 枠に estradiol を入力し て GO3 . estradiol が 関与す る パ ス ウ ェ ー ( Entry ) が 複数表示 さ れ る
4 . Steroid hormone biosynthesis を あ け る と cholesterol か ら の 合 成 経 路 を 見 ら
れ る
5. 反応を 触媒す る酵素名が ア ク テ ィ ブで反応系 、 配 列 等 の 情 報 を 見 る こ と が
できる
6. ま た各代 謝産物 の 化 学 構 造も表示できる
遺 伝 子 の 化 合 物 の 構 造 を 検 索 す る時の操作 は下記の通り
練習 に ampicillin の 構 造 を調べて み よう
1. 先頭ペ ー ジで KEGG DRUG を ク リ ッ ク
2. 枠に ampicillinを入力し て GO3 . Entry を選択す る と 構 造 等 が 見 ら れ る
KEGG の BLAST検 索 を 使 っ て 、調べた い 遺 伝 子 ・ タ ン パ ク 質 が乗っ て い る パ ス ウ ェ ー を 検
索 す る こ ともできる .1. KEGG2 先頭ペ ー ジ上段の GENES を ク リ ッ ク 。 BLAST を開け る 。
2 . 例 と し て 、下の 塩 基 配 列 (私達の 研 究 グ ル ー プ が ウ ナギか ら ク ロ ーニン グ し
た 遺 伝 子でまだデ ー タ ベ ー ス に は登録し て い な い )でBLASTX 検 索 し て み よ
う
>test_DNA_sequence-2
ATCACTGCGTCTTGTGTCCTATCGGTCTAGCCTAGCCACTGTCTANAAGCTATAGGAAGGTTTCAGTATTGGGAGCCATGTTTGGGAGC
CTGCTGTTCACTGTGCTGTGTGAGGCAGCAGTGGCCCTCATCAACCCAAATCTAAGCCTCCATTGGGAGATGTGGAAGGAGGGACATGA
CAAGACCTACCTGTTTAAGGCTGAAGAGTTTGCACGCCGCCAGATCTGGGAGAAGAACCTGAAGCTGATAACTCTGCATAATTTGGAGG
CGTCCATGGGAATGCACACCTATGATCTGGGCATGAACCACCTAGGAGACTTGACTACCGAGGAGATTCTTGACGTGCTAGCTGTAACT
CGTGTGCCTCCAAACTTCAGCAGGGGTCCTTCTCCCTTTGTGGGGGTATCCAGGGCCCCTGTGCCTCACAATGTTGATTGGCGAAGAAA
GGGCTATGTCACAGAAGTCAAGAGTCAGGGGCGTTGTGGCTCCTGCTGGGCCTTCAGTGCTGCAGGTGCCCTGGAGGGCCAGCTGATGA
AGACTCAGGGAACACTTGTATCCCTCAGCCCTCAGAACCTGGTTGACTGCTCCTACAAATATGGCAACGAGGGCTGTCATGGAGGGTTC
30
ATGACTCAAGCCTTCCAGTATGTCATTGAGAACGGGGGCATTGAGTCTGACTTTTCATACCCTTACACTGGCATGGAAGAACAATGCAG
ATATGATTCAGAACTCCGTGTTGCCAACTGTTCCAGCTACAGGTTTCTTCCTGAAGGTGATGAGGTTGCATTAAAATGGGCTCTGGCCA
CTGTTGGACCAATCTCTGTGGCTATTGATGCTGCTCGACCTAATTTCCACTTCTACCGGAGTGGTGTGTACCATGACCCTACCTGTACC
CAAGAAGTAAACCATGGTGTTCTAGCAGTTGGCTATGGTACGCTCAATGGTGAGGACTACTGGCTTGTGAAGAACAGCTGGGGACAGCC
TTTTGGGGAACAGGGCTACATTCGCATGGCACGAAACAAGAACAACCAGTGTGGCGTTGCCTTGTATGCCTGCTACCCCATTATGTGAC
GACCTGAAGCAAAGGATTGATTTCTAACTTGAAACATTTTAAAATTTTTATTTTGATTTGCACCTGTGCATGTTACTGATTTGTAAAGA
ATACTGTTAAAATGATTTGTATTAAAAAAATATATATTTTTAGATGTGGAATTTTAGTTGAACCTAAATAAATAAATGTAAAAAAAAA
1. ゼブ ラ フ ィ ッ シュDre の エ ン ト リ ー を開け て み よう
2 . Pathway を開け て み よう。 検 索 し た 遺 伝 子 の パ ス ウ ェ ー上の 位置が 分 か る
KEGG MEDICUS利 用できる サ ービス
・ KEGG MEDICUS 医薬品情 報
・ KEGG MEDICUS 疾患情 報
・ KEGG MEDICUS 医薬品相互作 用
・ KEGG BRITE 医薬品分類
・ KEGG お薬 情 報
・ KEGG 先頭ペ ー ジ上段で、 MEDICUS を選択
・ Imatinib と言う医薬品でキ ー ワ ー ド 検 索 し て み よう
・効果 、 製 造 会社、 化 学 構 造 等 を知る こ と ができる :
31
以 下 工 事 中
講 義
タ ン パ ク 質 の 構 造 に つ い て の 解 説各種プ ロ グ ラ ム を 使うこ と に よ り 、 タ ン パ ク 質 の 構 造的特 徴 を 予 測 す る こ と ができま す 。今日
の 授 業では 、 シ グ ナ ル ペ プ チ ド 、 ド メ イ ン 構 造 に つ い て 解 説 し た あ と 、 テ ス ト 配 列 を 使 っ て 実
際 に こ れ ら 構 造 の 検 索 ( 分 子 量 、 等 電 点 、 シ グ ナ ル ペ プ チ ド 、 疎 水 性 ・ 親 水 性領域、 ド メ イ ン
構 造 ) を 行 い ま す 。
代表的な ド メ イ ン 構 造 ( モ チ ー フ ) 検 索 サ イ ト に は 、 イギリ ス の サ ン ガ ー 研 究所が公開し て
い る Pfam が あ り ま す 。
シ グ ナ ル ペ プ チ ド
分泌性 の蛋白質 の N 末端に存在す る 、 15-30 残基 の 疎 水 性 ア ミ ノ 酸 か ら 構 成 さ れ た シ グ ナ ル 配
列 。 分泌前に 、 シ グ ナ ル ペ プ チダーゼに よ っ て切断さ れ る 。
タ ン パ ク 質 の ド メ イ ン ( モ チ ー フ ) 構 造
ド メ イ ン 構 造 ( = モ チ ー フ ) : タ ン パ ク 質 の ア ミ ノ 酸 配 列 の な かで、 特有な 性 質 を持っ た領域。
分 子 の 構 造上あ る い は 機 能上一つ の ま と ま り を持つ領域。
ド メ イ ン 構 造 の 例
細胞膜レ セ プ タ ー : リ ガ ン ド 結 合 ド メ イ ン 、細胞膜貫通ド メ イ ン 、 チ ロ シ ン キ ナ ーゼ
ド メ イ ン 、 リ ン 酸 化 ド メ イ ン
核レ セ プ タ ー : リ ガ ン ド 結 合 ド メ イ ン 、 DNA 結 合 ド メ イ ン
実 習
塩 基 配 列 の ア ミ ノ 酸 配 列 へ の 変 換
し て み ま す 。 コ ンピュー タ ー操作 に慣れ る ように し て下さ い 。今回 は 、魚類の cDNA ラ イ ブ
ラ リ ー か ら ク ロ ーニン グ さ れ た cDNA ク ロ ー ン の 全長配 列 ( 5’UTR, CDS, 3’UTR を含んでい る )
を 使 っ て 実 習 し ま す 。
5’UTR ( 5’非翻訳領域) , CDS ( コ ー ド 配 列 ) , 3’UTR( 3’非翻訳領域)
塩 基 配 列 ( >test_DNA_sequence-1 ) を ア ミ ノ 酸 配 列 に 変 換 し て み よう
1 ) 利 用 す る ウ ェ ブ サ イ ト : NCBI (National Center for Biotechnology Center) http://www.ncbi.nlm.nih.gov/
2 ) 使 用 す る ア イ コ ン : Open Reading Frame Finder (ORF finder )32
open reading frame = 蛋白質 を コ ー ド す る 塩 基 配 列 の 読 み 取 り枠
あ る い は 、 Epaxy の Translatehttps://web.expasy.org/translate/
ORF finder に よ る 検 索 手 順1 . NCBIの ウ ェ ブ サ イ ト を開き、左上Resource List (A-Z) を ク リ ッ ク
2 . Open reading frame finder(ORF finder)を開け る
3.ア ミ ノ 酸 配 列 に 変 換 す る
配 列 (FASTA format) を枠内 に 配 列 を コピー す る
OrfFind ボタ ン を押す
青で示 さ れ た 部 分 が 、 予想さ れ る ア ミ ノ 酸 配 列
( セ ン ス 、 ア ン チ セ ン ス 鎖 の 3 フ レ ー ムでの翻訳結 果 が 示 さ れ る )
通常、一番長い フ レ ー ム が タ ン パ ク 質 の コ ー ド 配 列であ る
青 の バ ー を ク リ ッ ク す る = 塩 基 配 列 と ア ミ ノ 酸 配 列 が表示 さ れ る
4.推定 さ れ た ア ミ ノ 酸 配 列 を 取 り 出 す に は
Acceptボタ ン を押す
Viewボタ ン を押す : ア ミ ノ 酸 配 列 デ ー タ と諸情 報 が 示 さ れ て い る
ア ミ ノ 酸 配 列 を テ キ ス ト ファイ ル 等 に コピー す る
>test_DNA_sequence-1(zebrafish_charon)
AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTT
CTTTTTTGTAAAATTCTATAATTTAGCTAAAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGG
CGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTTGAATCCTCCGGGAATGGACCAGA
CGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTT
CAGAAATTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAA
ACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGA
GCGAAAAAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACA
GCGCATAACGGAGGAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCC
CTCCAGCGGAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCA
CCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAACCAGCAGCGAAGAGGC
CAAAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA
//
Epaxy の Translate に よ る 検 索 手 順
タ ン パ ク 質 の 構 造 解 析では 、ヨー ロ ッ パ の 研 究 機 関 の ウ ェ ブ サ イ ト が充実 し て い る 。 特 に
Swiss Institute of Bioinformatics 、 Sanger研 究所( イギリ ス ) の サ イ ト は 、 利 用価値が高い 。前
者は 、 ExPASy (Bioinformatics Resource Portal) 、後者は Pfam ( ド メ イ ン 解 析 ) を公開し て い る 。
ま た European Bioinformatics Institute (EBI)でも、 タ ン パ ク 質 の 構 造 解 析 プ ロ グ ラ ム を公開し て い
る 。
1 . Epaxy を あ け る
33
2. 左の Visual guideの 、 DNA を ク リ ッ ク
3 . Translate を選択
4. 枠内 に 塩 基 配 列 の み コピー し 、 Translate sequenceを ク リ ッ ク し て 検 索
基 本 構 造 の 解 析
タ ン パ ク 質 の 分子量・等電点の 予 測 :
1 ) ExPASy (http://ca.expasy.org/)を開け る 。
2 ) Category の な か の Proteomics を開け る
3 ) Tools か ら Compute PI/Mw を選択
4 ) 下記の > zebrafish_Charon で検 索 し て み よう。 ア ミ ノ 酸 配 列 を枠内 に コピー す る
( 配 列 の み : こ の プ ロ グ ラ ム で は > で 始 ま る 行 は コ ピ ー し な い ) 。 Click here to computepI/Mw ボタ ン を ク リ ッ ク す る 。
5) 検 索 結 果 : Theoretical pI/Mw: 10.00 ( 等 電 点 ) / 27073.04( 分 子 量 )
>zebrafish_CharonMTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRN
SPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCA
AVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVL
IVEECKCETSSEEAKVQNTDMFNL
//
(ゼブ ラ フ ィ ッ シュCharon: 分泌型の シ グ ナ ル タ ン パ ク 質 )
疎水性・親水性領域の 解 析 :
1 ) ExPASy Proteomics tools (http://ca.expasy.org/) を開け る 2 ) Category の Proteomics を開け る
3 ) Tools か ら Prot Scale を選択
4 ) ア ミ ノ 酸 配 列 を枠内 に コピー す る 。 Hphob. / Kyte &Doolittle ( デ フ ォ ル ト状態:
疎 水 性 / 親 水 性 解 析で最も利 用 さ れ て い る プ ロ グ ラ ム ) を選択す る 。
5) >zebrafish_fgfr1 で試し て み よう
6) Submit ボタ ン を押す
7) 結 果 : グ ラ フ の プ ラ ス が 疎 水 性 、 マ イ ナ ス が 親 水 性 を 示 す . fgfr1 では 、 ア ミ ノ末端
側の 疎 水領域は シ グ ナ ル ペ プ チ ド の 部 分 。中央の 疎 水領域は 、細胞膜貫通ド メ イ ンで
あ る 。
>zebrafish_fgfr1
MIMKTTLLLISVLLTQALQSQGRPAIQDEAPAEPTSYTLDSGEKLELSCKAKEDTQKVTWTKDLVPLVDGEHTRLRN
DQMEIEKVEPADSGLYACFAQGLNSNHTEYFNISVTDEEDEVDSSSEEAKLSNDQNLPMAPVWAQPDKMEKKLHAVP
ASKTVKFRCQANGNPTPTLKWLKNGKEFKRDQRIGGFKVREHMWTIIMESVVPSDRGNYTCLVENRHGSINHTYQLD
VVERSPHRPILQAGLPANRTAVVGSDVEFECKVFSDPQPHIQWLKHIEVNGSRYGPDGLPYVRALKTAGVNTTDKEM
EVLQIRNVSLEDAGEYTCLAGNSIGHSHHSAWLTVYKAVPPTQLPNQTYLEVLIYCVGFFLICVMVGTAVLAKMHSS
AKKSDFNSQLAVHKLAKSIPLRRQVTVSVDSSSSMHSGGMLVRPSRLSSSGSPMLSGVSEYELPQDPRWEVQRDRLV
34
LGKPLGEGCFGQVMMAEAMGMDKEKPNRITKVAVKMLKSDATEKDLSDLISEMEMMKIIGKHKNIINLLGACTQDGP
LYVIVEFAAKGNLREYLRVRRPPGMEYCYNPDQVPVENMSIKDLVSCAYQVARGMEYLASKKCIHRDLAARNVLVTE
DNVMKIADFGLARDIHHIDYYKKTTNGRLPVKWMAPEALFDRIYTHQSDVWSFGVLLWEIFTLGGSPYPGVPVEELF
KLLKEGHRMDRPSTCTHELYMMMRDCWHAVPSQRPTFKQLVEDLDRTLSMTSNQEYLDLSVSLDQFSPNFPDTRSST
CSSGEDSVFSHDAGADEPCLPKFPPHPNRGVAFKKR
( FGF 受容体:細胞内 に チ ロ シ ン キ ナ ーゼド メ イ ン を持っ た膜貫通型細胞膜受容体・
FGF=fibroblast growth factor/ 繊維芽細胞増殖因子 :創傷治癒、培養条件下で繊維芽細
胞の 分裂を促進 す る 。胚発 生では中胚葉誘導に 関与す る )
シ グ ナ ル ペ プ チ ド の 検 索
タ ン パ ク 質 の シ グ ナ ル ペ プ チ ド の 予 測 :
1 ) SignalP 3.0 Server ( http://www.cbs.dtu.dk/services/SignalP/ ) を開け る ( デ ン マ ー
ク の Technical University が公開)
2 ) >zebrafish_Charonで検 索 し て み よう。 ア ミ ノ 酸 配 列 を枠内 に コピー す る 。 Submitボタ ン を ク リ ッ ク す る 。
練習 :下の ア ミ ノ 酸 配 列でも検 索 し て み よう
>mouse_vitamin_D_receptor
MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNR
RHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPT
YADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPL
SMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDI
TDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCR
HPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS
(ビタ ミ ン D受容体は 、核に移行 す る蛋白質 な のでシ グ ナ ル ペ プ チ ド は な い )
ド メ イ ン 構 造 の 検 索
タ ン パ ク 質 の ド メ イ ン 構造の 予 測 -1: Pfam を 使う( ド メ イ ン 検 索で最も利 用 さ れ て
い る : 機 能 ド メ イ ン を探す の に便利 )
今日 は 、下の マ ウ ス のビタ ミ ン D受容体で検 索 し ま す 。
1 ) Pfam ( http://pfam.sanger.ac.uk/ ) ( イギリ ス の サ ン ガ ー 研 究所) を開け る
2 ) SEQUENCE SEARCH ボタ ン を押す
3 ) 枠内 に ア ミ ノ 酸 配 列 (試し に >mouse_vitamin_D_receptor ) を コピー し 、 Go を押す
4 ) み つ か っ た ド メ イ ン 構 造 が グ ラ フ ィ ッ クで上に 図 示 さ れ る 。
5) 下に は各ド メ イ ン の 説 明 が表示 さ れ る 。
6) 一番右の Show/hide alignment を押す と 、 デ ー タ ベ ー ス に納めら れ て い る ド メ イ ン
35
配 列 と問い 合わせ配 列 の ア ラ イ メ ン ト が表示 さ れ る
7) ド メ イ ンネー ム (上の グ ラ フ ィ ッ クも同様) が ア ク テ ィ ブで、それ を押す と 、 ド メ
イ ン の 説 明 、 立体構 図 が表示 さ れ る
8) 右上の グ ラ フ ィ ッ クツー ル のうち、 crystallographic structuresを押す と 、 み つ か っ た
タ ン パ ク 質 の高次構 造 が グ ラ フ ィ ッ クで示 さ れ 、詳細な 構 造 の 説 明も表示 さ れ る 。
PBD ID を押す と 、 タ ン パ ク 質 の高次構 造 ( ア ル ファへ リ ッ ク ス 構 造 等 ) が表示 さ れ
る 。
>mouse_vitamin_D_receptor
MEAMAASTSLPDPGDFDRN
VPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCVDIGMMKEFILT
DEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRPTLS
FSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLT
SDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVL
LMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPE
NSMKLTPLVLEVFGNEIS
(ビタ ミ ン D受容体;核タ ン パ ク 質受容体ファミ リ ー の メ ン バ ーで、骨形成 等 に 関与
す る )
終わっ た人は 、次の タ ン パ ク 質で検 索 し て み よう:
ゼブ ラ フ ィ ッ シュ・ FGF レ セ プ タ ー
等 鎖 結 合 部 位 の 予 測
Asn-Xaa-Ser/Thr タ イ プ の 等 鎖 結 合 部 位 の 予 測 プ ロ グ ラ ム
http://www.cbs.dtu.dk/services/NetNGlyc/
3D 構 造 デ ー タ ベ ー ス の閲覧
NCBI の 利 用
NCBIの Resource List の中に あ る Structure (Molecular Modelling Database) を 使うと 、 タ ン パ ク 質
構 造 デ ー タ ベ ー ス に納めら れ て い る 3D 構 造 を閲覧す る こ と ができま す 。
↓NCBI homepage↓Resource List か ら Structure (Molecular Modelling Database) を選択
↓ 左カラ ム の Search を選択
↓Search の枠に タ ン パ ク 質 明 を入力し て 検 索 (試し に prion, VDR で検 索 し て み よう)
PDB (Protein Data Bank) の 利 用
www.pdb.org 上の ア イ コ ン か ら macromolecule を指定 し て キ ー ワ ー ド 検 索 (試し に prion, VDR で検 索 し て み
よう)
3D 構 造だけでなく、 遺 伝 子 の 機 能 の 解 説も添えら れ て い る
36
NCBI blastp に よ る 検 索
Blastp でデ ー タ ベ ー ス を Protein Data Bank を選択し て 検 索 す る (上の Protein Data Bankに登録さ れ て い る高次構 造 の 分 か っ て い る タ ン パ ク 質 に対し て blastp検 索 が 行われ る )
配 列類似遺 伝 子で高次構 造 の 解 析 さ れ て い る タ ン パ ク 質 が表示 さ れ る 。右の Accession ボ
タ ン を押す と 、 デ ー タ が表示 さ れ る 。右に 3D 構 造 が 図 示 さ れ る 。
37
11 月 28 日 ( 第 9 回 )
講 義
配 列 情 報 と 文 献 の 検 索
研 究 計 画 を 立 て る場合 、その 研 究 に 関 連 し た過去の 論 文 を リ ス ト ア ッ プ し て 、既に 報告さ れ
て い る 成 果 を調べておくこ と が 大 変 重 要です 。 こ の操作 に よ り 、 こ れ か ら 進める 研 究 テ ー マ に
つ い て 、 研 究 がどこ まで進んでい る の か 、何が 分 か っ て い な い の か を調べる訳です 。そし て未
知の 生 物現象を 解 明 す る の に 、最も有効な 計 画 を 立 案 し ま す 。もちろん研 究で遺 伝 子 を扱う場
合 、その 遺 伝 子 の 配 列 、 こ れ までに 分 か っ て い る 性 質 を調べておくこ とも重 要です 。 こ の 検 索
操作 をちゃんと し ておか な い と 、「せっ かく得ら れ た 実験成 果 が既に 報告さ れ て い た」と言う
ような悲惨な こ とも起きかねません。
ま た卒業 論 文や投稿用 論 文 の 作 成時に は 、緒言に 研 究 の 歴 史 と背景、 研 究 内 容 の意義 を述べ、
考察では 実験結 果 と既知の 成 果 を比較検討し 、 研 究で得ら れ た新し い知見 に つ い て議論 し ま す 。
論 文 を仕上げる時にも、 関 連 論 文 を 収 集 し て精査す る 必 要 が あ り ま す 。 文 献以外にも、 ク ロ ー
ニン グ し た 遺 伝 子 と 関 連 遺 伝 子 と の ア ラ イ メ ン ト を 行うこ とや、 分 子 系 統 樹 を 作 成 す る の に 関
連 遺 伝 子 を デ ー タ ベ ー ス か ら引き出 し てくる こ と が 必 要 と な る こ と が あ り ま す 。
例えば、自分 の 研 究でウ シやブ タ などの家畜、 あ る い は 作 物で遺 伝 子 を ク ロ ーニン グ し た と
し ま す 。 遺 伝 子 機 能 に 関 す る 研 究 が 進んだ現在では 、 モ デ ル 生 物 ( マ ウ ス 、ニワ ト リ 、ゼブ ラ
フ ィ シュ、 シ ョ ウ ジ ョ ウ バ エ 、線虫、酵母、 シ ロ イ ズ ナ ズ ナ 等 ) のどれ かで相同遺 伝 子 の 機 能
が 解 析 さ れ 、 論 文 の形で出版さ れ て い る こ と が 多 い と言えま す 。その 論 文 を 読めば、 ク ロ ーニ
ン グ し た 遺 伝 子 の持つ 機 能 の 概 要 を知る こ と ができま す 。 デ ー タ ベ ー ス を 利 用 す れば、 こ の様
な 情 報も簡単に 収 集できま す 。 遺 伝 子 を BLAST 検 索 し 、 モ デ ル 生 物 の相同性 の高い 遺 伝 子 配 列
を探し 、そこ か ら 文 献 情 報 を探す こ と が 可 能です 。
今日 は 、 研 究 計 画 を 立 て る時や論 文 を 書く際 、 ク ロ ーニン グ さ れ た 遺 伝 子 に 関 連 す る 論 文 の
検 索 、 研 究や論 文 作 成で必 要 な 論 文 の 検 索 方法を 実 習 し ま す 。
文 献 の 検 索 に は 、 ( 1 ) NCBIの PuBMed 、 ( 2 ) 大 学 の 図 書 館 の オ ン ラ イ ン ジャー ナ ル 、
( 3 ) Scopus( Elsevier 社の有料検 索 シ ス テ ム ) が 利 用できま す 。 PuBMed の 使 い勝手が最近
非常に よくな っ た ので、ほとんどの こ と は PuBMed です み ま す 。従っ て 、 PuBMed の 使 い 方 を
中心に 演 習 し 、 大 学 の 図 書 館 の オ ン ラ イ ン ジャー ナ ル に つ い て少し 解 説 を 加えま す 。
文 献 検 索 を 使う目的に は 、下記の ように幾つ か の シ チュエ ー シ ョ ン に 分 か れ ま す 。 いずれも
PuBMed で可 能です 。
1. 特 定 の 論 文 をダウ ン ロ ー ド し た い 。
2. あ る 研 究者がどの ような 論 文 を 出版し て い る か知り た い
3. あ る 生 物現象に 関 す る 論 文 をもれ なく調べた い 。
4. 作 成中の 論 文 の考察に 必 要 な 論 文 を探し た い
5. 扱う遺 伝 子 に 関 連 す る 論 文 を調べた い 。
38
実 習
文 献 の 検 索
使 用 す る ウ ェ ブ サ イ ト : NCBI使 用 す る ア イ テ ム : PubMed 上の枠の下に あ る Advanced ボタ ン を 使う。
左の All Fields ボタ ン を ク リ ッ ク す る と 、 著者名、 出版年度 、 タ イ ト ル中の ワ ー ド 、
Abstract中の ワ ー ド 、 Journal (雑誌)名で検 索できる シ ス テ ム に な っ て い る 。 こ れ
ら をうまく使うと 必 要 な 文 献 をうまく検 索 す る こ と が 可 能であ る 。それぞれ に つ い て
授 業では 実 習 し ま す 。東北大 学 図 書 館 が購読契約し て い る雑誌、 あ る は Plos One の よ
うな on-line journalであ れば、 検 索 結 果 の ペ ー ジ か ら 論 文 の pdf ファイ ル を と りだし て 、
プ リ ン トやダウ ン ロ ー ド ができま す 。
1. 特 定 の 論 文 をダウ ン ロ ー ド し た い 。
例えば、山中先 生 が ノ ー ベ ル賞をもらうこ と に な っ た iPS 細胞の 論 文 を探し て み よ
う。
Author: Yamanaka ShinyaJournal: Cell
2. あ る 研 究者がどの ような 論 文 を 出版し て い る か知り た い
例えば、私と 研 究室の助教の横井 さんの共著論 文 を探し て み よう。
Author: Suzuki TohruAuthor: Yokoi Hayato
3. あ る 生 物現象に 関 す る 論 文 をもれ なく調べた い 。 論 文 の考察に 関 連 す る 論 文 を探し た い 。
例えば、魚類の iPS 細胞に 関 す る 論 文 が 出版さ れ て い る か ?
Title/Abstract: FishTitle/Abstract: iPS cell
成長ホ ル モ ン の 日周リ ズ ム に 関 す る 論 文 を知り た い
Title/Abstract: growth hormoneTitle/Abstract: circadian rhythm
4. 扱う遺 伝 子 に 関 連 す る 論 文 を調べた い 。
例えば、癌遺 伝 子 Brca2 に 関 す る 論 文 を調べた い 。
Title/Abstract: Brca2Title/Abstract: human or mouse or zebrafish
39
BLAST 検 索 結 果 か ら 、 検 索 し た 遺 伝 子 に 関 す る 文 献 情 報 を 収 集 す る こ ともできま す 。 リ ス ト
ア ッ プ さ れ てきた 遺 伝 子 の名称が ア ク テ ィ ブで、それ を ク リ ッ ク す る と 配 列 情 報 に 加えて 、
PUBMED の番号を添えた形で関 連 の 論 文もリ ス ト ア ッ プ さ れ て い ま す 。 PUBMED 番号を ク リ ッ
ク す る と 文 献 情 報 に入る こ と ができま す 。
test_sequence-1 で試し て み よう。
>test_sequence-1(zebrafish_charon)_peptide
MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFP
AFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETV
TVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLI
「電 子 ジャー ナ ル」へ の ア ク セ ス の 方法
東北大 学 ホ ー ム ペ ー ジ→東北大 学付属図 書 館→電 子 ジャー ナ ル リ ス ト ( 学 内者限定 )→
雑誌名の キ ー ワ ー ド 検 索 OR ア ル ファベ ッ ト順で検 索→ volume, page 入力・ 検 索
40
1. 講 義 : 論 文 の 構 成 、 文 献 デ ー タ ベ ー ス
2. 実 習 : 文 献 検 索 ( PubMed )
鈴 木不在( 分 子 生 物 学 会 に 出 席 ) の ため酒 井 先 生 が 代わり に下記の 内 容で授 業 を 行 い ま す 。
配 列 の ア ラ イ ン メ ン ト手法とBLAST検 索 の 原 理
・ 配 列 の ア ラ イ ン メ ン ト と は
・ 全域ア ラ イ ン メ ン ト と局所ア ラ イ ン メ ン ト
・ ア ミ ノ 酸置換 行 列
・動的計 画法に 基づく局所ア ラ イ ン メ ン ト の求め方
・BLASTはどの ように 検 索 を 行 っ て い る の か
(動的計 画法と の違い と 、それ に ともなう利 点 、問題 点 )
進 化 系 統 樹 とCLASTAL Wで用 い ら れ て い る近隣結 合法の 原 理
・種の 進 化 モ デ ル
・ 分 子時計仮説
・ ウ ル ト ラ メ ト リ ッ ク 木 と 加法木
・UPGMA法
・近隣結 合法
以上に つ い て 概 説 す る 。
同内 容 の詳細に つ い て は 3年前期「生 物 生産情 報処理 概 論」に て 講 義 す る 。
41
12 月 5 日 ( 第 10 回 )
講 義
講 義 :次世 代 シ ー ケ ン ス 解 析 の 原 理
次世 代 シ ー ケ ン ス 解 析 に つ い て
次世 代 シ ー ケ ン ス 解 析 は 、 こ の数年で実 用 化 さ れ た DNA シ ー ク エ ン ス 解 析技術で、
その 原 理 は従来の サ ン ガ ー法を 基礎と し た蛍光シ ー ク エ ン サ ー と は異な り 、 ガ ラ ス 基
盤( フ ロ ー セ ル ) に固着し た プ ラ イ マ ー を鋳型に し て ( ブ リ ッ ジ PCR ) 、 基板上で1
塩 基 の伸長反応ごと に 結 合 し た 塩 基 を蛍光検 出 し ま す ( Sequence by synthesis ) 。 ナ
ノ技術 に よ り 、 1mm 四方で万単位 の シ ー ク エ ン ス 解 析 が 可 能です 。最も汎用 さ れ て
い る Illumina 社の HiSeq2500 では 、 1 リ ー ド の リ ー ド長は 125bp と短いです が 、 シ ー
ケ ン サ ー を一度動か す と ( 1 ラ ン )で 80 億リ ー ド が 読 ま れ ま す 。 つ ま り 1 ラ ンで、
1000 Gbp (ギガ =10 億) の 配 列 が得ら れ る こ と に な り ま す 。 ヒ ト の ゲ ノ ム サ イ ズ は
約 3 Gbp な ので、その x300 が 読 ま れ る こ と に な り ま す 。現在では 、個人の ゲ ノ ム 解
読も可 能です 。
従来の蛍光シ ー ケ ン サ ーでは 、 1 ラ ンで 700bp の リ ー ド が 96 、 総 計約 67kb の 塩
基 配 列 が得ら れ る の に比べる と 、 オ ーダー が千万単位違い ま す 。 つ ま り次世 代 シ ー ケ
ン サ ー が 1 台 で 、 蛍 光 シ ー ケ ン サ ー の 千 万 台 分 の 解 析 能 力 が あ る わ け で す 。
HiSeq2500 では 、 ペ ア エ ン ド の シ ー ク エ ン ス 解 析 (約 300bp の断片を両側か ら 125bp読む) が 可 能です.シ ン グ ル エ ン ド の シ ー ケ ン ス 解 析 に比べ、 ペ ア 情 報 は 配 列 を コ ン
テ ィ グ に繋ぐ時に非常に有用 に な り ま す 。従っ て 、 de novo genome sequencing, de novo transcriptome 解 析 に は ペ ア エ ン ド の シ ー ク エ ン ス 解 析 が 必須であ る 。
世 代 シ ー ケ ン サ ー は 1 台が数億円す る ため、 研 究室で購入す る こ と は非現実的です
が 、依頼解 析 が随分廉価と な り 、 すでに農学 研 究でも汎用 さ れ て い ま す 。農学 が対象
と す る 生 物も、ほぼ全 て の種の ゲ ノ ム 解 読 が終わっ て い ま す 。今後は 系 統間の 塩 基 配
列 の違い を調べ、 遺 伝形質 と 配 列 と の 関 係 を 解 析 す る こ と が 重 要 に な る と思われ ま す 。
こ こで注意し な け ればな ら な い こ と は 、 1 レ ー ン あ た り 125bp の 配 列断片が約 7 億個得ら れ る と言うこ とで、その 解 析 は とうて い人の手に負える はずは なく、 コ ン
ピュー タ ー 解 析技術 が 必須です 。 ゲ ノ ム に し ても cDNA の 配 列 を 読むに し ても、最初
に 125bp の 配 列断片か ら 重 な り 合う部 分 を探し て 、 配 列 を コ ン テ ィ グ に つ なげる 必 要
が あ り ま す 。 配 列 解 析 の バ イ オ イ ン フ ォ マ テ ィ ッ ク ス は現在非常に 重 要 に な っ ており 、
まだ人材不足の状況です 。 と り あえずは 、 遺 伝 研 の パ イ プ ラ イ ン 等 を 使えば、普通に
必 要 な 解 析 は誰にでもできま す が 。
授 業では 、 ( 1 )次世 代 シ ー ケ ン サ ー の 塩 基 配 列 解 読 原 理 、 ( 2 )次世 代 シ ー ケ ン
ス 解 析 の 利 用 方法に つ い て 講 義 し ま す 。
次世 代 シ ー ケ ン サ ー の 解 析 原 理 等 は 、国立 遺 伝 学 研 究所 先端ゲ ノ ミ ク ス推進 セ ン
タ ー の ホ ー ム ペ ー ジ が参考に な る
http://genome.nig.ac.jp/glossary/glossary11.html
42
12 月 12 ( 第 11 )
講 義ポ ス ト ゲ ノ ム 研 究
様々な 生 物 の ゲ ノ ム 配 列 が 解 読 さ れ る ように な り 、 ゲ ノ ム 配 列 を 使 っ た新し い 研 究 が ス タ ー
ト し て い ま す 。 ゲ ノ ム 配 列 が 利 用できる と言う前提 のもと に始ま る 研 究 が ポ ス ト ゲ ノ ム 研 究で
す 。その 内 容 は 、 遺 伝 子 の 機 能 解 析 、 生 物 進 化 、 遺 伝 子疾患の 原因遺 伝 子 の探索 など多岐にわ
た り ま す 。 こ の 授 業では 、 3 つ の トピッ ク ス に つ い て紹介し ま す 。
ポ ス ト ゲ ノ ム 研 究 - 1
比較ゲ ノ ム 学 : 進 化 に伴うゲ ノ ム 構 造 の 変 化
進 化的に隔た っ た 多様な 生 物でゲ ノ ム 解 読 が 行われ た こ と に よ り 、種内 の パ ラ ロ グ の 検
索 、 ま た異な る 生 物間でオ ル ソ ロ グ を比較す る こ と 、 遺 伝 子 ファミ リ ー の メ ン バ ー を比較
す る こ と が 可 能 に な り ま し た 。 ま た染色体上の 遺 伝 子 の 配 列 を 系 統的に離れ た 生 物間で比
較す る こ と に よ り 、それ ら の共通祖先 生 物 の染色体構 造 を推定 す る こ と が 可 能 と な っ て い
ま す 。比較ゲ ノ ム は 、 こ の ように 生 物間でゲ ノ ム を比較し て 、 進 化 を 論じる 研 究 分野です 。
授 業では 、哺乳類と魚類の比較ゲ ノ ム を紹介し ま す 。
フ グ と ヒ ト は 、 進 化的観点 か ら 見 る と脊椎動物 系 統 樹 の両端に 位置し ま す 。脊椎動物 は 、
大 部 分 の魚類を含む条鰭類、それ と シ ー ラカン ス ・肺魚および四肢動物 を含む総鰭類の 2
つ の グ ル ー プ に 大別さ れ ま す 。条鰭類と 総鰭類は 4億5千年前に 分岐し ま し た 。 フ グ と ヒ
ト の ゲ ノ ム 構 造 を比較す る こ と に よ り 、 4億 5 千年前に 生きて い た 総鰭類と条鰭類の共通
祖先 (もちろん現存し な い ) の ゲ ノ ム 構 造 が 明 ら か と な り 、その後の ゲ ノ ム 構 造 の 変 化 が
解 明 さ れ ま し た 。 解 析 の 結 果 、脊椎動物 の ゲ ノ ム の 進 化 に つ い て 、次の ような 予想もさ れ
て い な か っ た 結 果 が得ら れ ま し た 。
( 1 ) 4億 5 千年前に 生きて い た 総鰭類と条鰭類の共通祖先 は 1 2組の染色体を
持っ て い た 。
( 2 ) 総鰭類では条鰭類と 分 か れ た直後に 、 ゲ ノ ム に 大 量 の レ ト ロ ウ ィ ル ス が挿
入さ れ 、 ゲ ノ ム サ イ ズ が 大きくな っ た 。その後染色体間の転移と融合 ( ミ キ シ ン
グ ) が頻繁に起こ っ た 。
( 3 ) 条鰭類では 総鰭類と 分 か れ た直後に 、 ゲ ノ ム の倍化 (脊椎動物 の誕生 か ら
数える と 3度目) が起こ っ た 。 重 複 し た 遺 伝 子 の 大 部 分 は片方 が ゲ ノ ム か ら脱落し
た が 、約 20 %の 遺 伝 子 は倍加 し た ま ま現在でも機 能 遺 伝 子 と し て働い て い る 。そ
の ため、 ゲ ノ ム上の 遺 伝 子数は条鰭類の 方 が 総鰭類よ りも 20 %程多 い 。 こ の よう
な 遺 伝 子数の 増 加 が 、魚類に形態や環境適応の 多様性 をもた ら し た のでは な い か と
考えら れ て い る 。 ま た条鰭類では染色体へ の レ ト ロ ウ ィ ル ス の挿入はわずかであ り 、
染色体の ミ キ シ ン グもわずかであ る 。
ま た 、無脊椎動物でも進 化的に 重 要 な 位置に あ る ホヤやナ メ ク ジ ウ オ の ゲ ノ ム 解 読 が 行
われ 、哺乳類でも多数の 生 物 の ゲ ノ ム が 解 読 さ れ て い ま す 。 生 物間でゲ ノ ム を比較す る こ
と に よ り 、臭覚受容 遺 伝 子 が無脊椎動物 か ら脊椎動物 の 進 化 の過程で遺 伝 子数を 増 加 し て
きた こ と が 、 明 ら か に な っ て い ま す 。 ま た胎盤の 進 化では 、 レ ト ロ ト ラ ン ス ポゾン由来の
43
遺 伝 子 が 重 要 な役割を 果 た し て い る と いう、意外な事実も示唆さ れ て い ま す 。 ま た ヒ ト と
チ ン パ ン ジ ーでは 、 塩 基 の置換率は た っ た 1.23%です が 、反復 配 列 の挿入が ヒ ト の 方 が か
な り 多 い こ と が 分 か り ま し た 。 こ の ように挿入配 列 は 、以前考えら れ て い た ような たんな
る ガ ラ ク タでは な い こ と が 分 か っ てきま し た 。
シ ン テ ニ ー
異な る脊椎動物 ( 例えば、 ヒ ト - マ ウ ス 、 ヒ ト - フ グ ) を過去に遡る と 、共通祖先 が存在し
ま す 。共通祖先 か ら 分岐し た あ と 、それぞれ の 系で転座と融合 が起こ っ て い る が 、小さ な ブ
ロ ッ ク単位で見 る と 遺 伝 子 の 並びが一致す る領域が あ り ま す 。染色体上で遺 伝 子 の 並びが一致
し て い る状態は 、 シ ン テニー と呼ばれ ま す 。 全 ゲ ノ ム が 解 読 さ れ る と ゲ ノ ム 全体を 生 物間で比
較す る こ と が 可 能 と な り 、 シ ン テニー の様子 が 明 ら か と な り ま す 。
ヒ ト と マ ウ ス を比べる と 、哺乳類同士の ため、 明瞭に シ ン テニー の保存状態が 見 て 取 れ ま す 。
一方 、魚類では四肢動物 と 分 か れ て か ら直後に 全 ゲ ノ ム の 重 複 が起こ っ て い る ため、魚類の
染色体は ヒ トやマ ウ ス の染色体に対し て 2 重 の シ ン テニー を 示 す 特 徴 が あ り ま す 。
12 月 19 ( 第 12 )
講 義
次世 代 シ ー ケ ン スで読 み 取 ら れ た リ ー ド の 情 報処理
ト ラ ン ス ク リ プ ト ー ム 解 析 ( RNA配 列 の 解 析 )
ゲ ノ ム シ ー ケ ン ス
HiSeq2000 だと一つ の リ ー ド長は 100bp 、 HiSeq2500 だと 125bp で、依頼解 析 に 出 す と 、 1サ ン プ ル あ た りギガ オ ーダー の リ ー ド が USB に コピー さ れ て送ら れ てきま す 。 日 本では 、次世
代 シ ー ケ ン ス 解 析 を広く普及す る ために 、 遺 伝 学 研 究所に よ り 、次世 代 シ ー ケ ン ス の リ ー ド を
情 報処理 す る プ ロ グ ラ ム (Pipeline) が 、 ウ ェ ブ上で無料で利 用できる ように 整備さ れ て い ま す 。
有料の プ ロ グ ラ ム の場合 、半年契約で 50 万円あ ま り と高額です 。 解 析 は 、 大型コ ンピュー
タ ー が 必 要 な ので、 ク ラ ウ ド シ ス テ ムで、 配 列 を Pipeline で送り 、 遺 伝 研 の コ ンピュー タ ーで
情 報処理 さ れ 、数日後に 解 析 デ ー タ が送ら れ てくる シ ス テ ム に な っ て い ま す 。
シ ー ケ ン ス の サ ン プ ル は 、 ゲ ノ ム DNA の場合 と組織・細胞に 発現す る mRNA(cDNA) に 大別さ
れ ま す 。 ま た 、 解 析 の対象生 物 は 、参照ゲ ノ ム の あ る 生 物 、新規に シ ー ク エ ン ス す る 生 物 に 分
か れ ま す 。参照ゲ ノ ム の あ る 生 物では 、 ゲ ノ ム 配 列 の デ ー タ ベ ー ス とcDNA の デ ー タ ベ ー ス が
準備さ れ て い る ので、 ゲ ノ ム DNA 、 RNA の リ ー ド ともに参照配 列 に直接マ ッ プ す る こ と ができ
ま す 。 ゲ ノ ム DNAであ れば、 サ ン プ ル間で、 SNP や配 列 の挿入・欠損を 見 いだす こ と が 可 能で
す ( ゲ ノ ム リ シ ー ケ ン ス ) 。 RNA であ れば、各cDNA に マ ッ プ さ れ る リ ー ド数をカウ ン ト と し
て 、 サ ン プ ル間で比較す る こ と に よ り 、組織に 発現す る 全 遺 伝 子 を同定 す る と ともに 、 サ ン プ
ル間で現量 を比較す る こ と が 可 能です ( ト ラ ン ス ク リ プ ト ー ム 解 析 ) 。
参照ゲ ノ ム の な い 生 物 の場合 、 リ ー ド を一度、 ア セ ン ブ ル す る 必 要 が あ り ま す 。 こ れも遺 伝
研 の Pipeline で実 行できま す 。 ゲ ノ ム の場合 、現在だと HiSeq2500 の リ ー ド を繋いだ
Contig に 、 PacBio の次世 代 シ ー ケ ン ス 解 析 の リ ー ド ( 約 10kb) を併用 す る こ とでか な り長い
Scaffold に までつ なぎ合わす こ と が 可 能です (de novo ゲ ノ ム シ ー ケ ン ス ) 。 RNA の場合 、 リ ー
44
ド を ア セ ン ブ ル し て得ら れ る Contig が コ ー ド す る 遺 伝 子 を BLASTX に よ り同定 し ま す が 、 こ の
操作も Pipeline の Maser が 全 てやっ てくれ ま す 。 さ ら に KEGG の 代 謝 パ ス ウ ェ ー へ の GO(gene ontology)ア ノ テ ー シ ョ ンも同時に 実 行 し てくれ ま す 。
授 業では 、 こ れ ら の技術 を 使 っ て 行われ た 研 究 成 果 に つ い て幾つ か紹介し ま す 。
実 習
— ゲ ノ ム 塩 基 配 列 を デ ー タ ベ ー ス か ら 取 り 出す —
Ensembl Genome Brower
Ensembl Genome Brower ( ゲ ノ ム デ ー タ の 統括サ イ ト ) は 、 Sanger研 究所・ EBI が管理 す る
ゲ ノ ム デ ー タ ベ ー スです 。最大 の 特 徴 は 、 必 要 な 遺 伝 子 、 あ る い は染色体領域の ゲ ノ ム 塩 基
配 列 を 取 り 出 す こ と ができる こ と に あ り ま す 。 cDNA を 特異的に 増幅す る PCR プ ラ イ マ ー の
設計 、 CRIPR-Cas9 を 使 っ た ゲ ノ ム編集 、 ノ ッ ク ア ウ ト マ ウ ス の相同組換えに 用 い る 配 列 、
GFP を 使 っ た レ ポ ー タ ー 遺 伝 子 作 製 用 の プ ロ モ ー タ ー 配 列 が 必 要 な場合 などで、 Ensembl を
使 っ て ゲ ノ ム 配 列 を 取 り 出 す こ と に な り ま す 。 実 習では 、 Ensembl の 説 明 と 実 際 の 配 列 の 取
り 出 し 方 を教えま す 。
ま た 、 ゲ ノ ム 配 列 、 全 遺 伝 子 の コ ー ド 配 列 、 全蛋白質 の ア ミ ノ 酸 配 列もダウ ン ロ ー ド す る こ
と が 可 能で、それ ら を 使 っ て自前でバ イ オ イ ン フ ォ マ テ ィ ッ ク ス 解 析 を 行うこ と ができま す 。
「使 用法- 1」
Ensemblを 使 っ て 、試し に マ ウ ス の sonic hedgehog ( shh ) の ゲ ノ ム 配 列 を 取 り 出 し て み
ま す 。
1.下記の ウ ェ ブ サ イ ト を開け る
http://www.ensembl.org/index.html (ensembl でキ ー ワ ー ド 検 索 )2.生 物種を指定 す る
マ ウ ス を選択
3.検 索項目か ら gene を選び、 遺 伝 子名 (shh) をボッ ク ス に入れ て 検 索
4.リ ス ト ア ッ プ さ れ てきた 複数の 遺 伝 子 か ら 、 shh を ク リ ッ ク ( ESMSUSG000000002633 )
す る
染色体上の 地 図 が表示 さ れ る
5.左側のツー ルボッ ク ス の中か ら Sequence を選択し て ク リ ッ ク
6.配 列 が表示 さ れ る ( エ ク ソ ン は赤字で肌色 の背景、 エ ク ソ ン間の 黒 字 の 部 分 は イ ン ト ロ ン 、
第一エ ク ソ ン よ り上流は プ ロ モ ー タ ー領域の一部であ る )
7.戻っ て 、 Location か らもゲ ノ ム 構 造 を 検 索 す る こ と ができる
8.左側に あ る Export dataで、範囲を選択し て 配 列 を 取 り 出 す こ と ができる (範囲を指定 し て 、
よ り長い プ ロ モ ー タ ー 配 列 を 取 りです こ と ができる )
「使 用法- 2」
45
ゲ ノ ム 配 列 、 全 遺 伝 子 の コ ー ド 配 列 、 全蛋白質 の ア ミ ノ 酸 配 列 をダウ ン ロ ー ド す る
Gene annotation --- Download genes, cDNAs, ncRNA, proteins (FASTA) か らダウ ン ロ ー ド 可 能
46
1 月 9 ( 第 13 回 )
次世 代 シ ー ケ ン ス を 使 っ た ゲ ノ ム シ ー ク エ ン ス に よ り 、 こ れ までの 連 鎖 解 析では同定困
難であ っ た疾患や形質 の 原因遺 伝 子 を 見 つ け 出 す こ と が 可 能 と な っ て い ま す 。最近の 報
告例 を 使 っ て 、紹介し ま す 。
Whole genome association study (WGAS)コ ン ト ロ ー ル群と 実験群(表現形質 : 例えば左利き)で、 全 ゲ ノ ム にわた っ て SNP の
出現頻度を比較す る 。表現型の責任遺 伝 子近傍の SNP では表現型集団で一致度が高くな
る ので、それ を 検 出 す る こ とで責任遺 伝 子 の ゲ ノ ム上の 位置を 特 定 す る 。
Exome 解 析
メ ン デ ル 遺 伝 す る 1 遺 伝 子 に よ る レ ア な 遺 伝 子疾患の場合 、 コ ー ド領域の 変異に よ り
ア ミ ノ 酸 の置換 が起こ っ て い る こ と が 多 い 。 こ の技術では 、 ゲ ノ ム の エ ク ソ ン の み 配 列
を 解 読 す る こ とで、患者に 特異的な 塩 基置換 、 InDelを 検 出 す る こ とで、 遺 伝 子疾患の
責任遺 伝 子 を 特 定 す る 。 総 エ ク ソ ン の 塩 基 配 列 は 、 ゲ ノ ム の 1 %程度な ので、 解 析 量 が
少なくて すむ。場合 に よ っ て は 、 5 名程度の患者を 解 析 す るだけで、 原 遺 伝 子 が 特 定 さ
れ る 例もあ る 。
Rad-Seq ゲ ノ ム を 特 定 の制限酵素で消化 し 、消化断片の末端を次世 代 シ ー ケ ン スで解 析 し 、
SNAP を 検 出 す る 。通常の NGS ゲ ノ ム 解 読では ラ ンダム に断片化 す る ので、 集団間で
リ ー ド を直接比較す る こ と は不可 能であ る の に対し 、 Rad-Seq の場合 に は 、制限酵素の
切り口がそろっ て い る ので、 ゲ ノ ム 全体にわた っ て リ ー ド を高速か つ間便に 系 統間です
る こ と が 可 能であ る 。農林水産での品種の 解 析 に有効だと思われ る 。
バ イ オ デ ー タ ベ ー ス の 利 用
遺 伝 子 の 機 能 を知り た い場合 に は 、 ポ ス ト ゲ ノ ム の モ デ ル 生 物 ( マ ウ ス 、ゼブ ラ フ ィ ッ シュ、
シ ロ イ ズ ナ ズ ナ 等 ) の 検 索 サ イ ト が 重宝し ま す 。 こ れ ら は 、 バ イ オ デ ー タ ベ ー ス と呼ばれ ま す 。
モ デ ル 生 物 の な かでも、 特 に マ ウ ス とゼブ ラ フ ィ ッ シュの デ ー タ ベ ー ス が充実 し ており 、 遺 伝
子 の 機 能だけでなく発現パ タ ー ン ( 遺 伝 子 が何時、どの組織で、どれだけ の 量 が 発現す る か ) 、
遺 伝 子 ノ ッ ク ア ウ トやノ ッ クダウ ン の表現型もデ ー タ ベ ー ス 化 さ れ ており 、 遺 伝 子名の キ ー
ワ ー ド 検 索でデ ー タ を入手す る こ と が 可 能です 。
ヒ ト の 遺 伝 子 機 能 と 遺 伝 子 疾 患 の デ ー タ ベ ー ス と し て NCBIに OMIM ( Online Menderian Inheritance in Man ) が公開さ れ て い ま す 。 遺 伝 子名でキ ー ワ ー ド 検 索 す る と 、 遺 伝 子 の 機 能 、
遺 伝 子疾患が存在す る場合 に は 、 配 列 変異と疾患の表現型を知る こ と が 可 能です 。
マ ウ ス の デ ー タ ベ ー ス ( MGI: mouse genome informatics ) の 特 徴 と し て 、 遺 伝 子ごと に ノ ッ
ク ア ウ ト マ ウ ス の表現型が デ ー タ ベ ー ス 化 さ れ ており 、表現型か ら 遺 伝 子 の 機 能 を調べる こ と
ができま す 。 マ ウ ス の デ ー タ ベ ー スでは 、 遺 伝 子 の正確な マ ッ プ ポ ジ シ ョ ン ( 連 鎖 地 図 、 ゲ ノ
ム 配 列上) 等も示 さ れ て い ま す 。
47
ゼブ ラ フ ィ ッ シュの デ ー タ ベ ー ス ( ZFIN: zebrafish Organism Data Base ) に は 、 in situ ハイ
ブ リダイゼー シ ョ ン に よ る 発現解 析 の デ ー タ が写真で掲載さ れ ており 、 遺 伝 子 発現に 関 す る組
織レ ベ ル の 情 報 を得る こ と ができる 特 徴 が あ り ま す 。脊椎動物中であ ればオ ル ソ ロ グ 遺 伝 子
(異な る 生 物 の同一遺 伝 子 ) の 発現パ タ ー ン は類似し て い る こ と が 多 い ので、 マ ウ ス 、 ウ シや
ニワ ト リ を 研 究対象に す る場合でも参考と な り ま す 。
論 文や単行 書 を 読んで機 能 が 分 か ら な い 遺 伝 子 ( タ ン パ ク 質 ) がでてきた時に は 、それ ら の
遺 伝 子 の 機 能 を 調 べ る 必 要 が あ り ま す 。 こ の よ う な と き に は NCBI の OMIM (Online Mendelian Inheritance in Man) と マ ウ ス ・ゼブ ラ フ ィ ッ シュの ウ ェ ブ サ イ ト を 使うと 情 報 を
得る こ と ができま す 。 授 業では 、 こ れ ら の サ イ ト の 使 い 方 と 特 徴 に つ い て 説 明 し ま す 。
OMIM の 使 い 方
ヒ トで分 か っ て い る 遺 伝 子 の 機 能 を詳細に記述し て い る 。 関 連 文 献もリ ス と さ れ て い る 。
る
1. NCBIを開け 、左上の All List (A-Z)か ら Online Menderian Inheritance in Man (OMIM) を選択
す る 。
2 . 枠内 に 遺 伝 子名を入力し て 検 索
練習 に growth hormone ( 成長ホ ル モ ン ) を 検 索 し て み よう
growth hormone 遺 伝 子および関 連 遺 伝 子 の 配 列 変異に よ っ て起こ る症候群の リ ス ト が表
記さ れ る 。 遺 伝 子 の 機 能 、 変異に伴う疾患、 タ ン パ ク 質 の 構 造 、 関 連 論 文 を調べる こ と
ができる 。
MGI, ZFIN の 使 い 方
ポ ス ト ゲ ノ ム 研 究 の モ デ ル 生 物 の ウ ェ ブ サ イ ト を 利 用 し て み よう。 こ れ までの 研 究 に よ っ て 明
ら か に さ れ て い る 遺 伝 子 の 機 能 が 検 索できる 。
1.マ ウ ス ( MGI )
mouse genome informatics : http://www.informatics.jax.org/ 1 . 先頭ペ ー ジ の QuickSearch の枠内 に 遺 伝 子名を入力す る
2 . 入力し た 遺 伝 子 の 情 報 、 遺 伝 子改変 マ ウ ス が リ ス ト さ れ る
試し に Pax6 (眼の 発 生 の上流に あ る転写因子 ) を入力し て み よう
Pax6と言うワ ー ド を含む遺 伝 子 リ ス ト が表示 さ れ る 。 Pax6 を選択す る
得ら れ る 情 報
Symbol/Name/ID : 遺 伝 子 の正式名称、略記
Synonyms :同義語(別名)
Genetic map : 遺 伝 子 の 連 鎖 地 図上の 位置
Sequence Map : 遺 伝 子 の 物 理 地 図上の 位置
Mammalian Homology :哺乳類の相同・類似遺 伝 子
Sequences : ゲ ノ ム 塩 基 配 列 ・ cDNA 塩 基 配 列 ・ ア ミ ノ 酸 配 列 情 報
Phenotypes; ノ ッ ク ア ウ ト マ ウ ス の表現型。 遺 伝 子 の 生 物 機 能 が 分 か る
48
Polymorphism: 系 統間で見 ら れ る 配 列 多型。 SNPs ( 1 塩 基 多型) 等
Gene Ontology (GO) : 遺 伝 子 の 機 能 、 構 造
Expression : 発現す る組織の リ ス ト
Protein Domains :転写産物 が持つ ド メ イ ン 構 造 の リ ス ト
References : 関 連 文 献
2.ゼブ ラ フ ィ ッ シュ( ZFIN)
The Zebrafish Model Organism Database : http://zfin.org/ 1 . Genes/Makers/Clones を開け る
2 . Name/Symbol に 遺 伝 子名を入力し て 検 索
試し に pax6 と入力し て 検 索 し て み よう。
魚類で単独に起こ っ た ゲ ノ ム 重 複 の ため pax6a と pax6b が あ る
Symbol-name では 遺 伝 子 の各種情 報 が表記さ れ る
Expression では 、 遺 伝 子 発現の デ ー タ が表記さ れ る
Phenotypeでは 、 ノ ッ クダウ ン と ノ ッ ク ア ウ ト の表現型が表記さ れ る
Locationでは 、染色体上の 位置が表記さ れ る
49
1 月 16 日 ( 第 14 回 )
ポ ス ト ゲ ノ ム 研 究 ( 3 )
— 機 能 ゲ ノ ム 学—
- ゲ ノ ム を比較し て 遺 伝 子 の 発現調節機 構 を探る - ポ ス ト ゲ ノ ム 研 究 の 重 要 な テ ー マ と し て 、 全 て の 遺 伝 子 の 機 能 を調べる こ と に 加えて 、 遺 伝
子 の転写調節に 重 要 な 配 列領域を 見 つ け る こ と が あ り ま す 。転写調節領域は 遺 伝 子 が何時、何
処で、どれだけ 発現さ れ る か と言う情 報 を コ ー ド し て い る こ と か ら 、 生 物 の形態や環境適応の
多様性 の背景に あ る ゲ ノ ム 情 報 は 、 タ ン パ ク 質 コ ー ド領域よ りもむしろ転写調節領域に存在す
る場合 が 多 いもの と 予想できま す 。
特 に胚発 生 など生 物 の 基 本的な 生命現象に 関 係 す る 遺 伝 子 ( 例えば sonic hedghogや Pax 遺 伝
子 ) の転写調節領域は 、 生 物間で強く保存さ れ る傾向に あ り ま す 。 ゲ ノ ム 情 報 を 利 用 す る こ と
に よ り 、 遺 伝 子 発現に 必須の領域を 検 索 し た り 、 生 物間で変異が起こ っ て い る領域を 見 つ けだ
し 、それ ら の 機 能や生 物 学的意味を 解 析 す る 研 究 分野は 、 機 能 ゲ ノ ム 学 と呼ばれ ま す 。 授 業で
は 、 ヒ ト と フ グ の非コ ー ド領域の比較か ら 、 遺 伝 子 の転写調節に 重 要 な領域( CNE; conserved non-coding elements ) を 見 つ けだし た 研 究事例 を紹介し ま す 。
実 習今日 は 、 こ れ までの 実 習 の 復 習 を 行 い ま す 。
lefty と言う名前の 遺 伝 子 を材料に し て 復 習 を し ま しょう:
lefty の 機 能 の 検 索
メ ン バ ー の同定
遺 伝 子 の 発現パ タ ー ン
ヒ ト とゼブ ラで分 子 系 統 樹 を 作 製
メ ン バ ー の 進 化的関 係 を推定 し よう
50
1 月 16 日 ( 第 14 回 )
転写調節領域の コ ン セ ン サ ス 結 合 配 列 の 予 測 -
講 義遺 伝 子 の 発現調節機 構
遺 伝 子 は 、 特 定 の細胞ま た時期に 必 要 量だけ 発現す る ように調節さ れ て い ま す 。 例えば、 ペ
プ シ ノ ー ゲ ン の 発現は胃に限定 さ れ ており 、筋肉や脳では決し て 発現し な い ように制御さ れ て
い ま す 。 発 生 に 関 係 す る 遺 伝 子 の な か に は 、魚類の孵化酵素の ように一生 のうち孵化時に一度
だけ 発現す る 遺 伝 子もあ り ま す 。 こ の ような 発現調節に 関 す る 情 報 は 、 ゲ ノ ム の コ ー ド領域で
は なく、その近辺に存在す る転写調節領域( エ ンハン サ ー領域) に コ ー ド さ れ て い ま す ( 5’上流に あ る場合 が 多 い が 、 3’下流に あ るものやイ ン ト ロ ン に あ る 遺 伝 子も存在す る ) 。 具体的に
は 、転写因子 が 結 合 す る コ ン セ ン サ ス 結 合 配 列 がその 情 報 と言うこ と に な り ま す 。転写因子 は 、
ゲ ノ ム の決ま っ た 配 列 を認識し て 結 合 し ま す 。その 配 列 が コ ン セ ン サ ス 結 合 配 列です 。 コ ン セ
ン サ ス 結 合 配 列 は 、 6-20 塩 基ほどの短い 配 列です 。転写調節領域に は 、 複数個の コ ン セ ン サ ス
配 列 が存在し 、 複数の転写因子 が 結 合 ・ 解離す る こ と に よ り 、 遺 伝 子 の転写を精密に調節し て
い ま す 。 講 義では転写調節の メカニズ ム に つ い て 解 説 し 、 実 習で転写調節領域の コ ン セ ン サ ス
配 列 を 検 索 し ま す 。
実 習マ ウ ス の sonic hedghog遺 伝 子 の 5’上流域の転写調節領域の 配 列 を ゲ ノ ム デ ベ ー ス か ら 取 り 出 し 、
コ ン セ ン サ ス 結 合 配 列 を 予 測 し て み ま す 。
コ ン セ ン サ ス 結 合 配 列 の 検 索 に は幾つ か の プ ロ グ ラ ム が あ り ま す が 、 実 習では TFSearch を
用 い ま す 。
http://www.cbrc.jp/research/db/TFSEARCHJ.html
問題 : マ ウ ス の sonic hedghog ( shh ) 遺 伝 子 の転写調節領域の 配 列 を ゲ ノ ム デ ー タ ベ ー ス か
ら 取 り 出 し 、 コ ン セ ン サ ス 結 合 配 列 を 予 測 す る 。
( 1 )最初にゼブ ラ フ ィ ッ シュの sonic hedghog遺 伝 子 の 5’上流域の転写調節領域の 配 列 を ゲ
ノ ム デ ベ ー ス か ら 取 り 出 し ま す 。
1 ) Emsembl (http://www.ensembl.org/index.html) を開け ま す
2 ) 対象性 物 か ら mouse を選択
3 ) 検 索項目か ら gene を選び、 shh で検 索
4 ) 検 索 結 果 の ペ ー ジ に あ る shh の ア ク セ ッ シ ョ ン を ク リ ッ ク
5) 左側ボタ ン の Sequence を ク リ ッ ク す る と 、 ゲ ノ ム 配 列 が表示 さ れ る
6) 第 1 エ ク ソ ン (赤字 ) か ら上流の 配 列 (転写調節領域) を メ モ帳に コピー す る ( -40 b あ た り に TATA box (TATA(A/T)A(A/T))が存在す る こ と が 分 か る 。その約 40b 上流に は
CAAT Box (GCCAATCT) が 配置す る )
( 2 )次に 、 MOTIF Search を開け る
51
( http://www.cbrc.jp/research/db/TFSEARCHJ.html )7) 上の枠に任意の名前を入力す る
8) 下の枠に 塩 基 配 列 を コピー 、 分類を脊椎動物 と し 、 Execを ク リ ッ ク
注意: コ ン セ ン サ ス 配 列 は 、ほとんどの場合 6-10b 程の短い 配 列であ り 、 加えて あ る程度の 配
列 の バ リ エ ー シ ョ ン を許容 し ま す 。その ため予想さ れ た 配 列 に は 、 実 際 に は転写因子 と相互作
用 し な い 配 列 が高い比率で含ま れ ま す 。 検 索 結 果 は 、目安程度に考えて下さ い 。 実 際 の コ ン セ
ン サ ス 配 列 を同定 す る ために は 、 分 子 生 物 学 の技術 ( ゲ ル シ フ ト ア ッ セ イ 、 ル シ フ ェ ラ ーゼを
レ ポ ー タ ー に し た プ ロ モ ー タ ー 解 析 等 ) を 使 っ て 実験的に 検証す る 必 要 が あ り ま す 。
52
1 月 10 日 ( 13 回 )
1. ゲ ノ ム 解 読で明 ら か に な っ た ヒ ト ゲ ノ ム の 特 徴 、医療へ の 利 用 に つ い ても簡単に紹
介し ま す
ポ ス ト ゲ ノ ム 研 究 - 2
次世 代 シ ー ケ ン ス を 使 っ た ゲ ノ ム シ ー ク エ ン ス に よ り 、 こ れ までの 連 鎖 解 析では同定困難で
あ っ た疾患や形質 の 原因遺 伝 子 を 見 つ け 出 す こ とも可 能 と な っ て い ま す 。 こ の技術 は 、 whole genome association study (WGAS) と呼ばれ ま す 。最近の 報告例 を 使 っ て 、 WGAS に つ い て紹介
し ま す 。
ま た 、 ゲ ノ ム の 多様性 ( 多型性 ) をもた ら す 配 列 変 化 に つ い ても説 明 し 、 配 列 の 多様性 が動
物 の形質 と リ ン ク し て い る 例 を紹介し ま す 。
実 習発現デ ー タ ベ ー ス を 使 っ た シ ミュレ ー シ ョ ン 実験( 1 )
- digital differential display - ゲ ノ ム 解 読 プ ロ ジ ェ ク ト の 進めら れ て い る 生 物では 、 EST (expressed sequence tags) の 塩 基
配 列 解 読 プ ロ ジ ェ ク トも並 行 し て 進めら れ て い ま す 。 EST プ ロ ジ ェ ク トでは 、組織あ る い は細
胞種ごと に 、 cDNA ラ イ ブ ラ リ ー か ら無作為に ク ロ ー ン を選んで配 列 ( 5’, 3’ 末端の ワ ン パ ス
シ ー ク エ ン ス ) を 解 析 し て い ま す 。 EST デ ー タ ベ ー スでは 、同定 さ れ た 遺 伝 子種とその数値
(何個検 出 さ れ た か ) が組織あ る い は細胞種ごと に 整 理 さ れ て い ま す 。従っ て デ ー タ に は 、各
組織に 発現し て い る 遺 伝 子種と 遺 伝 子ごと の相対的な 発現強度が反映さ れ て い る こ と に な り ま
す 。 こ れ ら の デ ー タ は 、 ト ラ ン ス ク リ プ ト ー ム (Transcriptome) と呼ばれ ま す 。 こ の デ ー タ を
利 用 す る こ と に よ り 、調べた い組織に 発現し て い る 遺 伝 子 の種類と 発現強度、組織間で発現強
度の異な る 遺 伝 子 を調べる こ と ができま す 。 コ ンピュー タ ーで遺 伝 子 発現を調べる操作 は 、
digital differential display と呼ばれ ま す 。 授 業では次の 例 題 を 使 っ て 、 digital differential displayの操作 を 実 習 し ま す 。
例 題 1.生 物 の各器官で発現す る 遺 伝 子 の種類と 発現強度を調べる
ウ シ の乳腺で発現す る 遺 伝 子種とその強度は ?
例 題 2.2 つ の細胞種で発現量 が異な る 遺 伝 子 を調べる
マ ウ ス の ES 細胞 (Embryonic stem cells) と胚細胞 (Blastocytes) で発現量 の異な る 遺 伝
子 は ?
例 題 3.あ る 生 物 の 2 つ の器官で発現量 が異な る 遺 伝 子 を調べる
マ ウ ス の小脳 (Cerebellum) と 大脳皮質 (Cortex) で発現量 の異な る 遺 伝 子 は ?
53
Digital differential display (DDD) の ペ ー ジ の開け 方
NCBI の Transcriptome 情 報 を 使う - Digital differential display1 . NCBIの 先頭ペ ー ジ に あ る All Resources か ら 、 Digital differential display (DDD) を選択
例 題 1.生 物 の各器官で発現す る 遺 伝 子 の種類と 発現強度を調べる
ウ シ の乳腺 (mammary gland) で発現す る 遺 伝 子種とその強度は ?
手順
1 . Species を Bos taurus に選択、 continue を ク リ ッ ク
2. 組織名( Mammary gland ) の ID番号を ク リ ッ ク 。 発現強度の強い 遺 伝 子 か ら順に表
記さ れ る 。 TMP は 、 100 万個の mRNA 当た り に 出現す る個数を 示 す 。
例 題 2.あ る 生 物 の 2 つ の器官・細胞で発現量 が異な る 遺 伝 子 を調べる
マ ウ ス の ES 細胞 (Embryonic stem cells) と胚細胞 (Blastocytes) で発現量 の異な る 遺 伝
子 は ?
1. Species を Mus musculus に選択、 continue を ク リ ッ ク
2 . まずA ( こ こでは Embryonic stem cells ) の ID番号 (15703, 15704, 15705) を
選択、上の枠内 に名前( ES cells ) と記入し 、 continue を押す
3. B の組織( こ こでは Blastocytes ) の ID(850, 875, 1021, 10026) を チ ェ ッ ク し 、
枠内 に名前( Blastocytes ) と記入し 、 continue を押す
4. A と B で発現強度が有意に異な る 遺 伝 子 が 、表示 さ れ る
1 月 17 日 ( 第 14 回 :最終回 )
講 義次世 代 シ ー ケ ン サ ー の応用 に つ い て 2 例紹介し ま す 。
1 . RANA-seq: Transcriptome 解 析 ( mRNA の 発現プ ロ ファイ ル の 解 析 、 サ ン プ ル間比
較)
2 . Rad –seq: ゲ ノ ム 全体をカバ ー す る簡便な SNP マ ーカー の 収 集
2 つ の 方法とも農学 分野の 研 究 に非常に有効です 。
RANA-seq:組織に 発現し て い る 遺 伝 子 をほぼ全 て 網羅的に同定 す る こ と ができま す 。 ま た各遺
伝 子 の 発現量 (組織にm RNA が何コピー 発現し て い る か )も数値化 さ れ ま す 。従っ て 、組織の
遺 伝 子 発現プ ロ ファイ ル が 明 ら か に な るだけでなく、 2 つ の サ ン プ ル ( 例えば、対照区と 実験
区)で発現し て い る 全 遺 伝 子 の 発現量 を比較す る こ と ができま す 。
Rad –seq:通常の ゲ ノ ム シ ー ケ ン スでは 、精製 し た ゲ ノ ム DNA を 物 理的に 300bp 程度に切断し て 、
断片の両側か ら 100bp を シ ー ケ ン ス し ま す 。 物 理的に切断す る ので断片は完全 に ラ ンダム な ゲ
ノ ム断片と な り ま す 。 Rad –seq では 、決ま っ た 4 塩 基 あ る い は 6 塩 基 の 配 列 を認識し て切断す
54
る制限酵素でゲ ノ ム を断片化 し 、断片の両側か ら 100bp を シ ー ケ ン ス し ま す 。異な る 系 統でも、
同じ部 位でゲ ノ ム が切断さ れ る ので、断片の 配 列 を 2 系 統で直接比較( ア ラ イ メ ン ト ) す る こ
と が 可 能 と な り ま す 。 100bp の中に存在す る SNP を同定でき、 ゲ ノ ム 全体にわた っ て SNP を ま
んべんなく収 集 す る こ と が 可 能です 。高密度な SNP マ ーカー が短時間で一挙に得ら れ る ため、
品種間の 遺 伝的差異や形質 の 連 鎖 解 析 に有効に 利 用できま す 。
55
ポ ス ト ゲ ノ ム 研 究 ( 1 )
— ゲ ノ ム に存在す る 全 て の 遺 伝 子 の 機 能 を調べる
全 ゲ ノ ム 塩 基 配 列 の 解 読 の あ と にくる最も重 要 な 研 究課題 と し て 、 ゲ ノ ム に存在す る 全
て の 遺 伝 子 の 機 能 解 明 が あげら れ ま す 。 遺 伝 子 の 機 能 を 解 析 す る ス ト ラ テ ジ ー は 、 大きく
分 け る と フ ォ ワ ー ド ジ ェ テ ィ ク ス ( Forward Genetics: 順遺 伝 学 ) と リ バ ー ス ジ ェネテ ィ ク
ス ( Reverse Genetics: 逆遺 伝 学 ) に 分 け る こ と ができま す 。 マ ウ ス 、ゼブ ラ フ ィ ッ シュ、
シ ョ ウ ジ ョ ウ バ エ 、線虫は こ れ ら ポ ス ト ゲ ノ ム 研 究 の モ デ ル 生 物 と し て 用 い ら れ て い ま す 。
リ バ ー ス ジ ェネテ ィ ク ス は 、 遺 伝 子 の 生体内での 機 能 を 解 明 す る ための最も直接的な 方
法で、 遺 伝 子 の 機 能 を破壊し 、 発 生や器官形成 、 代 謝 、 行動に表れ る表現型を 解 析 し 、表
現型か ら 遺 伝 子 の 機 能 を 解 明 し ま す 。 遺 伝 子 の 機 能破壊の 方法に は 、 遺 伝 子 ノ ッ クダウ ン
あ る い は 遺 伝 子 ノ ッ ク ア ウ ト の 2 つ が あ り ま す 。上の モ デ ル 生 物では いずれも、 遺 伝 子破
壊に よ る 全 遺 伝 子 の 機 能 解 明 プ ロ ジ ェ ク ト が 進めら れ て い ま す 。線虫と魚類は 、 ア ン チ セ
ン ス技術 を個体レ ベ ルで適応できる 点で、 遺 伝 子 機 能 解 析 に圧倒的に有利です 。 特 に線虫
は 、 RNAi法で簡単に 遺 伝 子 機 能 を破壊できる こ と か ら 、 ゴ ー ル ( 全 遺 伝 子 の 機 能 解 明 ) に
最も近い と言えま す 。線虫では 機 能破壊に よ り寿命が延びる と言うような興味深い 遺 伝 子
も見 つ か っ て い ま す 。
遺 伝 子 機 能 を 解 明 す るうえで、 ノ ッ ク ア ウ ト マ ウ ス は 重 要 な役割を 果 た し て い ま す が 、
ES 細胞で相同組み 換えに よ り 遺 伝 子破壊を 行 い 、その ES 細胞を胚移植し て ノ ッ ク ア ウ
ト個体を 作 製 す る に は 、 1 年あ ま り 必 要です 。最近、 TALEN 法、 CRISPR/Cas9 法と よばれ
る新し い ノ ッ ク ア ウ ト と ノ ッ ク イ ン技術 が開発 さ れ て い ま す 。卵生 の魚類やカエ ルでは 、
受精卵に コ ン ス ト ラ ク と の RNA を顕微注入す るだけで遺 伝 子 の ノ ッ ク ア ウ ト が 可 能です 。
ま た TALEN 法は 原 理的に は 、 遺 伝 子疾患の 原因であ る 変異遺 伝 子 の 配 列 を正常に治癒させ
る こ とも可 能です 。 iPS 技術 と組み 合わせる と 遺 伝 子治療へ の 発展が期待できま す 。 授 業
では簡単に TALEN 法と CRISPR/Cas9 法の 原 理 を 解 説 し ま す 。
以下工事中
以下、今年使 用 し な か っ た過去の資料
講 義
脊椎動物 の中ではゼブ ラ フ ィ ッ シュが 、 モ ル フ ォ リ ノ オ リ ゴ を 使 っ た ア ン チ セ ン ス技術
で遺 伝 子 機 能 を破壊できる 点で、 遺 伝 子 機 能 の 解 析 が 容易だと言えま す 。 具体的に は 、顕
微注入に よ り ア ン チ セ ン ス モ ル フ ォ リ ノ オ リ ゴ を受精卵に注入し 、 発 生で現れ る表現型
(体に表れ る異常) を調べる こ とで、 遺 伝 子 機 能 を 解 析 す る こ と が 可 能です 。 ただし こ の
方法で解 析できる の は 、受精後 2 日以内 に働く遺 伝 子 に限ら れ 、 成人病に 関 連 す る ような
遺 伝 子 等 の 機 能 は 解 析不能です 。ゼブ ラ フ ィ ッ シュの ウ ェ ブ サ イ ト ( ZFIN)では 、誰にで
も機 能破壊実験を 行うこ と ができる ように 、各遺 伝 子 の 機 能破壊に 必 要 な モ ル フ ォ リ ノ オ
リ ゴ の 塩 基 配 列 が掲載さ れ て い ま す 。
56
一 方 、 フ ォ ワ ー ド ジ ェ テ ィ ク ス で は 、 点 変 異 を 誘 導 す る 化 学 変 異 源 ( ENU. Ethyl nitrosourea ) に よ り突然変異体の ラ イ ブ ラ リ ー を まず作 製 し ま す 。様々な表現型の突然変
異体が得ら れ ま す が 、 こ の時点では突然変異体でどの 遺 伝 子 に 変異が起こ っ て い る の か
( 原因遺 伝 子 、責任遺 伝 子 ) は 明 ら かであ り ません。 フ ォ ワ ー ド ジ ェ テ ィ ク スでは 、 遺 伝
マ ーカー (主に マ イ ク ロ サ テ ラ イ ト ) と の 連 鎖 解 析 に よ り 、 原因遺 伝 子 を 連 鎖 地 図 に マ ッ
プ し 、組換え率が 0.1% 程度の マ ーカー が 見 つ か る まで連 鎖 解 析 を 進めま す 。 見 つ か っ た
近隣マ ーカー近くの 変異体ゲ
ノ ム を 解 読 し 、突然変異に よ り 塩 基置換 が起こ っ て い る場所を探し 出 し ま す 。 こ の 方法は 、
ポ ジ シ ョ ナ ル ク ロ ーニン グ と呼ばれ ま す 。
デ ー タ ベ ー ス を 使 っ た 遺 伝 子 機 能 の 検 索
ENTREZNCBIの 全 デ ー タ ベ ー ス ( 配 列 、 文 献 、 遺 伝 子 発現、 SNP 等々) に納めら れ て い る 情 報 か
ら 、 キ ー ワ ー ド 検 索 に よ り 関 連 情 報 を 網羅的に 検 索できる サ イ ト
ENTREZ の 利 用
NCBI (http://www.ncbi.nlm.nih.gov/) に は 、 キ ー ワ ー ドで全 て の デ ー タ ベ ー ス を一挙に 検 索 す る
ツ ー ル ENTREZ が あ り ま す 。 ENTREZ で キ ー ワ ー ド 検 索 す る と 、 配 列 情 報 、 文 献 情 報 、
OMIM 、 OMIA 、 立体構 造 等々の デ ー タ がもれ なく検 索 さ れ てきま す 。 ENTREZ を 利 用 す れば、
タ ン パ ク 質 の 構 造や遺 伝病等 に 関 す る 情 報 を一挙に入手す る こ と ができ、非常に便利 な 検 索 シ
ス テ ム と いえま す 。
ENTREZ の 使 い 方
・ 開け 方 : NCBIの 先頭ペ ー ジ All databeses で、枠内空欄の ま ま Search を ク リ ッ ク
・ 枠内 に 遺 伝 子名(略字 等 ) を入力し て 検 索
・ 調べた 遺 伝 子 に つ い て NCBIの デ ー タ ベ ー ス に あ る 情 報 が 全 て表示 さ れ る (数字 は デ ー タ
ベ ー ス に納めら れ て い る 情 報 の数を 示 す )
57
講 義
推薦図 書
ゲ ノ ム 関 連
「ゲ ノ ム」岡崎康司 / 坊農秀雅監訳・ メ デ ィカル ・ サ イ エ ン ス ・ イ ン タ ー ナ シ ョ ナ ル社
( 9,500 円)
「ゲ ノ ム 研 究 実験ハン ド ブ ッ ク」辻本豪三、田中利男・羊土社( 6,500 円)
「大規模ゲ ノ ム 解 析 と ポ ス ト シ ー ク エ ン ス時代 の 遺 伝 子 機 能 解 析」林崎良英監修・中山書
店( 3,600 円)
「比較ゲ ノ ム か ら 読 み 解く生命シ ス テ ム」藤山秋佐夫監修・秀潤社( 4,000 円)
バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 関 連
「バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 基礎講 義 - 一歩進んだ発想を み がくために」岡崎康司 / 坊農秀雅 監訳・ メ デ ィカル ・ サ イ エ ン ス ・ イ ン タ ー ナ シ ョ ナ ル社( 3,900 円)
「バ イ オ イ ン フ ォ マ テ ィ ッ ク ス がわか る」菅原秀明 ・羊土社( 4,200 円)
「ゲ ノ ム 情 報 は こう活かせ」岡崎康司 / 坊農秀雅・羊土社( 4,410 円)
「即活用 の ための バ イ オ イ ン フ ォ マ テ ィ ッ ク ス入門 」広川貴次 / 美宅成 樹著・中山書店
( 3,500 円)
「バ イ オ デ ー タ ベ ー ス と ウ ェ ブツー ル の手と り足と り活用法 」中村保一ら編集 ・羊土社
( 3,800 円)
「できる バ イ オ イ ン フ ォ マ テ ィ ッ ク ス」広川貴次 / 美宅成 樹著・中山書店( 3,500 円)
「 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 」 メ デ ィカル ・ サ イ エ ン ス ・ イ ン タ ー ナ シ ョ ナ ル 社
( 9,500 円)
「バ イ オ リ ソ ー ス&デ ー タ ベ ー ス活用 術」秀潤社( 4,600 円)
「バ イ オ イ ン フ ォ マ テ ィ ク ス事典」日 本 バ イ オ イ ン フ ォ マ テ ィ ク ス 学 会編集 ・共立 出版
( 14,000円)
ウ ェ ブ サ イ ト
研 究室 home page http://www.agri.tohoku.ac.jp/bioinfor/index-j.html =========================================================================
文 献 検 索 、 塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 ORF finder 、 Map viewer 等
NCBI http://www.ncbi.nlm.nih.gov/ (National Center for Biotechnology Information)
塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 分 子 系 統 樹 作 成 、 シ ー ク エ ン ス登録等
DDBJ http://www.ddbj.nig.ac.jp/Welcome-j.html (DNA Data Bank of Japan)
塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 タ ン パ ク 質 の 構 造 ( ド メ イ ン ・ モ チ ー フ 検 索 等 ) 解 析
EBI http://www.ebi.ac.uk/Information/ (European Bioinformatics Institute)
58
ゲ ノ ム 配 列 の デ ー タ ベ ー ス
Ensembl http://www.ensembl.org/index.html=======================================================================
分 子 系 統 樹 作 成
ClustalW http://clustalw.genome.jp/ =======================================================================
タ ン パ ク 質 ・ 遺 伝 子 の 機 能 検 索
オ ン ト ロ ジ ー
http://www.geneontology.org/ http://www.pir.uniprot.org/ ド メ イ ン ・ モ チ ー フ 検 索 http://www.ebi.ac.uk/Information/ シ グ ナ ル ペ プ チ ド の 予 測
http://www.cbs.dtu.dk/services/SignalP/ 3D 立体構 造 の 予 測 、 DNA の翻訳 http://ca.expasy.org/ノ ッ ク ア ウ ト マ ウ ス の表現型 http://www.informatics.jax.org/ =======================================================================
転写調節領域の モ チ ー フ 検 索
転写因子 の 結 合 部 位 予 測 http://www.cbrc.jp/research/db/TFSEARCHJ.html ======================================================================
代 謝 経 路
KEGG http://www.genome.jp/kegg/pathway.html =======================================================================
ゲ ノ ム 研 究 の モ デ ル 生 物
マ ウ ス
http://www.informatics.jax.org/ツメ ガ エ ル http://genome.jgi-psf.org/cgi-bin/runAlignment?db=frog4x1ミ ド リ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス
http://www.genoscope.cns.fr/externe/tetranew/ト ラ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス
http://fugu.biology.qmul.ac.uk/ト ラ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス
http://genome.jgi-psf.org/cgi-bin/runAlignment?db=fugu6&advanced=1ゼブ ラ フ ィ ッ シュ http://zfin.org/
http://www.ensembl.org/Danio_rerio/index.htmlメダカ http://shigen.lab.nig.ac.jp/medaka/
59
http://medakagb.lab.nig.ac.jp/Oryzias_latipes/index.htmlシ ョ ウ ジ ョ ウ バ エ
http://www.ncbi.nlm.nih.gov/BLAST/Genome/Insects.html http://genome.med.yale.edu/lab/index.htm線 虫
http://omicspace.riken.jp/Ce/rnai/jsp/index.jsp 酵 母
http://www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=4932 http://www.fhcrc.org/science/labs/kruglyak/Data/
=======================================================================
cDNA, EST 情 報
マ ウ ス cDNA http://fantom3.gsc.riken.jp/index.htmlア フ リカツメ ガ エ ル EST http://xenopus.nibb.ac.jp/ メダカ EST http://medaka.lab.nig.ac.jp/est_index.htmlカタユウ レ イボヤ EST http://ghost.zool.kyoto-u.ac.jp/indexr1.html
=========================================================================
microarray に 関 す る 情 報
ヒ ト繊維芽細胞 http://genome-www.stanford.edu/serum/data.htmlシ ョ ウ ジ ョ ウ バ エ http://genome.med.yale.edu/Lifecycle/
=========================================================================
その他
http://genes.mit.edu/GENSCAN.html http://www.tigr.org/software/microarray.shtml http://motif.genome.jp/ http://www.rcsb.org/pdb/
=============================================================
60