Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
2019 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 概 論 授 業 予 定
( 授 業 の 進 み 具 合 に よ っ て 変 更 の 可 能 性 が あ り ま す )
黒 字 は 、 講 義 に よ る 解 説 。 青 字 は ウ ェ ブ を 使 っ た 実 習 を 示 し ま す 。 黄 色 の 網 掛 け は 、 重 要 な
キ ー ワ ー ド
第 1 回 10 月 1 日 授 業 概 要 説 明
Bioinformatics と は ?
ゲ ノ ム - 遺 伝 子 -mRNA- タ ン パ ク 質 の 関 係 の 復 習 ( D V D )
さ ま ざ ま な デ ー タ ベ ー ス ・ ゲ ノ ム デ ー タ ベ ー ス に 触 れ て み る
第 2 回 10 月 8 日 配 列 デ ー タ ベ ー ス に つ い て の 解 説
配 列 デ ー タ ベ ー ス か ら の 塩 基 配 列 と ア ミ ノ 酸 配 列 の 取 り 出 し 方
配 列 エ ン ト リ ー の 見 方
次 世 代 シ ー ケ ン ス 解 析
次 世 代 シ ー ケ ン シ ン グ の 原 理
第 3 回 10 月 15日
ホ モ ロ ジ ー 検 索 ( BLAST 検 索 ) に つ い て の 解 説
BLAST 検 索 の 実 習 ( 1/2 ) ( BLASTP )結 果 の 見 方
ゲ ノ ム 解 読 - 1
「 ヒ ト 全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 階 層 的 シ ョ ッ ト ガ ン シ ー ケ ン ス
法 ) 」 に つ い て の 解 説
ヒ ト ゲ ノ ム プ ロ ジ ェ ク ト の 歴 史 ・ 戦 術
連 鎖 地 図 の 作 製
BAC ラ イ ブ ラ リ ー の 作 製 、 整 列 化
BAC ラ イ ブ ラ リ ー の シ ョ ッ ト ガ ン シ ー ケ ン ス
配 列 の ア セ ン ブ リ ー 、 コ ー ド 配 列 の 予 測 ( ア ノ テ ー シ ョ ン )
宿 題 ( 1 ) : 配 布
第 4 回 10 月 29日
ゲ ノ ム 解 読 - 2
Whole genome shotgun sequence 一 昔 前 の 方 法 : Plasmid vector と Fosmid vector 、 蛍 光 シ ー ケ ン
サ ー を 使 っ た 配 列 解 読
次 世 代 シ ー ケ ン ス 解 析 を 使 っ た 方 法
( 配 列 情 報 の な い 生 物 の de novo シ ー ケ ン ス )
次 世 代 シ ー ケ ン ス で 読 み 取 ら れ た リ ー ド の 情 報 処 理 ( 遺 伝 研 パ
イ プ ラ イ ン )
1
第 5 回 11 月 5 日 配 列 解 読 で 明 ら か に な っ た 各 種 生 物 の 遺 伝 子 レ パ ー ト リ ー
BLAST 検 索 の 実 習 ( 2 /2 ) ( BLASTN, BLASTX, TBLASTX )特 定 の 生 物 種 の 配 列 デ ー タ ベ ー ス を 使 っ た BLAST 検 索 ( NCBI, BLAST
の ペ ー ジ か ら )
第 6 回 11 月 12日
ゲ ノ ム ブ ラ ウ ザ Ensembl Genome Browser の 利 用
ゲ ノ ム 塩 基 配 列 を ゲ ノ ム デ ー タ ベ ー ス か ら 取 り 出 す
取 り 出 し た プ ロ モ ー タ ー 配 列 か ら 転 写 因 子 が 結 合 す る
Consensus 配 列 を 予 測 す る
タ ン パ ク 質 の 構 造 に つ い て の 解 説 ( シ グ ナ ル ペ プ チ ド 、 疎 水 ・ 親 水
性 プ ロ ッ ト 、 ド メ イ ン 構 造 )
塩 基 配 列 か ら ア ミ ノ 酸 配 列 へ の 変 換
ウ ェ ブ サ イ ト を 使 っ た タ ン パ ク 質 の 構 造 解 析 -1 分 子 量 と 等 電 点 の 予 測 ・ 疎 水 性 / 親 水 性 プ ロ ッ ト
シ グ ナ ル ペ プ チ ド の 予 測
宿 題 ( 2 ) : 配 布
第 7 回 11 月 19日
ウ ェ ブ サ イ ト を 使 っ た タ ン パ ク 質 の 構 造 解 析 -2 シ グ ナ ル ペ プ チ ド ・ 膜 貫 通 ド メ イ ン
糖 鎖 結 合 部 位 の 予 測
ド メ イ ン 構 造 の 予 測
デ ー タ ベ ー ス ( UniProt ) : 使 っ て タ ン パ ク 質 の 機 能 を 調 べ る
“ 宿 題 ( 1 ) : 提 出 ”
第 8 回 11 月 26日
ゲ ノ ム 編 集 ( 遺 伝 子 編 集 ) 技 術
CRISPR/Cas9 に よ る ゲ ノ ム 編 集 の 原 理 ( 動 画 を 使 っ た 説 明 )
ゲ ノ ム 編 集 の 農 学 、 医 療 へ の 応 用
プ ロ グ ラ ム を 使 っ て オ フ タ ー ゲ ッ ト の な い タ ー ゲ ッ ト 配 列 を 設
計 す る
In/Del に よ る ア ミ ノ 酸 配 列 の 変 化 を 解 析 す る
2
第 9 回 12 月 3 日 配 列 ア ラ イ メ ン ト に つ い て の 解 説
ペ ア ワ イ ズ ア ラ イ メ ン ト の 実 際
分 子 系 統 樹 に つ い て
多 重 配 列 ア ラ イ メ ン ト の 実 習 と 見 方 ( CLUSTALW )
分 子 系 統 樹 の 作 製
分 子 系 統 樹 か ら 分 か る こ と
ゲ ノ ム 構 造 の 変 化 と 生 物 進 化
全 ゲ ノ ム の 重 複 、 遺 伝 子 の 重 複 と 遺 伝 子 レ パ ー ト リ ー の 増 加
オ ル ソ ロ グ と パ ラ ロ グ の 発 生
宿 題 ( 3 ) 配 布
第 10回
12 月 10日
代 謝 経 路 デ ー タ ベ ー ス ( KEGG ) の 利 用 - 1
KEGG を 使 っ た 演 習
デ ー タ ベ ー ス を 使 っ て 、 insulin の パ ス ウ ェ ー 、 hedgehogの 細 胞 内 シ グ ナ ル 伝 達 、 dopamine の 合 成 経 路 、 合 成 部
位 、 作 用 機序
宿 題 ( 2 ) 提 出
第 11回
12 月 17日
代 謝 経 路 デ ー タ ベ ー ス ( KEGG ) の 利 用 - 2
KEGG を 使 っ た 演 習
薬剤の 構 造 、副作 用 等 に つ い て 情 報収集 す る
論文の 構 成 、総説 の 内容
研究計 画立案、 レポー ト ・ 論文作 成 に必要 な文献情 報収集
文献検 索 ( PubMed, 大学 図書館On line journals )
EndNote に つ い て (文献管理 ・ 論文作 成 用 ソ フ ト )
宿 題 (4) 配 布
第 12回
12 月 2 4日
酒井先生
Blast 検 索 、 ClustalW 、 分 子 系 統 樹 の ア ルゴリ ズ ム と 原 理
“ 宿 題 (3) 提 出 ”
3
第 13回
1 月 7 日 ポス ト ゲ ノ ム 研究 - 2 :比較ゲ ノ ム ( Comparative Genomics )
進 化 に伴う染色体構 造 の 変 化 ( 繰り返し 配 列 の 発 生 、 シ ン テ
ニー領域)
プ ロ グ ラ ム を 使 っ て シ ン テニー を 調 べ る
第 14回
1 月 14 日 次世代シーケンス解析-応用 1ト ラ ン ス ク リ プ ト ー ム 解 析 ( RNA-seq ) の 生 物 研究へ の 応 用
バ イ オ デ ー タ ベ ー ス の 利 用 ( 遺 伝 子 の 機 能 、 発現、 遺 伝 性疾患)
OMIM (Online Menderian Inheritance in Man)MGI (Mouse Genome Informatics)ZFIN (The Zebrafish Model Organism Database)
第 1 5
回
最終回
1 月 21 日 次世代シーケンス解析-応用2Exome 解 析 : エ ク ソ ン の み に絞っ て 配 列 を比較す る こ と に よ
る 、 遺 伝形質 の 原 因 遺 伝 子 の同定 ( 一 遺 伝 子 の 変異で メ ン デ ル
遺 伝 す る 遺 伝 子疾患に有効 )Genome Wide Association Study (GWAS) : SNP マーカー を
使 っ た 遺 伝形質 の責任遺 伝 子 の同定 ( 複数遺 伝 子 が 関与し 、 こ
れ ま で 解 析困難で あ っ た 遺 伝形質 にも有効 )ヒ ト GWAS デ ー タ ベ ー ス の 利 用
“ 宿 題 (4) 提 出 ”
授 業評価
4
10 月 1 日 ( 第 1 回 )
講 義
1 ) 授 業 の 予 定 と 進め方 (評価方 法 : 4 回 の 宿 題 で評価)
2 ) 遺 伝 子 の 構 造 に つ い て の 復 習 : パ ワ ーポイ ン ト の ファイ ル を参照
3) 遺 伝 子 、 転 写 、翻訳の 復 習 ( DVD を 使 っ て )
4) 「 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 」 と は ?
5) ゲ ノ ム デ ー タ ベ ー ス ( 動 物 、植物 、菌類、 バ ク テ リ ア ) を開け て み る
6) そのほか 、 代表的 な デ ー タ ベ ー ス を開け て み る
使 用 す る DVD : 講談社ブ ル ー バ ッ ク ス B1582 「 見 てわか る DNA の しくみ 」
今日 は 第 一 回目の 授 業 で す の で 、最初に今年の 授 業 予 定 を紹介し ま す 。 こ の 授 業 は 、 「 講
義 」 と 「 コ ンピュー タ ー を 使 っ た 実 習 」 で 進めま す 。 実 習 で は 、 ウ ェ ブ上で公開さ れ て い る
デ ー タ ベ ー スや配 列 解 析 プ ロ グ ラ ム を 使 い ま す 。
現在で は 、 多様な 生 物 の ゲ ノ ム 配 列 が 解 読 さ れ 、 配 列 は 一般にも利 用 できる ように 整備さ れ
て い ま す 。どの ような 生 物 で ゲ ノ ム 解 読 が行われ て い る の か 、今日 は 、 ウ ェ ブ サ イ ト ( NCBI, Ensembl ) を 使 っ て少し のぞい て み ま しょう。詳し い 使 い 方 は 、 こ れ か ら の 授 業 で教えま す 。
ま た 生 物 学 、 分 子 生 物 学 、 農 学 研究に 利 用 できる デ ー タ ベ ー ス にどの ようなもの が あ る かも、
概 要 を紹介し ま す 。
なおこ の テ キ ス ト で は 、その 日 の 授 業 で行う講 義 内容と コ ンピュー タ ー を 使 っ た 実 習 に つ い
て 、操作 方 法 を含めて簡単に 説 明 し て あ り ま す 。必要 に 応じて 、 コピー 、 プ リ ン ト ア ウ ト し て
下さ い 。 講 義 で 使うパ ワ ーポイ ン ト の 図 は 、 プ リ ン ト し たもの を資料と し て 配 布 し ま す (単行
書やウ ェ ブ を コピー し た ペ ー ジ が あ る ため、版権の問題 が 発 生 す る かもし れ な い の で 、 pdf は
配 布 し ません) 。毎回 、翌週の プ リ ン ト を 配 り ま す の で 、 こ の テ キ ス ト と 配 布資料を 使 っ て 、
予 習 ・ 復 習 し て下さ い 。
参考に な る本を こ の ファイ ル の最後に紹介し て あ り ま す 。おそらく農 学 部 の 図書館にほとん
どあ る と思い ま す 。
————————————————————————————————
実 習
2 つ の ウ ェ ブ サ イ ト を開い て 、どの ような 生 物 で ゲ ノ ム 情 報 が 利 用 できる か 調 べ て み よう
1. NCBI (National Center for Biotechnology): http://www.ncbi.nlm.nih.gov/Genome Data Viewer
2. Ensembl Genome Browser: http://asia.ensembl.org/index.html 3. GenomeNet, UniProt, CISPRdirect
5
6
10 月 8 日 ( 第 2 回 )
今日 の 授 業 内容
1. 実 習 : デ ー タ ベ ー ス か ら の ア ミ ノ 酸 配 列 、 塩 基 配 列 の 取 り 出 し 方
2. 実 習 : 配 列 エ ン ト リ ー に 示 さ れ て い る 情 報 に つ い て
3. 講 義 : 次 世 代 シ ー ケ ン サ ー の 原 理
実 習
塩 基 配 列 ・ ア ミ ノ 酸 配 列 の収集
配 列 デ ー タ ベ ー ス か ら必要 な タ ン パ ク 質 の ア ミ ノ 酸 配 列 、 遺 伝 子 の cDNA 塩 基 配 列 の 取 り 出 し
方 を 実 習 し ま す .
ア ミ ノ 酸 配 列 の 取 り 出 し 方
使 用 す る ウ ェ ブ サ イ ト : NCBI.先頭ペ ー ジ右側に あ る Popular Resources の中の 「 Protein 」 を 使 用 す る .あ る い は左上( All databases ) か ら選ぶこ とも可 能 .
キ ー ワ ー ド に よ る 検 索
例: cow, prion で キ ー ワ ー ド 検 索 し て み よう
cow, prion と 関 連 す る タ ン パ ク 質 が 多数リ ス ト さ れ る が 、先頭の 2 つ が目的 の
配 列
タ ン パ ク 質名( 青 字 ) を ク リ ッ ク す る と 配 列 エ ン ト リ ー が表示 さ れ る ( 見 方 は
配付資料を参照)
FASTA を ク リ ッ ク す る と 配 列 が FASTA format で表示 さ れ る
配 列 は 、別の ファイ ル に コピー できる .Graphics で は 、 タ ン パ ク の 構 造 が表示 さ れ る
Identical Proteins で は 、別の名前 が付け ら れ て い る同一 タ ン パ ク 質 が表示 さ
れ る
Related Sequences で は 、 関 連 す る タ ン パ ク 質 が表示 さ れ る
FASTA format 塩 基 配 列 と ア ミ ノ 酸 配 列 の ファイ ル フ ォ ー ム
「 > 」 で始ま る 1行が コ メ ン ト ( 遺 伝 子名や任意の番号やコ メ ン ト ) を記述す る た
めに 用意さ れ ており 、続く2行目か ら 塩 基 配 列 あ る い は ア ミ ノ 酸 配 列 を記述す る 。
最後に改行し て 「 // 」 を記載し 、 1 つ の 配 列 の記述が完了す る ( 記号「 // 」 は なく
てもよ い;普通 、付け な い ) .
ホ モ ロ ジ ー 検 索 、 多 重 ア ラ イ メ ン ト 、 分 子 系 統 樹 作 成 等 で 使うフ ォ ー ム .7
デ ー タ ベ ー ス をその ま ま コピー し たもの
>NP_001258555.1 major prion protein preproprotein [Bos taurus]MVKSHIGSWILVLFVAMWSDVGLCKKRPKPGGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGGWGQGGTHGQWNKPSKPKTNMKHVAGAAAAGAVVGGLGGYMLGSAMSRPLIHFGSDYEDRYYRENMHRYPNQVYYRPVDQYSNQNNFVHDCVNITVKEHTVTTTTKGENFTETDIKMMERVVEQMCITQYQRESQAYYQRGASVILFSSPPVILLISFLIFLIVG//1 行 目 は 、 必 要 に 応 じ た ネ ー ミ ン グ に す る こ と が 可 能 . 例 え ば 、
>cow_prion_protein .文字間の ス ペ ー ス は 、空にせず _ と す る 方 が よ い.空きス
ペ ー ス が あ る と 、 配 列 を認識し な い プ ロ グ ラ ム が あ る の で.
>cow_prion_proteinMVKSHIGSWILVLFVAMWSDVGLCKKRPKPGGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGGWGQGGTHGQWNKPSKPKTNMKHVAGAAAAGAVVGGLGGYMLGSAMSRPLIHFGSDYEDRYYRENMHRYPNQVYYRPVDQYSNQNNFVHDCVNITVKEHTVTTTTKGENFTETDIKMMERVVEQMCITQYQRESQAYYQRGASVILFSSPPVILLISFLIFLIVG
塩 基 配 列 の 取 り 出 し 方
使 用 す る ウ ェ ブ サ イ ト : NCBI. Popular Resources の中の 「 Nucleotide」 を 使 用 す る
1. キ ー ワ ー ド に よ る 検 索
例: cow, prion で キ ー ワ ー ド 検 索 し て み よう
cow, prion の 配 列だけ で なく、 関 連 遺 伝 子も多数検 索 さ れ てくる ため、必要 な
配 列 を 見 つ け る必要 が あ る .Bos taurus prion (PRNP), transcript variant 1, mRNA が
今回 、欲し い 配 列 で あ る .上の 遺 伝 子 質名を ク リ ッ ク す る と 配 列 エ ン ト リ ー が表示 さ れ る ( デ ー タ の 見 方
は 配付資料を参照の こ と )
FASTA を ク リ ッ ク す る と 配 列 が FASTA format で表示 さ れ る
配 列 は 、別の ファイ ル に コピー できる .Graphic で は 、 ゲ ノ ム上の 位置が表示 さ れ る
2.ア ク セ ッ シ ョ ン番号に よ る 検 索
accession number=DDBJ/EMBL/GenBank 国際 塩 基 配 列 デ ー タ ベ ー ス におい て 各登録
単 位 ( エ ン ト リ ー ; 各 遺 伝 子 ) に 発 行 さ れ る エ ン ト リ ー 識 別 子 ( entry identification, ID ) を指す 。
例: NM_001271626 ( entry identification, ID ) で 検 索 し て み よう
なお表示 結 果 の詳細 な 説 明 は 、 次 の サ イ ト で閲覧できま す 。
http://hinv.ddbj.nig.ac.jp/manual_cdna-j.html
配 列 エ ン ト リ ー に 示 さ れ て い る デ ー タ
遺 伝 子名、 生 物名、 学名、 遺 伝 子座、 遺 伝 子 ク ロ ーニン グ を行っ た 論文リ ス ト 、翻訳
8
開始・終了点 、 ド メ イ ン 構 造 、 塩 基 配 列 、 ア ミ ノ 酸 配 列 ( 配付資料で は 、 zebrafish, prion (NM_205586) を 使 っ て 説 明 し て あ り ま す )
講 義
次 世 代 シ ー ケ ン ス 解 析 の 原 理
次 世 代 シ ー ケ ン ス 解 析 の 利 用 に つ い て は 、 配付し た 日本分 子 生 物 学会に よ る資料も参考に
し て下さ い 。
次 世 代 シ ー ケ ン ス 解 析 に つ い て
次 世 代 シ ー ケ ン ス 解 析 は 、 こ の数年で 実 用 化 さ れ た DNA シ ー ク エ ン ス 解 析 技 術 で 、
その 原 理 は従来の サ ン ガ ー 法 に 基づい た 蛍 光 シ ー ク エ ン サ ー と は異な り 、 ガ ラ ス 基盤
( フ ロ ー セ ル ) に固着し た プ ラ イ マ ー を鋳型に し て ( ブ リ ッ ジ PCR ) 、 基板上で 1 塩
基 の伸長反応ごと に 結 合 し た 塩 基 を 蛍 光 検 出 し ま す ( Sequence by synthesis ) 。 ナ ノ
技 術 に よ り 、 1mm 四方 で万単位 の シ ー ク エ ン ス 解 析 が 可 能 で す 。最も汎用 さ れ て い
る Illumina 社の HiSeq2500 で は 、 1 リ ー ド の リ ー ド長は 125bp と短い で す が 、 シ ー ケ
ン サ ー を 一度動 か す と ( 1 ラ ン ) で 80 億リ ー ド が 読 ま れ ま す 。 つ ま り 1 ラ ン で 、
1000 Gbp (ギガ =10 億) の 配 列 が得ら れ る こ と に な り ま す 。 ヒ ト の ゲ ノ ム サ イ ズ は
約 3 Gbp な の で 、その x300 が 読 ま れ る こ と に な り ま す 。現在で は 、個人の ゲ ノ ム 解
読も可 能 で す 。
従来の 蛍 光 シ ー ケ ン サ ー で は 、 1 ラ ン で 700bp の リ ー ド が 96 、総計約 67kb の 塩
基 配 列 が得ら れ る の に比べ る と 、 オ ーダー が千万単位違い ま す 。 つ ま り 次 世 代 シ ー ケ
ン サ ー が 1 台 で 、 蛍 光 シ ー ケ ン サ ー の 千 万 台 分 の 解 析 能 力 が あ る わ け で す 。
HiSeq2500 で は 、 ペ ア エ ン ド の シ ー ク エ ン ス 解 析 (約 300bp の断片を両側か ら 125bp読む) が 可 能 で す.シ ン グ ル エ ン ド の シ ー ケ ン ス 解 析 に比べ 、 ペ ア 情 報 は 配 列 を コ ン
テ ィ グ に繋ぐ時に非常に有用 に な り ま す 。従っ て 、 de novo genome sequencing, de novo transcriptome 解 析 に は ペ ア エ ン ド の シ ー ク エ ン ス 解 析 が必須で す 。
世 代 シ ー ケ ン サ ー は 1 台が数億円す る ため、 研究室で購入す る こ と は非現実 的 で す
が 、依頼解 析 が随分廉価と な り 、 す で に 農 学 研究でも汎用 さ れ て い ま す 。 農 学 が対象
と す る 生 物も、ほぼ全 て の 種 の ゲ ノ ム 解 読 が終わっ て い ま す 。今後は 系 統間の 塩 基 配
列 の違い を 調 べ 、 遺 伝形質 と 配 列 と の 関 係 を 解 析 す る こ と が 重 要 に な る と思われ ま す 。
こ こ で注意し な け ればな ら な い こ と は 、 1 レ ー ン あ た り 125bp の 配 列断片が約 7 億個得ら れ る と言うこ と で 、その 解 析 は とうて い人の手に負える はずは なく、 コ ン
ピュー タ ー 解 析 技 術 が必須で す 。 ゲ ノ ム に し ても cDNA の 配 列 を 読むに し ても、最初
に 125bp の 配 列断片か ら 重 な り 合う部 分 を探し て 、 配 列 を コ ン テ ィ グ に つ なげる必要
が あ り ま す 。 配 列 解 析 の バ イ オ イ ン フ ォ マ テ ィ ッ ク ス は現在非常に 重 要 に な っ ており 、
まだ人材不足の状況で す 。 と り あえずは 、 遺 伝 研 の パ イ プ ラ イ ン 等 を 使えば、普通 に
必要 な 解 析 は誰に でもできま す 。
実験区毎に 複数サ ン プ ル (例えば、 3 サ ン プ ル ) を 解 析 し て 、 実験区間で 発現が 統
計 的 に有意に異な る 遺 伝 子 を探し た り す る に は 、 統 計 処 理 を行っ てくれ る プ ロ グ ラ ム
を 使 用 す る必要 が あ り ま す 。 こ の 関 連 の プ ロ グ ラ ム は R 言語で 動くもの た開発 さ れ て
9
おり 、無料でダウ ン ロ ー ド し て 解 析 を 進める こ と が 可 能 で す 。是非、勉強し て 利 用 し
て み て下さ い 。
授 業 で は 、 ( 1 ) 次 世 代 シ ー ケ ン サ ー の 塩 基 配 列 解 読 原 理 、 ( 2 ) 次 世 代 シ ー ケ ン
ス 解 析 の 利 用 方 法 に つ い て 講 義 し ま す 。
次 世 代 シ ー ケ ン サ ー の 解 析 原 理 等 は 、国立遺 伝 学 研究所 先端ゲ ノ ミ ク ス推進 セ ン
タ ー の ホ ー ム ペ ー ジ が参考に な る
http://genome.nig.ac.jp/glossary/glossary11.html
10
10 月 15 日 ( 第 3 回 )
今日 の 授 業 内容
1. 実 習 : ホ モ ロ ジ ー 検 索 BLASTP2. 実 習 : 検 索 結 果 の 見 方
3. 講 義 : ヒ ト ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 階 層 的 シ ョ ッ ト ガ ン 法 )
実 習
ホ モ ロ ジ ー 検 索 ( BLAST検 索 ) 1/3 遺 伝 子やゲ ノ ム を扱う研究で 使 用 す る 機会が最も多 い プ ロ グ ラ ム が 、 塩 基 配 列やア ミ ノ 酸
配 列 の ホ モ ロ ジ ー (相同性 ) 検 索 プ ロ グ ラ ム で す.実験で新し い 塩 基 配 列 が得ら れ た時に 、
遺 伝 子 を同定 す る ために 、最初に行う操作 が相同性 検 索 でだか ら で す.相同性 検 索 に よ り 、
ク ロ ーニン グ し た 遺 伝 子 が 、 デ ー タ ベ ー ス に登録さ れ て い るどの 遺 伝 子 と類似し て い る か を
知る こ と が できま す.
次 世 代 シ ー ク エ ン ス 解 析 で得ら れ た 配 列 を ゲ ノ ム 配 列 に マ ッ プ す る 際 にもBLAST 検 索 が 用
い ら れ ま す.ゲ ノ ム 解 読 さ れ て い る 生 物 で あ れば、 100bp の短い 配 列 ( 次 世 代 シ ー ケ ン サ ー
の 解 析 で は 、 1 リ ー ド は 100-120bp ) でもゲ ノ ム のどの 位置に あ る か を 調 べ る こ ともできま
す.ま た 次 世 代 シ ー ク エ ン ス 解 析 を 使 っ た ト ラ ン ス ク リ プ ト ー ム 解 析 (組織に 発現す る 遺 伝
子 を 網羅的 に 配 列 解 読 と 遺 伝 子 の 特 定 、 発現量 の 解 析 が できる ) で は 、 解 読 し た 配 列 は ホ モ
ロ ジ ー (相同性 ) 検 索 の BLASTX で 遺 伝 子 の 種類を判別さ れ ま す.
授 業 で は 、 BLAST (Basic Local Alignment Search Tool) プ ロ グ ラ ム を 用 い ま す 。今日 は 、
塩 基 配 列 ・ ア ミ ノ 酸 配 列 の デ ー タ ベ ー ス 、問い 合わせ配 列 と デ ー タ ベ ー ス の組合せ、 各組合
せで 使う BLAST プ ロ グ ラ ム に つ い て 説 明 し ま す.その あ と テ ス ト 配 列 ( ア ミ ノ 酸 配 列 ) を
使 っ て 、 実 際 に BLAST 検 索 を行い ま す.
ホ モ ロ ジ ー ( homology ) 検 索 、 と は ?
問い 合わせ配 列 (query sequence) に対し 、類似し た 配 列 を デ ー タ ベ ー ス か ら探し 出 す
操作.最も高頻度に 利 用 さ れ る バ イ オ イ ン フ ォ マ テ ィ ッ ク ス の手法 のひと つ.
検 索 内容:
例) 実験で ク ロ ーニン グ し た 遺 伝 子 の 種類を 特 定 す る 。それ が コ ー ド す る ア ミ ノ 酸 配
列 が デ ー タ ベ ー ス に登録さ れ て い る 遺 伝 子 、蛋白質 のどれ と 、 ま たどの程度類似す る
か ?
遺 伝 子 配 列 デ ー タ ベ ー ス : GenBank, DDBJ, EMBL
最 も広 く 利 用 さ れ ており 、 検 索 が高 速 な プ ロ グ ラ ム が BLAST(Basic Local Alignment Search Tool) で す ( 昔 、 FASTと言うプ ロ グ ラ ムも使われ て い た が 、現在はほとんど見
か け な い )
--------------------------------------------------------――――――――――――――――――-------------11
検 索 の組合せ 問い 合わせ配 列 対 デ ー タ ベ ー ス
----------------------------------------------------――――――――――――――――――-----------------BLASTN 塩 基 配 列 対 塩 基 配 列 デ ー タ ベ ー ス
BLASTP ア ミ ノ 酸 配 列 対 ア ミ ノ 酸 配 列 デ ー タ ベ ー ス
BLASTX 塩 基 配 列 ( ア ミ ノ 酸 配 列 に置換 ) 対 ア ミ ノ 酸 配 列 デ ー タ ベ ー ス
TBLASTN ア ミ ノ 酸 配 列 対 塩 基 配 列 デ ー タ ベ ー ス ( ア ミ ノ 酸
配 列 に置換 )
TBLASTX 塩 基 配 列 ( ア ミ ノ 酸 配 列 に置換 ) 対 塩 基 配 列 デ ー タ ベ ー ス 塩 基 配 列 ( ア ミ ノ
酸 配 列 に置換 )
----------------------------------------------------――――――――――――――――――-----------------
配 列 の 種間変異の激し い 遺 伝 子 の場合 ( サ イ トカイ ン 等 ) 、 塩 基 配 列 を BLASTN 検 索 し て
も相同遺 伝 子 が デ ー タ ベ ー ス か ら 検 出 さ れ な い こ と が あ る.その場合 でも、 BLASTX な ら
相同遺 伝 子 が ヒ ッ ト す る こ と が 多 い.その ため、 塩基配列を 問い 合わ せ 配列に相同検索す る 場合、通常、BLASTX が 用い ら れ る .
**************************************************************************
BLAST 検 索 の 原 理 1. ホ モ ロ ジ ー が観察さ れ る 配 列間の局所ア ラ イ メ ン ト に は 、 多くの場合 、ギャッ プ を含ま
な い保存領域が存在す る 。 BLAST で は 、その ような局所保存領域( ワ ー ド ) を まず高速
に 検 索 す る 。
2. 一致し た ワ ー ド か ら ア ラ イ メ ン ト を 配 列 に沿っ てそれぞれ の 方向に拡張し て いき、 ス コ
ア が 増 加 す る ま で続け る 。拡張処 理 は 、 ス コ ア の 増 加 が止ま り 、伸ばす 前 の ベ ス ト ス コ
ア よ り減少し始めた時に終了す る 。 こ の時点 で 、 HSP (high-scoring segment pair) と呼ば
れ る 、大きな 配 列領域が 見 つ か る 。 こ の時点 でギャッ プ が あ る とそこ か ら先に は伸長し
て い な い 。
3. 一般に 、 ア ミ ノ 酸 配 列 と 塩 基 配 列 に はギャッ プ が 生じて い る ため、 HSP の み で は類似領
域の 検 索 と し て不十分 で あ る 。そこ で 、 BLAST で は 、 HSP におい て対応 す る 位置に存在
す る 1 組の記号の ペ ア を適切に選び、類似度の高い領域は こ の ペ ア を含むもの と仮定 し
て 、 動 的 計 画 法 と呼ばれ る 方 法 を 用 い て類似領域を探索 す る 。 HSP か ら選んだペ ア を起
点 と し て探索範囲を狭く取 る こ と に よ っ て 、類似度の最適性 は保証さ れ な いもの の 、従
来の 動 的 計 画 法 と比較し て高速な類似領域の探索 を 実現し て い る 。
ス コ アア ミ ノ 酸 配 列 の場合 : BLOSUM62 ス コ ア ( ア ミ ノ 酸 の組合せに よ っ て値が決めら れ て い る )
塩 基 配 列 の場合 :値は同じ塩 基 、異な る 塩 基 の組合せで の み決めら れ て い る
————————————————————————————————
BLASTP 実 習
下記の 2 つ の ア ミ ノ 酸 配 列 は 、当研究室で行われ た 次 世 代 シ ー ケ ン サ ー を 使 っ た De novo transcriptome 解 析 で得ら れ た 塩 基 配 列 か ら推定 さ れ た ア ミ ノ 酸 配 列 で す 。 サ サ ウ シ ノ シ タ
と言う非モ デ ル 生 物 の 配 列 で 、 まだデ ー タ ベ ー ス に登録さ れ て い ません。
12
BLASTP の操作手順
1.NCBI 先頭ペ ー ジ右上 Popular Resources か ら BLASTを選択す る 。 Basic BLASTに上記 5 種類の BLAST プ ロ グ ラ ム の ア イ コ ン が あ る.
2. protein blastを ク リ ッ ク す る 。 ア ミ ノ 酸 配 列 (FASTA format) を枠内 に コピー す
る 。 Database (non-redundant protein sequences (nr) ), Algorithm (blastp; protein-protein BLAST) は 、 デ フ ォ ル ト の ま ま で よ い.
3.BLASTのボタ ン を押し て 、 検 索 を開始す る 。
>bamboo_sole_Pcna_protein
MFEARLVQGSILKKVLEALKDLITEACWDVSSSGISLQSMDSSHVSLVQLTLRHDGFDSYRCDRNLAMGVNLSSMSKILKCAGNE
DIITLRAEDNADTLALVFETINQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSQIGDAVMISCAKDGVKFS
ATGELGTGNVKLSQTSNVDKEEEAVTIEMNEPVQLIFALNYLNFFTKATPLSKTVTLSMSADIPLVVEYKIADMGHVKYYLAPKI
DEEAS
>bamboo_sole_Shh_protein
MLLWTRIALVALMCLSLVSSGMGCGPGRGYGRRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSERFKELTPNYNTDII
FKDEENTGADRLMTQRCKDKLNSLAISVMNQWPGVKLRVTEGWDEDGHHFEESLHYEGRAVDITTSDRDKSKYGTLSRLAVEAGF
DWVYYESKAHIHCSVKAENSVAAKSGGCFPGSSTVTLEDGTRKAVRDLQTGDKVLAADTRGQLIYTDFIMFIDQDSTTRRLFHVI
ETDSGQKITLTAAHLLFVGHNGTSAETQGGRMSAIFASQVRPGQRVFVFDTERSELQPVTVKRIYTQEHEGSFAPVTVQGTVVVD
QVLASCYAVIEDHELAHWALAPVRLAHWVSSLLFSSQHQSRAQSDGVHWYSKVLYQLGTWILDSHSIHPLGMSVYPS
>ACC_oxydase_orange_protein
MENFPVISLENINGAERAAILEKINEACEKWGFFELVNHGIEPEFMDTVERLTKAHYRKCMEQRFKELVASRALEGI
QTEVNDMDWESTFYVRHLPQSTINEVPDLDEEYRKVMKEFALKLEKLAEELLDLLCENLGIEKGYLKKVFHGANGPT
FGTKVSNYPPCPKPDLIKGLRAHTDAGGIILLFQDDKVSGLQLLKDGQWIDVPPLRHSIVVNLGDQIEVITNGKYKS
VEHRVVSQTDGEGRMSLASFYNPGSDAVIYPAPALLEKEAEKKQVYPKFVFEDYMKLYVPLKFQAKEPRFEAMKAVE
TNVNLGPIATA
( 1-aminocyclopropane-1-carboxylate oxidase 、エ チ レ ン 合 成酵素)
PSI-BLASTP, PHI-BLAST: 比較的最近開発 さ れ た プ ロ グ ラ ム で 、 系 統 的 に離れ た 生 物 あ
る い は 関 連 遺 伝 子 を 検 索 す る場合 に 利 用 す る . 種間の保存性 が低い 遺 伝 子 の場合 に
利 用価値が高い .
検 索 結 果 の 見 方 :
グ ラ フ ィ ッ ク の 次 に 示 さ れ て い る数値の 説 明
E-value : 検 索 結 果 は 、 Query 配 列 と相同性 を 示 す 配 列 の ア ラ イ メ ン ト 結 果 が表示
さ れ る 。 e-value は 、 検 索 に 使 っ た デ ー タ ベ ー ス の な か で 、 Query の局所配 列 と
検 索 配 列 の組合わせが 、偶然に み つ か る個数を 示 す 。相同性 が高いほど、値は 0に近づく(最も重 要 な デ ー タ :蛋白質 の場合 、 e-3あ た り が 関 連 遺 伝 子 か ? 、そう
で な い か を判断す る 基準と な る;実 際 に は ア ラ イ メ ン ト の デ ー タも参考に し て判
定 す る必要 が あ る ) 。 検 索 結 果 の数値のうち、最も重 要 で あ る.
13
Total score (bits): 検 索 さ れ てきた局所配 列 の長さ をビッ ト形式で 示 し たもの 。値
が大きいほど、相同性 を 示 す領域が長い 。
Query cover: 問合せ配 列 の 全長のうち、 検 索 配 列 と 配 列 が 一致し て い る領域の%
Identities: ア ミ ノ 酸 配 列 で 、相同領域の な か で 一致し て い る ア ミ ノ 酸 の比率
ア ラ イ メ ン ト の添えら れ て い る数字
Identities: ア ミ ノ 酸 配 列 で 、相同領域の な か で 一致し て い る ア ミ ノ 酸 の比率
Positives: ア ミ ノ 酸 配 列 の場合 に 、 一致し て い る ア ミ ノ 酸+化 学 的 に類似す る ア ミ
ノ 酸 の比率
Gaps: ア ラ イ メ ン ト さ れ た 配 列 で 、片一 方 で欠損し て い る 塩 基 あ る い は ア ミ ノ 酸 の
総計
最近で は 、 デ ー タ ベ ー ス に納めら れ て い る 生 物 種 、 配 列 情 報 が大きくな り すぎた ため、 BLASTの 検 索 結 果 の 画面が 、 解 析 し た 配 列 の由来生 物 の近縁種 の 配 列だけ で ペ ー ジ が埋め尽くさ れ 、
進 化 的 に離 れ た 生 物 で相 同 遺 伝 子 が存 在 す る の か を判 定 できません. その ため、 BLASTP, BLASTX で は 、 Databaseを Model organisms (landmark) に指定 し て 解 析 す る こ と で 、 進 化 的 な 解
析 を行うこ と が 可 能 に な っ て い ま す.Model organisms (landmark) に は 、 ヒ ト 、 マ ウ ス 、ゼブ ラ
フ ィ ッ シ ュ 、 シ ョ ウ ジ ョ ウ バ エ 、 線 虫 (Caenorhabditis elegans) 、 粘 菌 (Dictyostelium discoideurm) 、 シ ロ イヌナ ズ ナ,大豆 (Glycine max) 、酵母と 細菌の 一 部 の デ ー タ が含ま れ て
い ま す 。 Model organisms (landmark) を選択し て 、 BLASTP 検 索 を行っ て み ま しょう.
14
10 月 29 日 ( 第 4 回 )
講 義
ヒ ト ゲ ノ ム 解 読 プ ロ ジ ェ ク ト
国際 研究プ ロ ジ ェ ク ト に よ る ヒ ト ゲ ノ ム 計 画 (Human Genome Project) は 1990 年に着手
さ れ 、 13 年後の 2003 年に 解 読完了が宣言さ れ ま し た.ヒ ト ゲ ノ ム 計 画 は 、 階 層 的 シ ョ ッ ト
ガ ン 法 と呼ばれ る手法 で行われ ま し た 。 す なわち連 鎖 地 図 の 作 成 か ら BAC ク ロ ー ン の 整 列 化 の
過程を 経 た のち、染色体上に マ ッ プ さ れ た BAC ク ロ ー ン を シ ョ ッ ト ガ ン 法 で 解 読 し 、染色体レ
ベ ル に ま で 塩 基 配 列 を繋ぐと いう過程を 経 て 、 ゲ ノ ム 塩 基 配 列 の完全 解 読 に ま で到達 し ま し た 。
こ の プ ロ ジ ェ ク ト の間に 塩 基 配 列 の 解 析 能力( DNA シ ー ク エ ン サ ー ) は大幅に ア ッ プ し 、同
時に 塩 基 配 列 を つ なぎ合わせる コ ンピュー タ ー の 処 理 能力も著しく進歩し た こ と に よ り 、 連 鎖
地 図 作 製 を省略し て 、 全 ゲ ノ ム を いきな り シ ョ ッ ト ガ ン 法 で 読むこ と が 可 能 と な り ま し た.民
間企業 の シ エ ラ社は 、数年の あ いだに 全 ゲ ノ ム シ ョ ッ ト ガ ン 法 に よ り ヒ ト ゲ ノ ム を 解 読 す る こ
と に 成功し ま し た 。最終的 に は 、国際 研究プ ロ ジ ェ ク ト と シ エ ラ社の間で協議の 結 果 、 解 読 成
果 が同時に公表さ れ ま し た.ヒ ト ゲ ノ ム 計 画 の終了と 前後し て 、 全 ゲ ノ ム シ ョ ッ ト ガ ン 法 の登
場に よ り 、 多くの 生 物 で 全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト が始めら れ ま し た.
前記の旧バ ー ジ ョ ン の 全 ゲ ノ ム シ ョ ッ ト ガ ン 法 で は 、 ゲ ノ ム を断片化後に 、 全 て の断片を プ
ラ ス ミ ド ベ ク タ ー に ク ロ ーニン グ す る必要 が あ り ま し た が 、 次 世 代 シ ー ケ ン サ ー の登場に よ り 、
状況は激変 し ま し た 。 次 世 代 シ ー ケ ン サ ー で は 、 ゲ ノ ム の断片を ク ロ ー ン 化 す る必要 が なく、
か つ大量 の 配 列 情 報 を 一度に 解 読 できま す 。 全 ゲ ノ ム シ ョ ッ ト ガ ン を 使えば、数ヶ月 で ゲ ノ ム
解 読 が 可 能 と な り ま し た.その ため、既に数百種 の 動 物 で 全 ゲ ノ ム 配 列 の 解 読 が終了し 、現在
も新し い 生 物 の ゲ ノ ム 解 読 が 次々に完了し て い ま す.こ の 授 業 で は 、 次 世 代 シ ー ケ ン サ ー の 原
理 と 、それ を 使 っ た ゲ ノ ム 解 読 の 概 要 を紹介し ま す 。
全 ゲ ノ ム 塩 基 配 列 が 利 用 できる と いう条件のもと で 、 進めら れ る 遺 伝 子 機 能やゲ ノ ム 研究が
ポス ト ゲ ノ ム 研究で す.ゲ ノ ム 情 報 は 、 遺 伝 子 の 機 能 解 析 の有力なツー ル に な る こ と は言うま
でもあ り ませんが 、 生 物間で ゲ ノ ム 構 造 を比較す る こ と に よ り 、無脊椎動 物 か ら脊椎動 物 の 進
化 の過程で起こ っ た ゲ ノ ム 構 造 の 変 化 等も明 ら か に な り ま し た.ま た哺乳類の中でも単孔類
(カモ ノハシ ) 、有袋類( オポッ サ ム ) か ら有胎盤類に至る 進 化 の過程や、 ま た チ ン パ ン ジ ー
と ヒ ト で の知能 の差を ゲ ノ ム 構 造 の 進 化 の観点 か ら議論 さ れ て い ま す.
既に家畜や野菜や穀物植物 の ゲ ノ ムもほとんどの 種 で 解 読 さ れ て い ま す 。 農 学 でも新し い 研
究分野を開拓す る ために は 、 ゲ ノ ム 情 報 を有効に 利 用 できる がどうか が 、極めて 重 要 な素養と
な り ま す.
**********************************************************************ゲ ノ ム 解 読 プ ロ ジ ェ ク ト で 解 析 さ れ た ゲ ノ ム DNA 配 列 情 報 は 、 NCBI と Ensemblで 一般に
利 用 できる よう整備さ れ て い ま す 。 遺 伝 子 の染色体上の 位置や類似遺 伝 子 の 検 索 に は NCBIが便利 で す 。 ゲ ノ ム の 塩 基 配 列 を デ ー タ ベ ー ス か ら 取 り 出 す場合 に は 、 Ensemblが便利 で
す 。 NCBI と Ensemblの 使 い 方 は 、 授 業 で 実 習 し ま す 。 ゲ ノ ム 情 報 が い か に強力なツー ル
に な る か を体験し 、 実感し てもらおうと考えて い ま す 。
15
————————————————————————————————ゲ ノ ム 解 読 の 歴 史 的 な背景と 、 ゲ ノ ム 解 読 の 方 法 論 を 理 解 し てもらうために 、 授 業 で は 階 層
的 シ ョ ッ ト ガ ン 法 で 解 読 さ れ た ヒ ト ゲ ノ ム プ ロ ジ ェ ク ト を例に し て ゲ ノ ム 解 読 の道筋を 解 説 し
ま す.もはや、 歴 史 を振り返る ような感もあ り ま す が 、 ゲ ノ ム を 理 解 す る の にもよ い の で 解 説
し ま す 。
ヒ ト 全 ゲ ノ ム 塩 基 配 列 解 読 の行程
1 ) 連 鎖 地 図
2 ) BAC ラ イ ブ ラ リ ー 作 製
3 ) BAC ラ イ ブ ラ リ ー 整 列 化 ( 物 理 地 図 )
4) シ ョ ッ ト ガ ン シ ー ク エ ン ス
5) ア セ ン ブ ル
6) ア ノ テ ー シ ョ ン
講 義 : ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 全 ゲ ノ ム シ ョ ッ ト ガ ン シ ー ケ ン ス )
全 ゲ ノ ム シ ョ ッ ト ガ ン (whole genome shotgun sequence)1. プ ラ ス ミ ド ベ ク タ ー と 蛍 光 シ ー ケ ン サ ー を 使 っ た Whole genome shotgun
sequence( 次 世 代 シ ー ケ ン サ ー の 解 析 が開発 さ れ る 前 に 使われ て い た 方 法 )
2. 次 世 代 シ ー ケ ン サ ー を 使 っ た Whole genome shotgun sequence(現在、 一般に 使われ て い る )
16
11 月 5 日 ( 第5回 )
今日 の 授 業 内容
1. 実 習 : BLAST検 索 ( BLASTN, BLASTX, TBLASTX )
実 習ホ モ ロ ジ ー 検 索 ( BLAST検 索 ) 2/2
BLASTN 実 習
下記は 、私達 の 研究グ ル ー プ 20 年あ ま り 前 に ヒ ラ メ か ら ク ロ ーニン グ し た 遺 伝 子 の 塩 基
配 列 と ア ミ ノ 酸 配 列 で す.こ れ ら の 配 列 を 使 っ て 実 習 し ま す 。
>hirame_test_cDNA_sequence
ACCCACGCGTCCGATTTGGAACCTTGAACCACAAAACCAGACAACTTCTTGTGCAACTTTTCTCTTGTTT
TTTCAGTATTTGACTTCATTTATCTAGTCATCGATTCATCTTCAAGCAGAATCTCTCTGTGTCAAACTAT
GACTTCCTTCATCAGCCTCGTAATTTTTTCAAGCTGGATGACTCTGGCTTTTACTTTTCCTCATAACACG
TTTGAGAACATTTTGAAAAGGTCACGGGTCGATGTTGAATCCTCTGGCAGCGGACCAGATGAACCTATCC
AAGGAATAGTCCGGGTTGTTCAGCTGGACCATCGCGCTCTGGCCCAGTCAGGGTTCTTCAGAAAGGGAAT
GACCGCCAGGAGAGCCCCCTCACTCAGCTCAAGGTTGCCCTTCCCTGCCTTCTTGTCTCAGGGGCGTCCA
GGTCCGGCCCCGGCCTCCAAGGCTCCAGTGAGTCCCCTGCACCACCTGCAAACTAAAGGCCCCACTGAAA
TGGAACTGAAGAAGAGACAGGGGCTGCAGATGTGGCAAAGAGCCATGGATAAAGGAGGCAAGTTGTCCCT
GCCGGTCAACCTGACACAGGACACGAAACAGACGTGCACTGCGGTGCCTTTCACTCAGCGTGTGACCGCA
GACGGATGCGAGACAGTGACGGTGCACAACAAGCTGTGTTTCGGTCAGTGCAGCTCTCTGTTCGTGCCGT
CCGAAGGAGAGTTTGCCGGGTTGAGCACCGGGACAGGGGCCCTTCCCCGCCGGGCCCCCTGCTCACGCTG
CGCTCCATCCAAAGCCCACACCGTGACTGTGCCCCTGCGCTGTCGGGGAGAGGTCCGGGAAAAGCGAGTG
ATGGTGGTGGAGGAGTGCAAGTGTGAGACGGGCATCGAGGAGAGAAGTGCAGAGGCTGCGGCGTCCATGC
TGTACAAGCTGTTGTAACAAAAACACATGACGTGACTGCTGTGATTATTCACTGACAGTTGAAATAGAGG
AATGAGGAGACGTGAACTTTTCATTTTAATTGACACCTTTAATTCTCTCTAAGTTCCCTTTGTATAAGTA
ACTATGTGTGAATTTTATTTGTATATATGAGTCTGAATGTGATTTTCAGAGTAAAATAACTTGGTGGTGT
ATTCCACCTCTTGATTGTTGACAAAATGACCAGTATCCTCTTGGTCATGCAGTTTTCTGTTGCAACAAAT
GAAGCTGTCCATACTGGATGTGTGTAAATGTACAAAACCGTGTTTAGATCCATTAAACTGAAATATTGTG
ATGACTTTCATTAAAAATGTCCCATTTGTTCAAAAAAAAAAAAAAA
>hirame_test_protein_sequence
MTSFISLVIFSSWMTLAFTFPHNTFENILKRSRVDVESSGSGPDEPIQGIVRVVQLDHRALAQSGFFRKG
MTARRAPSLSSRLPFPAFLSQGRPGPAPASKAPVSPLHHLQTKGPTEMELKKRQGLQMWQRAMDKGGKLS
LPVNLTQDTKQTCTAVPFTQRVTADGCETVTVHNKLCFGQCSSLFVPSEGEFAGLSTGTGALPRRAPCSR
CAPSKAHTVTVPLRCRGEVREKRVMVVEECKCETGIEERSAEAAASMLYKLL
blastn を 使 っ て 、 > flounder_test_cDNA_sequence の コ ー ド す る 遺 伝 子 を同定 し て み よう
相同遺 伝 子 を 検 索 し て み よう
17
BLASTN の 検 索手順
1.NCBI 、 Popular Resources の中か ら BLASTを選択す る 。 Basic BLAST に上記
5 種類の BLAST プ ロ グ ラ ム の ア イ コ ン が あ る 。
2 .nucleotide blast を ク リ ッ ク す る 。
「 Database」 が 、 デ フ ォ ル ト で は nucleotide collection (nr/nt) で 、 通常こ
の ま ま で よ い 。 nucleotide collection の デ ー タ に は 、登録さ れ て い る 全 て
の cDNA の 配 列 が含ま れ て い る 。
注 意 : Program selection で somewhat similar sequences (blastn) を 選 択 す る 。
3 . 塩 基 配 列 (FASTA format) を枠内 に コピー す る 。
4 .BLAST のボタ ン を押し て 、 検 索 を開始す る 。
Blastn の 利 用例:
と り あえず調 べ た い 遺 伝 子 が 、既知のどの 遺 伝 子 に類似す る か ? を 調 べ る時等 に
使う。 ただし 、 生 物間で 変異の激し い 遺 伝 子 ( 実 習 で 使う charon が 一例) の場合
に は 、 Blastn で は相同遺 伝 子 が十分 に 検 索 さ れ て こ な い こ と が あ る の で 、 遺 伝 子
を 特 定 す る ために は 、 次 の Blastx を 使う方 が よ い 。
次 世 代 シ ー ケ ン ス 解 析 で得ら れ た断片( 100bp ) を ゲ ノ ム に マ ッ プ す る時は
Blastn を 用 い る 。
BLASTX 実 習
ヒ ト の ゲ ノ ム デ ー タ ベ ー ス に 対 し て 、 >
flounder_test_cDNA_sequence 配 列 を 問 合 せ 配 列 に し て 、blastx_blastn 検 索 を 行 い 、 得 ら れ る デ ー タ の 違 いを 理 解 し よ う .
BLASTの先頭ペ ー ジ で デ ー タ ベ ー ス を [human] に 設 定
blastnを 使 っ て 、 flounder_test_cDNA_sequence の相同遺 伝 子 を 検 索
Dababase の RefSeq RNA ( ヒ ト cDNA 配 列 の デ ー タ ベ ー ス ) を選択
Somewhat similar sequence (blastn)を選択
BLAST を開始
blastpを 使 っ て 、 flounder_test_protein_sequence で 検 索
Dababase の RefSeq protein ( ヒ ト の タ ン パ ク 質 配 列 デ ー タ ベ ー ス,デ フ ォ ル ト )18
を選択
BLASP を開始
blastXを 使 っ て 、 flounder_test_cDNA_sequence の相同遺 伝 子 を 検 索
Dababase の RefSeq protein ( ヒ ト の タ ン パ ク 質 配 列 デ ー タ ベ ー ス,デ フ ォ ル ト )を選択
blastx の 特 性 :
こ の プ ロ グ ラ ム で は 、 遺 伝 子 が コ ー ド す る ア ミ ノ 酸 配 列 と相同性 の高い蛋白質 を
探す 。問い 合わせ塩 基 配 列 は 、 一度 6 フ レ ー ム で翻訳さ れ 、翻訳さ れ た 配 列 が 6通 り の ア ミ ノ 酸 配 列 デ ー タ ベ ー ス に対し て 検 索 に か け ら れ て い る 。 --- タ ン パ ク
の 配 列 で BLASTP 検 索 し た時と同じ検 索 結 果 が得ら れ て い る
ア ミ ノ 酸置換 の激し い 遺 伝 子 の相同性 検 索 に非常に有効
進 化 的 に離れ た 生 物 か ら相同遺 伝 子 を探す場合 にも有効
次 世 代 シ ー ケ ン サ ー を 使 っ た de novo ト ラ ン ス ク リ プ ト ー ム 解 析 で得ら れ た 配
列 を同定 す る場合 、 BLASTX が 使 用 さ れ る
同じ遺 伝 子 の 配 列 zflounder_test_cDNA_sequence の に 、 blastx と blastnで 検 索 さ れ てくる 遺
伝 子 の数が違うこ と に注意!(その 理由を 理 解 し て下さ い )
TBLASTN 実 習
tblastx を 使 っ て 、 flounder_test_cDNA_sequence の相同性 検 索 を試し て み よう
Dababase の RefSeq RNA ( ヒ ト cDNA 配 列 の デ ー タ ベ ー ス ) を選択
配 列 を ペ ー ス ト し て 検 索
tblastx の 特 性 :
問い 合わせの 塩 基 配 列 、 デ ー タ ベ ー ス の 塩 基 配 列 とも3フ レ ー ム で翻訳さ れ 、 検
索 に か け ら れ て い る 。
Tblastx の 利 用例:
単離し た 遺 伝 子 が コ ー ド す る ア ミ ノ 酸 配 列 と相同性 の高い ア ミ ノ 酸 配 列 を コ ー ド
す る 塩 基 配 列 を探す 。 配 列 の 変異が激し い 遺 伝 子 種 の場合 に有効。
今日 の 授 業 内容
1. 実 習 : NCBI の ゲ ノ ム デ ー タ ベ ー ス で 生 物 種 を選択し て BLAST検 索
実 習NCBIの BLAST 検 索 シ ス テ ム で は 、 生 物 種 を選択し て BLAST 検 索 を行うこ と が できま す 。 授 業 で
19
は 、 生 物毎の デ ー タ ベ ー ス を 使 っ て 、3つ の 使 用 法 を 実 習 し ま す 。
— さ ま ざ ま な 生 物 の ゲ ノ ム デ ー タ ベ ー ス の 利 用—
BLAST の先頭ペ ー ジ で 、 BLAST Genomes の枠内 に 生 物 の 一般名(もちろん英語) あ る い は 学
名を入力し て 検 索 す る と 、 デ ー タ ベ ー ス に ゲ ノ ム 配 列 が納めら れ て い る 生 物 で あ れば、その 生
物 の 検 索 ペ ー ジ が表示 さ れ ま す 。 バ ク テ リ ア か ら植物 、哺乳類に至る ま で 多様な 生 物 の ゲ ノ ム
情 報 が 利 用 できま す 。 ヒ ト が持っ て い る 遺 伝 子 の相同遺 伝 子 を 進 化 的 に たどっ て 、どの 生 物 に
ま で存在し て い る か と言う疑問に つ い ても、 BLAST 検 索 に よ っ て 調 べ る こ と が できま す 。
練習 : ヒ ト の 増殖細 胞核抗原 ( PCNA: proliferating nuclear antigen ) の相同遺 伝 子 を イネゲ ノ ム
( Oryza sativa (japonica cultivar-group) ) 、 パ ン 酵 母 ( Baker’s yeast; Saccharomyces
cerevisiae ) 、大腸菌( Escherichia coli ) か ら探し て み よう。
マ ウ ス ビ タ ミ ン D 受 容 体 の 相 同 遺 伝 子 が 、 シ ョ ウ ジ ョ ウ バ エ ( Fruit fly; Drosophila
melanogaster ) 、 線 虫 ( nematode; Caenorhabditis elegans ) 、 イ ネ ( Oryza sativa (japonica cultivar-group) ) に存在す る かどうかも試し て み よう。
>human_pcna
MFEGRLVQGSILKKVLEALKDLINEACWDISSSGVNLQSMDSSHVSLVQLTLRSEGFDTYRCDRNLAMGVNLTSMSKILKCAGNE
DIITLRAEDNADTLALVFEAPNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSHIGDAVVISCAKDGVKFS
ASGELGNGNIKLSQTSNVDKEEEAVTIEMNEPVQLTFALRYLNFFTKATPLSSTVTLSMSADVPLVVEYKIADMGHLKYNLAPKI
EDEEGS
>mouse_vitamin_D_receptor
MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCV
DIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRP
TLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQI
VLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPG
VQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS
練習 : シ ロ イヌナ ズ ナ : efe; ethylene forming enzyme で 、どの範囲の 生 物 に 関 連 遺 伝 子 が存在
し て い る の か 検 索 し て み よう
> Arabidopsis_ethylene-forming_enzyme_proteinMESFPIINLEKLNGEERAITMEKIKDACENWGFFECVNHGISLELLDKVEKMTKEHYKKCMEERFKESIK
NRGLDSLRSEVNDVDWESTFYLKHLPVSNISDVPDLDDDYRTLMKDFAGKIEKLSEELLDLLCENLGLEK
GYLKKVFYGSKRPTFGTKVSNYPPCPNPDLVKGLRAHTDAGGIILLFQDDKVSGLQLLKDGEWVDVPPVK
HSIVVNLGDQLEVITNGKYKSVEHRVLSQTDGEGRMSIASFYNPGSDSVIFPAPELIGKEAEKEKKENYP
RFVFEDYMKLYSAVKFQAKEPRFEAMKAMETTVANNVGPLATA
— 特 定 の 生 物 の ゲ ノ ム に存在す る 遺 伝 子 ファミ リ ー の メ ン バ ー の 検 索—
20
多くの 遺 伝 子 に は 、 生 物 進 化 の過程で共通 の 遺 伝 子 か ら派生 し た姉妹遺 伝 子 が存在し ま す 。
ま たその メ ン バ ー は 進 化 に伴っ て 増える傾向に あ り ま す 。 マ ウ ス な ら マ ウ ス の ゲ ノ ム に対し て 、
あ る メ ン バ ー で ゲ ノ ム を 検 索 す る こ と に よ り 、 進 化 的 に 関 連 し て 部 分 的 に でも共通 の 配 列 を持
つ メ ン バ ー を 全 て 検 索 す る こ と が できま す 。今回 は 、 マ ウ ス ゲ ノ ム に存在す る核レ セ プ タ ー
ファミ リ ー の メ ン バ ー 、及びG タ ン パ ク共役受容体の メ ン バ ー を探す操作 を 実 習 し ま す 。
練習 : マ ウ ス に核受容体ファミ リ ー の メ ン バ ー が幾つ存在す る か ?
G-protein coupled receptor の メ ン バ ー で試し て み よう。
>human_MC4R
MVNSTHRGMHTSLHLWNRSSYRLHSNASESLGKGYSDGGCYEQLFVSPEVFVTLGVISLLENILVIVAIAK
NKNLHSPMYFFICSLAVADMLVSVSNGSETIVITLLNSTDTDAQSFTVNIDNVIDSVICSSLLASICSLLS
IAVDRYFTIFYALQYHNIMTVKRVGIIISCIWAACTVSGILFIIYSDSSAVIICLITMFFTMLALMASLYV
HMFLMARLHIKRIAVLPGTGAIRQGANMKGAITLTILIGVFVVCWAPFFLHLIFYISCPQNPYCVCFMSHF
NLYLILIMCNSIIDPLIYALRSQELRKTFKEIICCYPLGGLCDLSSRY
—次 世 代 シ ー ケ ン ス 解 析 で得ら れ た 配 列 の染色体へ の マ ッピン グ—
最も汎用 さ れ て い る 次 世 代 シ ー ケ ン サ ー で あ る Illumina2000 で は 、 一度の 解 析 で 100bの断片配 列 が約 4000 万個得ら れ ま す 。 ゲ ノ ム 解 析 が行われ て い る 生 物 で は 、 こ の ような
短い断片でも染色体に マ ッピン グ できま す 。 さ ら に参照ゲ ノ ム と 塩 基 配 列 の違い が あ る か
どうか 、 遺 伝 子疾患の 原 因 が 解 析 さ れ た個人の ゲ ノ ム に存在し て い る かどうかも判定 可 能
で す 。
練習 :
BLAST 検 索 で human を選択し て 、 次 の 配 列 を ゲ ノ ム に マ ッピン グ し て み よう。
>human_100bp_fragment
CCAAATTTAATTGATAATGGAAGCTGGCCAGCCACCACCATACAGAATTCTGTAGCTTTGAAGAATGCAGGTTTAATATCC
ACTTTGAAAAAGAAAACAA
21
11 月 12 日 ( 第6回 )
実 習
— ゲ ノ ム 塩 基 配 列 を デ ー タ ベ ー ス か ら 取 り 出す —
Ensembl Genome Brower
Ensembl Genome Brower ( ゲ ノ ム デ ー タ の 統括サ イ ト ) は 、 Sanger研究所・ EBI が管理 す る
ゲ ノ ム デ ー タ ベ ー ス で す 。最大の 特徴は 、必要 な 遺 伝 子 、 あ る い は染色体領域の ゲ ノ ム 塩 基
配 列 の デ ー タ を 取 り 出 す こ と が できる こ と に あ り ま す 。 cDNA を 特異的 に 増幅す る PCR プ ラ
イ マ ー の 設 計 、 CRIPR-Cas9 を 使 っ た ゲ ノ ム 編 集 、 ノ ッ ク ア ウ ト マ ウ ス の相同組換えに 用 い る
配 列 、 GFP を 使 っ た レポー タ ー 遺 伝 子 作 製 用 の プ ロ モ ー タ ー 配 列 が 必 要 な 場 合 などで 、
Ensembl を 使 っ て ゲ ノ ム 配 列 を 取 り 出 す こ と に な り ま す 。 実 習 で は 、 Ensembl の 説 明 と 実 際
の 配 列 の 取 り 出 し 方 を教えま す 。
ま た 、 ゲ ノ ム 配 列 、 全 遺 伝 子 の コ ー ド 配 列 、 、 全 遺 伝 子 の cDNA 塩 基 配 列 、 全蛋白質 の ア ミ
ノ 酸 配 列もダウ ン ロ ー ド す る こ と が 可 能 で 、それ ら を 使 っ て自前 で バ イ オ イ ン フ ォ マ テ ィ ッ
ク ス 解 析 を行うこ と が できま す 。
「 使 用 法 - 1 」
Ensemblを 使 っ て 、試し にゼブ ラ フ ィ ッ シュの sonic hedgehog a ( shha) の ゲ ノ ム 配 列 を 取
り 出 し て み ま す 。
1.下記の ウ ェ ブ サ イ ト を開け る
http://www.ensembl.org/index.html (ensembl で キ ー ワ ー ド 検 索 )2.生 物 種 を指定 す る
zebraish を選択
3.検 索項目か ら gene を選び、 遺 伝 子名 (shh) をボッ ク ス に入れ て 検 索
4.リ ス ト ア ッ プ さ れ てきた 複数の 遺 伝 子 か ら 、 shha( ENSDARG00000068567 ) を ク リ ッ ク す
る
染色体上の 地 図 が表示 さ れ る
5.左側のツー ルボッ ク ス の中か ら Sequence を選択し て ク リ ッ ク
6.配 列 が表示 さ れ る ( エ ク ソ ン は赤字 で肌色 の背景、 エ ク ソ ン間の 黒 字 の 部 分 は イ ン ト ロ ン 、
第 一 エ ク ソ ン よ り上流は プ ロ モ ー タ ー領域の 一 部 で あ る )
7.戻っ て 、 Location か らもゲ ノ ム 構 造 を 検 索 す る こ と が できる
8.左側に あ る Export data で 、範囲を選択し て 配 列 を 取 り 出 す こ と が できる (範囲を指定 し て 、
よ り長い プ ロ モ ー タ ー 配 列 を 取 り で す こ と が できる )
「 使 用 法 - 2 」
ゲ ノ ム 配 列 、 全 遺 伝 子 の コ ー ド 配 列 、 全蛋白質 の ア ミ ノ 酸 配 列 をダウ ン ロ ー ド す る
Gene annotation --- Download genes, cDNAs, ncRNA, proteins (FASTA) か らダウ ン ロ ー ド 可 能
22
転 写 調 節 領 域 の コ ン セ ン サ ス 結 合 配 列 の 予 測 -
講 義遺 伝 子 の 発現調節機 構
それぞれ の 遺 伝 子 の 発現は 、 特 定 の 細 胞 ま た時期に必要 量だけ 発現す る ように 調節さ れ て い
ま す 。例えば、 ペ プ シ ノ ー ゲ ン の 発現は胃に限定 さ れ ており 、筋肉や脳で は決し て 発現し な い
ように制御さ れ て い ま す 。 発 生 に 関 係 す る 遺 伝 子 の な か に は 、魚類の孵化酵素の ように 一 生 の
うち孵化時に 一度だけ 発現す る 遺 伝 子もあ り ま す 。 こ の ような 発現調節に 関 す る 情 報 は 、 ゲ ノ
ム の コ ー ド領域で は なく、その近辺に存在す る 転 写 調節領域( エ ンハン サ ー領域) に コ ー ド さ
れ て い ま す ( 5’上流に あ る場合 が 多 い が 、 3’下流に あ るものやイ ン ト ロ ン に あ る 遺 伝 子も存在
す る ) 。 具体的 に は 、 転 写 因 子 が 結 合 す る コ ン セ ン サ ス 結 合 配 列 がその 情 報 と言うこ と に な り
ま す 。それぞれ の 転 写 因 子 は 、 ゲ ノ ム の決ま っ た 配 列 を認識し て 結 合 し ま す 。その 配 列 が コ ン
セ ン サ ス 結 合 配 列 で す 。 コ ン セ ン サ ス 結 合 配 列 は 、 6-20 塩 基ほどの短い 配 列 で す 。 転 写 調節領
域に は 、 複数個の コ ン セ ン サ ス 配 列 が存在し 、 複数の 転 写 因 子 が 結 合 ・ 解離す る こ と に よ り 、
遺 伝 子 の 転 写 を精密に 調節し て い ま す 。 講 義 で は 転 写 調節の メカニズ ム に つ い て 解 説 し 、 実 習
で 転 写 調節領域の コ ン セ ン サ ス 配 列 を 検 索 し ま す 。
実 習ゼブ ラ フ ィ ッ シュの sonic hedghog遺 伝 子 の 5’上流域の 転 写 調節領域の 配 列 ( 2000 bp ) を ゲ ノ
ム デ ベ ー ス か ら 取 り 出 し 、 コ ン セ ン サ ス 結 合 配 列 を 予 測 し て み ま す 。
コ ン セ ン サ ス 結 合 配 列 の 検 索 に は幾つ か の プ ロ グ ラ ム が あ り ま す が 、 実 習 で は LASAGNA-Search 2.0を 用 い ま す 。
http://biogrid-lasagna.engr.uconn.edu/lasagna_search/
問題 :ゼブ ラ フ ィ ッ シュの sonic hedghog ( shh ) 遺 伝 子 の 転 写 調節領域の 配 列 を ゲ ノ ム デ ー
タ ベ ー ス か ら 取 り 出 し 、 コ ン セ ン サ ス 結 合 配 列 を 予 測 す る 。
( 1 )最初にゼブ ラ フ ィ ッ シュの sonic hedghog遺 伝 子 の 5’上流域の 転 写 調節領域の 配 列 を ゲ
ノ ム デ ベ ー ス か ら 取 り 出 し ま す 。
1 ) Emsembl (http://www.ensembl.org/index.html) を開け ま す
2 ) 対象性 物 か ら zebrafish を選択
3) 検 索項目か ら gene を選び、 shh で 検 索
4) 検 索 結 果 の ペ ー ジ に あ る shh の ア ク セ ッ シ ョ ン を ク リ ッ ク
5) 左側ボタ ン の Sequence を ク リ ッ ク す る と 、 ゲ ノ ム 配 列 が表示 さ れ る
6 ) Download sequence を ク リ ッ ク し 、 5’-franking sequence を 2000 に 指 定 し 、
Preview を ク リ ッ ク
7) 全 配 列 ( 転 写 調節領域) を ワ ー ド に コピー し 、上流 2000 bp をそこ か ら コピー す る
( 2 ) 次 に 、 LASAGNA-Search 2.0 を開け る
23
( http://biogrid-lasagna.engr.uconn.edu/lasagna_search/ l )8) プ ロ モ ー タ ー 配 列 に コ ン セ ン ス 配 列 が存在す る か を 調 べ た い 転 写 因 子 を選択す る 。
Matrix-Derived Models か ら 、 Use TRANSFAC matrices を選択す る と 、 転 写 因 子 の リ ス ト が
表示 さ れ る の で 、 調 べ た い 転 写 因 子 を選択( 転 写 因 子 にカー ソ ル を持っ て行くと 、 転 写
因 子 の コ ン セ ン サ ス 配 列 を 見 る こ と が 可 能 ) 。今回 は All を選択
9 ) Promoter sequences in FASTA を染タ ッ ク紙、枠に 塩 基 配 列 を コピー 、 検 索
注意: コ ン セ ン サ ス 配 列 は 、ほとんどの場合 6-10b 程の短い 配 列 で あ り 、 加えて あ る程度の 配
列 の バ リ エ ー シ ョ ン を許容し ま す 。その ため予想さ れ た 配 列 に は 、 実 際 に は 転 写 因 子 と相互作
用 し な い 配 列 が高い確率で含ま れ ま す 。 検 索 結 果 は 、目安程度に考えて下さ い 。 実 際 の コ ン セ
ン サ ス 配 列 を同定 す る ために は 、 分 子 生 物 学 の 技 術 ( ゲ ル シ フ ト ア ッ セ イ 、 ル シ フ ェ ラ ーゼを
レポー タ ー に し た プ ロ モ ー タ ー 解 析 等 ) を 使 っ て 実験的 に 検証す る必要 が あ り ま す 。
講 義
タ ン パ ク 質 の 構 造 に つ い て の 解 説各 種 プ ロ グ ラ ム を 使うこ と に よ り 、 タ ン パ ク 質 の 構 造 的 特徴を 予 測 す る こ と が できま す 。今日
の 授 業 で は 、 シ グ ナ ル ペ プ チ ド 、 ド メ イ ン 構 造 に つ い て 解 説 し た あ と 、 テ ス ト 配 列 を 使 っ て 実
際 に こ れ ら 構 造 の 検 索 ( 分 子 量 、 等 電 点 、 シ グ ナ ル ペ プ チ ド 、 疎 水 性 ・ 親 水 性領域、 ド メ イ ン
構 造 ) を行い ま す 。
代表的 な ド メ イ ン 構 造 ( モ チ ー フ ) 検 索 サ イ ト に は 、 イギリ ス の サ ン ガ ー 研究所が公開し て
い る Pfam が あ り ま す 。
シ グ ナ ル ペ プ チ ド
分泌性 の蛋白質 の N 末端に存在す る 、 15-30 残基 の 疎 水 性 ア ミ ノ 酸 か ら 構 成 さ れ た シ グ ナ ル 配
列 。 分泌前 に 、 シ グ ナ ル ペ プ チダーゼに よ っ て切断さ れ る 。
タ ン パ ク 質 の ド メ イ ン ( モ チ ー フ ) 構 造
ド メ イ ン 構 造 ( = モ チ ー フ ) : タ ン パ ク 質 の ア ミ ノ 酸 配 列 の な か で 、 特有な 性 質 を持っ た領域。
分 子 の 構 造上あ る い は 機 能上一 つ の ま と ま り を持つ領域。
ド メ イ ン 構 造 の例
細 胞 膜 レ セ プ タ ー : リ ガ ン ド 結 合 ド メ イ ン 、 細 胞 膜 貫 通 ド メ イ ン 、 チ ロ シ ン キ ナ ーゼ
ド メ イ ン 、 リ ン 酸 化 ド メ イ ン
核レ セ プ タ ー : リ ガ ン ド 結 合 ド メ イ ン 、 DNA 結 合 ド メ イ ン
実 習
塩 基 配 列 の ア ミ ノ 酸 配 列 へ の 変 換
24
塩 基 配 列 を ア ミ ノ 酸 配 列 に 変 換 できる サ イ ト : NCBI/Open Reading Finder, ExPasy/Tranlate
NCBI/Open Reading Finder を 使 っ て 塩 基 配 列 ( >test_DNA_sequence-1 ) を ア ミ ノ 酸 配
列 に 変 換 し て み よう
1 ) 利 用 す る ウ ェ ブ サ イ ト : NCBI (National Center for Biotechnology Center) http://www.ncbi.nlm.nih.gov/
2 ) 使 用 す る ア イ コ ン : Open Reading Frame Finder (ORF finder )open reading frame = 蛋白質 を コ ー ド す る 塩 基 配 列 の 読 み 取 り枠
ORF finder に よ る 検 索 手 順1 . NCBIの ウ ェ ブ サ イ ト を開き、左上Resource List (A-Z) を ク リ ッ ク
2 . Open reading frame finder(ORF finder)を開け る
3.ア ミ ノ 酸 配 列 に 変 換 す る
配 列 (FASTA format) を枠内 に 配 列 を コピー す る
OrfFind ボタ ン を押す
青 で 示 さ れ た 部 分 が 、 予想さ れ る ア ミ ノ 酸 配 列
( セ ン ス 、 ア ン チ セ ン ス 鎖 の3フ レ ー ム で の翻訳結 果 が 示 さ れ る )
通常、 一番長い フ レ ー ム が タ ン パ ク 質 の コ ー ド 配 列 で あ る
青 の バ ー を ク リ ッ ク す る = 塩 基 配 列 と ア ミ ノ 酸 配 列 が表示 さ れ る
4.推定 さ れ た ア ミ ノ 酸 配 列 を 取 り 出 す に は
Acceptボタ ン を押す
Viewボタ ン を押す : ア ミ ノ 酸 配 列 デ ー タ と諸情 報 が 示 さ れ て い る
ア ミ ノ 酸 配 列 を テ キ ス ト ファイ ル 等 に コピー す る
>test_DNA_sequence-1(zebrafish_charon)
AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTT
CTTTTTTGTAAAATTCTATAATTTAGCTAAAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGG
CGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTTGAATCCTCCGGGAATGGACCAGA
CGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTT
CAGAAATTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAA
ACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGA
GCGAAAAAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACA
GCGCATAACGGAGGAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCC
CTCCAGCGGAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCA
CCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAACCAGCAGCGAAGAGGC
CAAAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA
//
Expasyの Translate に よ る 検 索 手 順25
タ ン パ ク 質 の 構 造 解 析 で は 、ヨー ロ ッ パ の 研究機 関 の ウ ェ ブ サ イ ト が充実 し て い る 。 特 に
Swiss Institute of Bioinformatics 、 Sanger研究所( イギリ ス ) の サ イ ト は 、 利 用価値が高い 。 前
者は 、 ExPASy (Bioinformatics Resource Portal) 、後者は Pfam ( ド メ イ ン 解 析 ) を公開し て い る 。
ま た European Bioinformatics Institute (EBI)でも、 タ ン パ ク 質 の 構 造 解 析 プ ロ グ ラ ム を公開し て い
る 。
1 . Expasy を あ け る
2. 左の Resource A..Z を選択
3 . Translate を選択
4. 枠内 に 塩 基 配 列 の み コピー し 、 Translate sequenceを ク リ ッ ク し て 検 索
基 本 構 造 の 解 析
タ ン パ ク 質 の 分子量・等電点の 予 測 :
1 ) ExPASy (http://ca.expasy.org/)を開け る 。
2 ) 左の Resource A..Z を選択
3 ) Compute PI/Mw を選択
4) 下記の > zebrafish_Charon で 検 索 し て み よう。 ア ミ ノ 酸 配 列 を枠内 に コピー す る
( 配 列 の み : こ の プ ロ グ ラ ム で は > で 始 ま る 行 は コ ピ ー し な い ) 。 Click here to computepI/Mw ボタ ン を ク リ ッ ク す る 。
5) 検 索 結 果 : Theoretical pI/Mw: 10.00 ( 等 電 点 ) / 27073.04( 分 子 量 )
>zebrafish_CharonMTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRN
SPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCA
AVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVL
IVEECKCETSSEEAKVQNTDMFNL
//
(ゼブ ラ フ ィ ッ シュCharon: 分泌型の シ グ ナ ル タ ン パ ク 質 )
疎水性・親水性領域の 解 析 :
1 ) ExPASy Proteomics tools (http://ca.expasy.org/) を開け る 2 )左の Resource A..Z を選択
3) Prot Scale を選択
4) ア ミ ノ 酸 配 列 を枠内 に コピー す る 。 Hphob. / Kyte &Doolittle ( デ フ ォ ル ト状態:
疎 水 性 / 親 水 性 解 析 で最も利 用 さ れ て い る プ ロ グ ラ ム ) を選択す る 。
5) >zebrafish_fgfr1 で試し て み よう
6) Submit ボタ ン を押す
7) 結 果 : グ ラ フ の プ ラ ス が 疎 水 性 、 マ イ ナ ス が 親 水 性 を 示 す . fgfr1 で は 、 ア ミ ノ末端
26
側の 疎 水領域は シ グ ナ ル ペ プ チ ド の 部 分 。中央の 疎 水領域は 、 細 胞 膜 貫 通 ド メ イ ン で
あ る 。
>zebrafish_fgfr1
MIMKTTLLLISVLLTQALQSQGRPAIQDEAPAEPTSYTLDSGEKLELSCKAKEDTQKVTWTKDLVPLVDGEHTRLRN
DQMEIEKVEPADSGLYACFAQGLNSNHTEYFNISVTDEEDEVDSSSEEAKLSNDQNLPMAPVWAQPDKMEKKLHAVP
ASKTVKFRCQANGNPTPTLKWLKNGKEFKRDQRIGGFKVREHMWTIIMESVVPSDRGNYTCLVENRHGSINHTYQLD
VVERSPHRPILQAGLPANRTAVVGSDVEFECKVFSDPQPHIQWLKHIEVNGSRYGPDGLPYVRALKTAGVNTTDKEM
EVLQIRNVSLEDAGEYTCLAGNSIGHSHHSAWLTVYKAVPPTQLPNQTYLEVLIYCVGFFLICVMVGTAVLAKMHSS
AKKSDFNSQLAVHKLAKSIPLRRQVTVSVDSSSSMHSGGMLVRPSRLSSSGSPMLSGVSEYELPQDPRWEVQRDRLV
LGKPLGEGCFGQVMMAEAMGMDKEKPNRITKVAVKMLKSDATEKDLSDLISEMEMMKIIGKHKNIINLLGACTQDGP
LYVIVEFAAKGNLREYLRVRRPPGMEYCYNPDQVPVENMSIKDLVSCAYQVARGMEYLASKKCIHRDLAARNVLVTE
DNVMKIADFGLARDIHHIDYYKKTTNGRLPVKWMAPEALFDRIYTHQSDVWSFGVLLWEIFTLGGSPYPGVPVEELF
KLLKEGHRMDRPSTCTHELYMMMRDCWHAVPSQRPTFKQLVEDLDRTLSMTSNQEYLDLSVSLDQFSPNFPDTRSST
CSSGEDSVFSHDAGADEPCLPKFPPHPNRGVAFKKR
( FGF 受容体: 細 胞 内 に チ ロ シ ン キ ナ ーゼド メ イ ン を持っ た 膜 貫 通型細 胞 膜受容体・
FGF=fibroblast growth factor/ 繊維芽細 胞 増殖因 子 :創傷治癒、培養条件下で繊維芽細
胞 の 分裂を促進 す る 。胚発 生 で は中胚葉誘導に 関与す る )
27
11 月 19 日 ( 第 7 回 )
シ グ ナ ル ペ プ チ ド の 検 索
タ ン パ ク 質 の シ グ ナ ル ペ プ チ ド の 予 測 :
1 ) SignalP 3.0 Server ( http://www.cbs.dtu.dk/services/SignalP/ ) を開け る ( デ ン マ ー
ク の Technical University が公開)
2 ) >zebrafish_Charon で 検 索 し て み よう。 ア ミ ノ 酸 配 列 を枠内 に コピー す る 。 Submitボタ ン を ク リ ッ ク す る 。
>zebrafish_CharonMTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRN
SPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCA
AVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVL
IVEECKCETSSEEAKVQNTDMFNL
練習 :下の ア ミ ノ 酸 配 列 でも検 索 し て み よう
>mouse_vitamin_D_receptor
MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNR
RHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPT
YADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPL
SMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDI
TDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCR
HPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS
(ビタ ミ ン D受容体は 、核に移行す る蛋白質 な の で シ グ ナ ル ペ プ チ ド は な い )
ド メ イ ン 構 造 の 検 索
タ ン パ ク 質 の ド メ イ ン 構造の 予 測 -1: Pfam を 使う( ド メ イ ン 検 索 で最も利 用 さ れ て
い る : 機 能 ド メ イ ン を探す の に便利 )
今日 は 、下の マ ウ ス のビタ ミ ン D受容体で 検 索 し ま す 。
1 ) Pfam ( http://pfam.sanger.ac.uk/ ) ( イギリ ス の サ ン ガ ー 研究所) を開け る
2 ) SEQUENCE SEARCH ボタ ン を押す
3) 枠内 に ア ミ ノ 酸 配 列 (試し に >mouse_vitamin_D_receptor ) を コピー し 、 Go を押す
4) み つ か っ た ド メ イ ン 構 造 が グ ラ フ ィ ッ ク で上に 図 示 さ れ る 。
5) 下に は 各 ド メ イ ン の 説 明 が表示 さ れ る 。
6) 一番右の Show/hide alignment を押す と 、 デ ー タ ベ ー ス に納めら れ て い る ド メ イ ン
配 列 と問い 合わせ配 列 の ア ラ イ メ ン ト が表示 さ れ る
7) ド メ イ ンネー ム (上の グ ラ フ ィ ッ クも同様) が ア ク テ ィ ブ で 、それ を押す と 、 ド メ
28
イ ン の 説 明 、立体構 図 が表示 さ れ る
8) 右上の グ ラ フ ィ ッ クツー ル のうち、 crystallographic structuresを押す と 、 み つ か っ た
タ ン パ ク 質 の高次 構 造 が グ ラ フ ィ ッ ク で 示 さ れ 、詳細 な 構 造 の 説 明も表示 さ れ る 。
PBD ID を押す と 、 タ ン パ ク 質 の高次 構 造 ( ア ル ファへ リ ッ ク ス 構 造 等 ) が表示 さ れ
る 。
>mouse_vitamin_D_receptor
MEAMAASTSLPDPGDFDRN
VPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCVDIGMMKEFILT
DEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRPTLS
FSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLT
SDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVL
LMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPE
NSMKLTPLVLEVFGNEIS
(ビタ ミ ン D受容体;核タ ン パ ク 質受容体ファミ リ ー の メ ン バ ー で 、骨形成 等 に 関与
す る )
終わっ た人は 、 次 の タ ン パ ク 質 で 検 索 し て み よう:
ゼブ ラ フ ィ ッ シュ・ FGF レ セ プ タ ー
等 鎖 結 合 部 位 の 予 測
Asn-Xaa-Ser/Thr タ イ プ の 等 鎖 結 合 部 位 の 予 測 プ ロ グ ラ ム
http://www.cbs.dtu.dk/services/NetNGlyc/
3D 構 造 デ ー タ ベ ー ス の閲覧
NCBI の 利 用
NCBIの Resource List の中に あ る Structure (Molecular Modelling Database) を 使うと 、 タ ン パ ク 質
構 造 デ ー タ ベ ー ス に納めら れ て い る 3D 構 造 を閲覧す る こ と が できま す 。
↓NCBI homepage↓Resource List か ら Structure (Molecular Modelling Database) を選択
↓ 左カラ ム の Search を選択
↓Search の枠に タ ン パ ク 質 明 を入力し て 検 索 (試し に prion, VDR で 検 索 し て み よう)
PDB (Protein Data Bank) の 利 用
www.pdb.org 上の ア イ コ ン か ら macromolecule を指定 し て キ ー ワ ー ド 検 索 (試し に prion, VDR で 検 索 し て み
よう)
3D 構 造だけ で なく、 遺 伝 子 の 機 能 の 解 説も添えら れ て い る
NCBI blastp に よ る 検 索
29
Blastp で デ ー タ ベ ー ス を Protein Data Bank を選択し て 検 索 す る (上の Protein Data Bankに登録さ れ て い る高次 構 造 の 分 か っ て い る タ ン パ ク 質 に対し て blastp検 索 が行われ る )
配 列類似遺 伝 子 で高次 構 造 の 解 析 さ れ て い る タ ン パ ク 質 が表示 さ れ る 。右の Accession ボ
タ ン を押す と 、 デ ー タ が表示 さ れ る 。右に 3D 構 造 が 図 示 さ れ る 。
30
11 月 26 日 ( 第 8 回 )
講 義 と 実 習
分 子 生 物 学 におけ る 、 21 世紀に開発 さ れ た革新的 な新技 術
こ の 5 年間で 実 用 化 さ れ た ゲ ノ ム 編 集 技 術 ( Genome editing ) と 次 世 代 シ ー ケ ン ス 解
析 ( Next generation sequencing: NGS ) の 2 つ の 技 術 は 、おそらく分 生 生 物 学 におけ る
今世紀最大の 技 術革新で あろうと思われ ま す 。 前者は 生 物 の ゲ ノ ム 配 列 を人為的 か つ簡便
に書き換える こ と を 可 能 に し た 技 術 で 、後者は ヒ ト の ゲ ノ ム でも 1 回 の ラ ン で シ ー ケ ン ス
できる ナ ノ テ ク で す 。
2 つ の 技 術 の 重 要 な 点 と し て 、 基礎生 物 学 に 加えて 、 農 学 を含め応 用 研究に無限の 可 能
性 を秘めて い る こ と を強調 し ておく必要 が あ り ま す 。 ゲ ノ ム 編 集 で は 、 農林水産の新品種
開発 が活発 に推進 さ れ て い ま す 。 NGS は 、既に品種 の ゲ ノ ム育種や形質 の責任遺 伝 子 の同
定 に 利 用 さ れ て い ま す 。
ゲ ノ ム 編 集 技 術 の 原 理
ゲ ノ ム 編 集広く使われ て い る CRISPR/Cas9 法 は 、簡単に ま とめる と 、 ファー ジ ウ ィ ル
ス に対す る 細菌の獲得免疫シ ス テ ム を 遺 伝 子工学 の 技 術 に展開す る こ と で 、 ゲ ノ ム に
配 列 特異的 に 2 本鎖切断を誘起す る こ と を 可 能 に し た 技 術 と いえま す 。 ゲ ノ ム 編 集 は 、
CRISPR/Cas9 法 を 用 い て標的 遺 伝 子 の ノ ッ ク ア ウ ト 、 あ る い は外来配 列 の標的 部 位 へ
の ノ ッ ク イ ン を行う技 術 と な り ま す 。 ノ ッ ク ア ウ ト で は 、 2 本鎖切断の修復 で起こ る
塩 基 の欠損や挿入に よ る フ レ ー ム シ フ ト を 利 用 し て い ま す 。 あ る い は 、 2 本鎖切断を
遺 伝 子 内 に 2 カ所誘起し て 、その間の 配 列 を削除す る こ と でもノ ッ ク ア ウ ト が 可 能 で
す 。受精卵に Cas9 と 複数の 遺 伝 子 の ガ イ ド RNA を導入す る こ と で 、同時に 複数個の
遺 伝 子 を ノ ッ ク ア ウ ト す る こ とも可 能 で す 。
ノ ッ ク イ ン で は 、 2 本鎖切断部 位 に ド ナ ー 配 列 を 設 計 す る こ と で 、相同組換えに よ る
遺 伝 子導入が高効率と な り 、 ES 細 胞 を 用 いず、直接受精卵内 で ノ ッ ク イ ン す る こ と
が 可 能 で す 。
CRISPR/Cas9 で の標的 配 列 の 設 計
CRISPR/Cas9 の標的 配 列 は 20 塩 基程度で極めて短い ために 、同じ配 列 あ る い は 1塩 基違う配 列 が標的 配 列以外にも存在す る 可 能 性 は大い に あ り ま す 。標的 配 列 に 加え
て 、 こ の ような 配 列もCRISPR/Cas9 で切断さ れ る ために オ フ タ ー ゲ ッ ト と呼ばれ 、正
確な ゲ ノ ム 編 集 に は オ フ タ ー ゲ ッ ト の無い 配 列 を 設 計 す る必要 が あ り ま す 。 全 ゲ ノ ム
の 配 列 が決定 さ れ て い る 生 物 で あ れば、 オ フ タ ー ゲ ッ ト の無い 配 列 を選択す る こ と が
可 能 で す 。 ま た CRISPR/Cas9 で は 、標的 配 列 の 設 定 部 位 は 、 Pam配 列 ( NGG ) に よ
り制限さ れ ま す 。 CRISPRdirect を 使うと 、 Pam 配 列 の上流で 、 か つ 特異性 の高い標
的 配 列 が 検 出 さ れ てきま す 。 授 業 で は 、 CRISPR/Cas9 法 の 原 理 を簡単に 説 明 し たうえ
で 、 CRISPRdirect の 使 い 方 を 実 習 し ま す 。
31
32
>NM_009170.3 Mus musculus sonic hedgehog (Shh), mRNA
ACAAGCTCTCCAGCCTTGCTACCATTTAAAATCAGGCTCTTTTTGTCTTTTAATTGCTGTCTCGAGACCC
AACTCCGATGTGTTCCGTTACCAGCGACCGGCAGCCTGCCATCGCAGCCCCAGTCTGGGTGGGGATCGGA
GACAAGTCCCCTGCAGCAGCGGCAGGCAAGGTTATATAGGAAGAGAAAGAGCCAGGCAGCGCCAGAGGGA
ACGAACGAGCCGAGCGAGGAAGGGAGAGCCGAGCGCAAGGAGGAGCGCACACGCACACACCCGCGCGTAC
CCGCTCGCGCACAGACAGCGCGGGGACAGCTCACAAGTCCTCAGGTTCCGCGGACGAGATGCTGCTGCTG
CTGGCCAGATGTTTTCTGGTGATCCTTGCTTCCTCGCTGCTGGTGTGCCCCGGGCTGGCCTGTGGGCCCG
GCAGGGGGTTTGGAAAGAGGCGGCACCCCAAAAAGCTGACCCCTTTAGCCTACAAGCAGTTTATTCCCAA
CGTAGCCGAGAAGACCCTAGGGGCCAGCGGCAGATATGAAGGGAAGATCACAAGAAACTCCGAACGATTT
AAGGAACTCACCCCCAATTACAACCCCGACATCATATTTAAGGATGAGGAAAACACGGGAGCAGACCGGC
TGATGACTCAGAGGTGCAAAGACAAGTTAAATGCCTTGGCCATCTCTGTGATGAACCAGTGGCCTGGAGT
GAAGCTGCGAGTGACCGAGGGCTGGGATGAGGACGGCCATCATTCAGAGGAGTCTCTACACTATGAGGGT
CGAGCAGTGGACATCACCACGTCCGACCGGGACCGCAGCAAGTACGGCATGCTGGCTCGCCTGGCTGTGG
AAGCAGGTTTCGACTGGGTCTACTATGAATCCAAAGCTCACATCCACTGTTCTGTGAAAGCAGAGAACTC
CGTGGCGGCCAAATCCGGCGGCTGTTTCCCGGGATCCGCCACCGTGCACCTGGAGCAGGGCGGCACCAAG
CTGGTGAAGGACTTACGTCCCGGAGACCGCGTGCTGGCGGCTGACGACCAGGGCCGGCTGCTGTACAGCG
ACTTCCTCACCTTCCTGGACCGCGACGAAGGCGCCAAGAAGGTCTTCTACGTGATCGAGACGCTGGAGCC
GCGCGAGCGCCTGCTGCTCACCGCCGCGCACCTGCTCTTCGTGGCGCCGCACAACGACTCGGGGCCCACG
CCCGGGCCAAGCGCGCTCTTTGCCAGCCGCGTGCGCCCCGGGCAGCGCGTGTACGTGGTGGCTGAACGCG
GCGGGGACCGCCGGCTGCTGCCCGCCGCGGTGCACAGCGTGACGCTGCGAGAGGAGGAGGCGGGCGCGTA
CGCGCCGCTCACGGCGCACGGCACCATTCTCATCAACCGGGTGCTCGCCTCGTGCTACGCTGTCATCGAG
GAGCACAGCTGGGCACACCGGGCCTTCGCGCCTTTCCGCCTGGCGCACGCGCTGCTGGCCGCGCTGGCAC
CCGCCCGCACGGACGGCGGGGGCGGGGGCAGCATCCCTGCAGCGCAATCTGCAACGGAAGCGAGGGGCGC
GGAGCCGACTGCGGGCATCCACTGGTACTCGCAGCTGCTCTACCACATTGGCACCTGGCTGTTGGACAGC
GAGACCATGCATCCCTTGGGAATGGCGGTCAAGTCCAGCTGAAGCCCGACGGGACCGGGCAAGGGGCGGG
CGGGGCGGGGAGCGACTGCGAAATAAGGAACTGATGGGAAAGCGCACGGAAGGAGACTTTTAATTATAAG
AATAATTCATAATAATAATAATAATGATAATAATAATAATAATAAGTAGGGCAGTCCAAAGTAGACTATA
AGGAAGCAAAAACCCCGGGGAGTTCTGTTGTTATGTTTAGTTTATATATTTTTTTGAAATTTTTCGTTAT
TGTCTTATATGGGTTGTTTTTCTCCTCTCCTGGCTATTTATTTGTTTCGTATGAATAGATGTTTTAAAAA
TATGAACGGACCTTCAAGAGCCTTAACTAGTTTGTGTCTTGGATAATTTATTATTGTGTGAACTGTACTC
ACAGTGAGGGAAAGATTATTTTGTGAGGCCAAGCAACCTGCTGAAAGTCTATTTTTCTACATGTCCCTTG
TCCTGCGTTTCAGAAGGCAAACCTCCGCATTCCTCTCCTGCTATGCTCCTGCTTTCCCGCAAGTGTAAAC
TAAAACCTGCTCCATGGGGGTCCACAAATTATATTTTTATACACAGAATTGTAAATTAGATTTTTGAGAG
ATCAATACCTAACTGAATGACATTTCATTTTTTGAAAGTGTAAAATATGAAAATATATTATTTTAATTTA
ACTATTTTCCAATGTAATAGCCGTCTTCTGTACTGCCTTCTTGGTTTGTATTTGCTTTGTAACCGCCACT
TTGTCATGTTCTTGGAAACCAAGACTGTTAACGCACACATATACACTTTTTTTTTTGACAGACTGGAAGA
ACTCTGTTATTTTTAACTTCAAAGAATTTATTAGAAAATAATATTTTTTAAAAGTGCACCTAGCAGCGAG
CCCACGAGGATGGAGCCTGTAGTTTGTACAGAGAAAAACAAGGATGTTTTTGCATTAATAAACTGAGAAG
TAACTGCTGTAAATTTACTAAAATGTATTTTTGAATATTTTGTAATAGTTTTATAGAAATAAAGCGTGCC
ACACACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
33
>mouse_Shh_CDS
ATGCTGCTGCTG CTGGCCAGATGTTTTCTGGTGATCCTTGCTTCCTCGCTGCTGGTGTGCCCCGGGCTGGCCTGTGGGCCCG
GCAGGGGGTTTGGAAAGAGGCGGCACCCCAAAAAGCTGACCCCTTTAGCCTACAAGCAGTTTATTCCCAA
CGTAGCCGAGAAGACCCTAGGGGCCAGCGGCAGATATGAAGGGAAGATCACAAGAAACTCCGAACGATTT
AAGGAACTCACCCCCAATTACAACCCCGACATCATATTTAAGGATGAGGAAAACACGGGAGCAGACCGGC
TGATGACTCAGAGGTGCAAAGACAAGTTAAATGCCTTGGCCATCTCTGTGATGAACCAGTGGCCTGGAGT
GAAGCTGCGAGTGACCGAGGGCTGGGATGAGGACGGCCATCATTCAGAGGAGTCTCTACACTATGAGGGT
CGAGCAGTGGACATCACCACGTCCGACCGGGACCGCAGCAAGTACGGCATGCTGGCTCGCCTGGCTGTGG
AAGCAGGTTTCGACTGGGTCTACTATGAATCCAAAGCTCACATCCACTGTTCTGTGAAAGCAGAGAACTC
CGTGGCGGCCAAATCCGGCGGCTGTTTCCCGGGATCCGCCACCGTGCACCTGGAGCAGGGCGGCACCAAG
CTGGTGAAGGACTTACGTCCCGGAGACCGCGTGCTGGCGGCTGACGACCAGGGCCGGCTGCTGTACAGCG
ACTTCCTCACCTTCCTGGACCGCGACGAAGGCGCCAAGAAGGTCTTCTACGTGATCGAGACGCTGGAGCC
GCGCGAGCGCCTGCTGCTCACCGCCGCGCACCTGCTCTTCGTGGCGCCGCACAACGACTCGGGGCCCACG
CCCGGGCCAAGCGCGCTCTTTGCCAGCCGCGTGCGCCCCGGGCAGCGCGTGTACGTGGTGGCTGAACGCG
GCGGGGACCGCCGGCTGCTGCCCGCCGCGGTGCACAGCGTGACGCTGCGAGAGGAGGAGGCGGGCGCGTA
CGCGCCGCTCACGGCGCACGGCACCATTCTCATCAACCGGGTGCTCGCCTCGTGCTACGCTGTCATCGAG
GAGCACAGCTGGGCACACCGGGCCTTCGCGCCTTTCCGCCTGGCGCACGCGCTGCTGGCCGCGCTGGCAC
CCGCCCGCACGGACGGCGGGGGCGGGGGCAGCATCCCTGCAGCGCAATCTGCAACGGAAGCGAGGGGCGC
GGAGCCGACTGCGGGCATCCACTGGTACTCGCAGCTGCTCTACCACATTGGCACCTGGCTGTTGGACAGC
GAGACCATGCATCCCTTGGGAATGGCGGTCAAGTCCAGCTGA
>mouse_Shh_CDS
ATGCTGCTGCTG CTGGCCAGATGTTTTCTGGTGATCCTTGCTTCCTCGCTGCTGGTGTGCCCCGGGCTGGCCTGTGGGCCCG
GCAGGGGGTTTGGAAAGAGGCGGCACCCCAAAAAGCTGACCCCTTTAGCCTACAAGCAGTTTATTCCCAA
CGTAGCCGAGAAGACCCTAGGGGCCAGCGGCAGATATGAAGGGAAGATCACAAGAAACTCCGAACGATTT
AAGGAACTCACCCCCAATTACAACCCCGACATCATAT
TTAAGGATGAGGAAAACACGGGAGCAGACCGGC
TGATGACTCAGAGGTGCAAAGACAAGTTAAATGCCTTGGCCATCTCTGTGATGAACCAGTGGCCTGGAGT
GAAGCTGCGAGTGACCGAGGGCTGGGATGAGGACGGCCATCATTCAGAGGAGTCTCTACACTATGAGGGT
CGAGCAGTGGACATCACCACGTCCGACCGGGACCGCAGCAAGTACGGCATGCTGGCTCGCCTGGCTGTGG
AAGCAGGTTTCGACTGGGTCTACTATGAATCCAAAGCTCACATCCACTGTTCTGTGAAAGCAGAGAACTC
CGTGGCGGCCAAATCCGGCGGCTGTTTCCCGGGATCCGCCACCGTGCACCTGGAGCAGGGCGGCACCAAG
CTGGTGAAGGACTTACGTCCCGGAGACCGCGTGCTGGCGGCTGACGACCAGGGCCGGCTGCTGTACAGCG
ACTTCCTCACCTTCCTGGACCGCGACGAAGGCGCCAAGAAGGTCTTCTACGTGATCGAGACGCTGGAGCC
GCGCGAGCGCCTGCTGCTCACCGCCGCGCACCTGCTCTTCGTGGCGCCGCACAACGACTCGGGGCCCACG
CCCGGGCCAAGCGCGCTCTTTGCCAGCCGCGTGCGCCCCGGGCAGCGCGTGTACGTGGTGGCTGAACGCG
GCGGGGACCGCCGGCTGCTGCCCGCCGCGGTGCACAGCGTGACGCTGCGAGAGGAGGAGGCGGGCGCGTA
CGCGCCGCTCACGGCGCACGGCACCATTCTCATCAACCGGGTGCTCGCCTCGTGCTACGCTGTCATCGAG
GAGCACAGCTGGGCACACCGGGCCTTCGCGCCTTTCCGCCTGGCGCACGCGCTGCTGGCCGCGCTGGCAC
CCGCCCGCACGGACGGCGGGGGCGGGGGCAGCATCCCTGCAGCGCAATCTGCAACGGAAGCGAGGGGCGC
GGAGCCGACTGCGGGCATCCACTGGTACTCGCAGCTGCTCTACCACATTGGCACCTGGCTGTTGGACAGC
GAGACCATGCATCCCTTGGGAATGGCGGTCAAGTCCAGCTGA
34
35
]
12 月 3 日 ( 第 9 回 )
今日 の 授 業 内容
1. 実 習 : 配 列 ア ラ イ メ ン ト
2. 講 義 : 分 子 系 統 樹 に つ い て
講 義
2 つ以上の 塩 基 配 列 あ る い は ア ミ ノ 酸 配 列 の 一致度を 調 べ る場合 、 ア ラ イ メ ン ト プ ロ グ ラ ム
を 使 い ま す 。 タ ン パ ク 質 の場合 、異な る 生 物間で ア ミ ノ 酸 配 列 を ア ラ イ メ ン ト す る こ と に よ り 、
保存性 の高い領域を 特 定 す る こ と が できま す 。 系 統 的 に隔た っ た 生 物間(例えば、 マ ウ ス とゼ
ブ ラ フ ィ ッ シュ、 あ る い は マ ウ ス と酵母の 関 係 等 ) で保存性 が高い領域は 、 タ ン パ ク 質 の 機 能
で 重 要 な役割を持っ た領域で あ る と考えら れ ま す 。 ま た シ ス テ イ ン残基 は 、 タ ン パ ク 質 の高次
構 造 に深く関わる ジ ス ル フ ィ ド ( S-S ) 結 合 を 作 る場合 が 多 い ため、保存さ れ て い る こ と が 多
く、異な る 生 物 の タ ン パ ク 質 を ア ラ イ メ ン ト す る こ と で 重 要 で保存さ れ た ジ ス ル フ ィ ド 結 合 の
位置を 予 測 できま す 。
ClustalW プ ロ グ ラ ム を 使うと 、 多 重 ( マ ル チ プ ル ) ア ラ イ メ ン ト の 結 果 か ら 分 子 系 統 樹 を 作
成 できま す 。 分 子 系 統 樹 で は 、 遺 伝 子 の 種間あ る い は同種間におけ る 進 化 的 関 係 を 予 測 す る こ
と が できま す 。 種間の 進 化 的 関 係 で は 、異な る 生 物間におけ る相同遺 伝 子 ( オ ー ソ ロ グ ) を同
定 す る こ と が 可 能 で す 。同種間で 関 連 遺 伝 子 の 系 統 樹 を 作 成 す る と 、 遺 伝 子 ファミ リ ー の メ ン
バ ー の 進 化 的 関 係 が 分 か り ま す 。 ま た モ デ ル 生 物 ( マ ウ ス 、ゼブ ラ フ ィ ッ シュ) の 配 列 を 分 子
系 統 樹 に 加える こ と で 、 研究対象の 遺 伝 子 に対す る モ デ ル 生 物 の オ ー ソ ロ グ を 検 索 し 、 モ デ ル
生 物 の 情 報 か ら か ら 、 研究対象の 遺 伝 子 の 機 能 に つ い ておおよその 情 報 を得る こ と が できま す 。
授 業 で は 、 ペ ア ワ イ ズ ア ラ イ メ ン ト ( 2 つ の 配 列 を比較) 、 マ ル チ プ ル ア ラ イ メ ン ト (3つ
以上の 配 列 を比較)および分 子 系 統 樹 の 作 成 (来週) を 実 習 し ま す 。
配 列 ア ラ イ ン メ ン ト
配 列 ア ラ イ ン メ ン ト と は 、 配 列中で同じ並び方 を し て い る文字 列 を探す こ と で あ る 。同一
もしくは似た文字 は同じ列 に置き、同一 で な い文字 は同じ列 に不一致と し て置くか 、
ギャッ プ を入れ る 。
ペ ア ワ イ ズ ア ラ イ ン メ ン ト (pairwise alignment) : 2 つ の 配 列 の比較
大域的 ア ラ イ ン メ ン ト (global pairwise alignment)局所的 ア ラ イ ン メ ン ト (local pairwise alignment)
多 重 配 列 ア ラ イ ン メ ン ト (multiple alignment) :3つ以上の 配 列 の比較
************************************************************************
36
実 習
AlignmentPairwise alignment
1 ) 使 用 す る ウ ェ ブ サ イ ト : The European Bioinformatics Institute (EBI )http://www.ebi.ac.uk/Information/ ( Internet explorerを 使 っ て EBI で 検 索 )
2 ) Services の中 か ら Proteins を選 択。 →左 下の See all toolsを開 け 、 リ ス ト の中か ら
EMBOSS を選択
Local alignment → Matcher (protein)2 つ の枠内 に 配 列 を ペ ー ス ト し て Submit練習 :
下の gnrh ( gonadotropin-releasing hormone; 生腺腺刺激ホ ル モ ン ) か ら ヒ ト とゼブ ラ フ ィ
シュを選んで ア ラ イ ン メ ン ト を 実行し て み よう。
次 に 、 ヒ ト と ホヤ( Ciona ) で 実行し て み よう
Global alignment → Needle (protein)Needle, Protein を選択し 2 つ の枠内 に 配 列 を ペ ー ス ト し て Submit練習 :上と同じ入力を行い 、 結 果 の違い を 理 解 し よう
>human_GNRH1
MKPIQKLLAGLILLTSCVEGCSS
QHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI
>mouse_Gnrh
MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEA
RQKKM
>chicken_Gnrh1
MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEG
EARRKEI
>xenopus_GnRH1
MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGEN
RKKI
>zebrafish_gnrh2
MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKR
K
>ciona_gnrh1
MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVN
ARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGM
PEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE
GNRH: 生腺刺激ホ ル モ ン放出 ホ ル モ ン . 視床下部 で 合 成 さ れ 、下垂体門脈経 路 を介し て下垂体
前葉に運ばれ 、 生腺刺激ホ ル モ ン で あ る 黄体形成 ホ ル モ ン (LH) と濾法刺激ホ ル モ ン (FS
H) の産生 と放出 を促進 す る神経 性 ペ プ チ ド ホ ル モ ン . ホ ル モ ン 前駆体と し て 合 成 さ れ た あ と
37
酵素に よ り切断さ れ 、 ヒ ト で は HWSYGLRPG ペ プ チ ド が ホ ル モ ン と し て 機 能 す る 。
Ciona: カタユレ イボヤ( ホヤの仲間で 日本の 研究グ ル ー プ に よ っ て ゲ ノ ム シ ー ク エ ン ス が 解 読
さ れ た )
講 義分 子 系 統 樹 : Phylogenetic tree, Evolutionary tree
分 子 系 統 樹 ( 進 化 系 統 樹 ) (molecular phylogenetic tree, evolutionary tree)塩 基 配 列やア ミ ノ 酸 配 列 を 基 に 分岐位置と 分岐時間を推定 し 、 構築さ れ た 系 統 樹
近接接合 法 (neighbor-joining method): 距離行列 法 で 作 成 す る 分 子 系 統 樹 の 作 成 方
法 で 、 生 物 分野で最も一般的 に 利 用 さ れ る 。
キ ー ワ ー ド
節、枝、 ク ラ ス タ ー (cluster) あ る い は ク レ ー ド (clade)Outgroup 、 Bootstrap value ( ブ ーツス ト ラ ッ プ値) 、 Evolutionary distance
分 子 系 統 樹 の 利 用
( 1 ) 遺 伝 子 の同種間、異種間で の 系 統 関 係 の 解 析
( 2 ) 遺 伝 子 ファミ リ ー に属す る メ ン バ ー の 系 統 関 係 の 解 析
(3) 重 複 遺 伝 子 の 重 複時期と 進 化 的 関 係 の 解 析
(4) 種や系 統 の 進 化 的 関 係 の推定
分 子 系 統 樹 か ら 、様々な 情 報 を 読 み 取 る こ と が できま す 。異な る 生 物 達 の 関 連 ( ホ モ ロ グ )
遺 伝 子 で 分 子 系 統 樹 を 作 製 す る と 、 遺 伝 子 の 進 化 的 関 係 を 予 測 す る こ と が できま す 。 ま た ミ ト
コ ン ド リ ア DNA の 配 列 を 使うと 、人種 の類縁関 係や進 化 的 関 係 を 解 析 す る こ と が 可 能 で す 。 授
業 で は 、 分 子 系 統 樹 の 作 製 方 法 と デ ー タ の 見 方 を 講 義 し ま す 。
実 習
分 子 系 統 樹 の 作 製
ClustalW を 使 っ た Multiple alignmen と 分 子 系 統 の 作 成 1 ) 使 用 す る ウ ェ ブ サ イ ト ClustalW http://clustalw.genome.jp/2 ) Fasta format で並べ た 配 列 を枠内 に ペ ー ス ト し 、 execute multiple alignment を押
す ( 各 種ボタ ン は デ フ ォ ル ト で よ い )
練 習 : 下 の gnrh (gonadotropin-releasing hormone) のうち、 >ciona_gnrh1 ( ホ
ヤ) を除く配 列 で ア ラ イ ン メ ン ト を 実行し て み よう。 次 に 、 >ciona_gnrh1 を入
れ て ア ラ イ ン メ ン ト を 実行し 、 結 果 を比べ て み よう。
38
上に Multiple sequence alignments の 結 果 が表示 さ れ る 。
その下に あ る select tree menu で表示形式を選択し て 、 Exec を ク リ ッ ク す る
表示形式、 N-J tree branch length と Unrooted dendrogram の 結 果 を比較
し て み よう
>human_GNRH1
MKPIQKLLAGLILLTSCVEGCSS
QHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI
>mouse_Gnrh
MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEA
RQKKM
>chicken_Gnrh1
MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEG
EARRKEI
>xenopus_GnRH1
MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGEN
RKKI
>zebrafish_gnrh2
MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKR
K
>ciona_gnrh1
MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVN
ARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGM
PEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE
こ の サ イ ト で の 検索結果で は 、 Bootstrap value, evolutionary distance の 値は 表示さ れ な い 。DDBJ の ClustalWを 使え ば 、こ れ ら の 値が 求め ら れ る 。た だ し 、ま た 結果の 図形を 表示す る た め に 、Tree View と言う 無料ソ フ ト を ダ ウ ン ロ ード す る 必要が あ る 。教室の コ ン ピ ュ ータ ーで は 、ソ フ ト ウ ェ ア の ダ ウ ンロ ード は た め ら わ れ る の で 、各自の パ ソ コ ン でDDBJ を 試し て 下さ い 。あ る い は 、ClustalX の プ ロ グ ラ ム を ダ ウ ン ロ ードし て 解析す る (下記URL)。http://www.cbs.dtu.dk/courses/humanbio/2010/exercises/ExMulPhyl/Ex_Phylo.php
NCBI を 使 っ た Multiple alignment と 系 統 樹 の 作 成
1 . NCB→BLAST→ 下に あ る Multiple Alignment を選択
2. 枠内 に 配 列 を Fasta format で コピー
3 . Align を ク リ ッ ク し て 検 索
4. 検 索 画面上の Phylogenetic Tree を ク リ ッ ク
39
5 . Evolutionary distance を反映し た 系 統 樹 が表示 さ れ る
6 . Tools か ら Layout 、 Radial tree を選択す る と無根系 統 樹 が表示 さ れ る
プ ロ グ ラ ム に は 、 2007 年に開発 さ れ た 、 COBALT: constraint-based alignment tool for multiple protein sequences が 使われ て い る
実 習
分 子 系 統 樹 の 作 成シ ョ ウ ジ ョ ウ バ エ ( Drosophila ) の hedgehog タ ン パク 質 に 対 す る 、 マ ウ ス ( Mus musculus ) と ツ メ ガエ ル ( Xenopus tropicalis) の 類 似 遺 伝 子 を 検 索 し て分 子 系 統 樹 を 作 成 す る 。配 列 は Word あ る い は メ モ 帳 ( Text フ ァ イ ル ) にコ ピ ー す る 。
手順は以下の ように行う
1. シ ョ ウ ジ ョ ウ バ エ ( Drosophila ) の hedgehog タ ン パ ク 質 の ア ミ ノ 酸 配 列
を 取 り 出 す
NCBIを 使 っ て 、 proteinデ ー タ ベ ー ス で Drosophila と hedgehog で キ ー ワ ー ド 検 索
す る (Accession number: AAF56102) 。 FASTA ボタ ン を押す と 、 FASTA フ ォ ー ム の 配
列 が表示 さ れ る 。 ア ミ ノ 酸 配 列 を Word に コピー す る 。 > 名前 を付け て 、 Fasta format と す る ( ス ペ ー ス と数字 は 、 検 索時に削除さ れ て 計算さ れ る の で 、その ま
ま に し てもか まわな い ) 。
2. マ ウ ス の Drosophila hedgehog に対す る ホ モ ロ グ を 検 索 し て 、 配 列 を 取 り
出 す
BLAST の先頭ペ ー ジ で 、 mouse を ク リ ッ ク し 、 Bastp を選択し て 検 索 す る ( マ ウ
ス ゲ ノ ム に コ ー ド さ れ る 全 て の タ ン パ ク 質 ア ミ ノ 酸 情 報 に対し て 検 索 ) 。
検 索 に よ り表示 さ れ た3種類の hedgehog の 配 列 を 取 り 出 す 。 取 り 出 し 方 は 、
Accession 番号を ク リ ッ ク し 、表示 さ れ た 配 列 情 報 ペ ー ジ の上に あ る FASTA ボタ
ン を押す 。 FASTA フ ォ ー ム の 配 列 が表示 さ れ る で 、 コピー す る 。
3.Xenopusの Drosophila hedgehog に対す る ホ モ ロ グ を 検 索 し て 、 配 列 を 取 り 出 す
BLAST の先頭ペ ー ジ で 、 Xenopus tropicalis を指定 す る 。以下、 2 の操作 と同じ。
3 . ClustalW で 解 析
こ の 授 業 で は 、 ClustalW ( http://clustalw.genome.jp/ ) を 使う。枠内 に7つ の 遺 伝
子 の 全 配 列 を コピー し 、 マ ル チ プ ル ア ラ イ メ ン ト を 実施す る 。
マ ウ ス と Xenopus の間で 配 列 の保存性 を注意深くみ て 、保存性 の 特徴を 理 解 す る 。
4. 分 子 系 統 樹 を得る
検 索 結 果 の 一番下で 分 子 系 統 樹 を 出力。
40
N-J tree branch length と Unrooted dendrogram の 結 果 を比較
4の 結 果 と あわせて 、 Outgroup, Paralog, Ortholog の 関 係 を 理 解 す る 。 ヒ ト 遺 伝 子間の パ
ラ ロ グ よ りも、 ヒ ト と Xenopus の オ ル ソ ロ グ間の 方 が保存性 の高い こ と に注意 。 こ れ は
祖先遺 伝 子 が 重 複 し て 2 つ の 遺 伝 子 ( パ ラ ロ グ と な る ) を形成 し 、その あ と に 種 分 化 が
起こ っ た ためで あ る 。
講 義
オ ル ソ ロ グ と パ ラ ロ グ 、 ホ モ ロ グ の 関 係 に つ い て
無 脊椎 動 物 か ら脊椎 動 物 へ の 進 化 の過 程で 、 全 ゲ ノ ム ( 全 て の染 色体 ) の 重 複 ( whole genome duplication: WGD ) が 2 回起こ っ て い ま す 。その ため原 索 動 物 ( ナ メ ク ジ ウ オ ・ ホヤ等
が含ま れ 、脊索 を形成 す る 。無脊椎動 物 の な か で脊椎動 物 に 進 化 的 に最も近い ) で 1 種類で
あ っ た 遺 伝 子 は 、 一度 4 つ に数が 増えて い ま す ( 遺 伝 子 に よ っ て は 4 つ に 増えた あ と 、 4 つ と
も残っ て い るもの 、 1 つ消失し て 3 つ が残っ て い るもの 、 2 つ消失し て 2 つ が残っ て い るもの 、
3 つ が消失し て 1 種類だけ残っ て い るものもあ り ま す ) 。 一 つ の 遺 伝 子 か ら 、 ゲ ノ ム 重 複 に よ
り誕生 し た 重 複産物 の 種 内 で の 関 係 は パ ラ ロ グ ( Paralog ) と呼ばれ ま す 。
一 方 、 生 物 種間で相同な 遺 伝 子 は 、 オ ル ソ ロ グ ( Ortholog ) と呼ばれ ま す 。脊椎動 物 (円口
類を除く: 1 回 の み 重 複 、 2 度目の 重 複 の 前 に 分岐) で は 、 進 化 の初期段階 で 2 回 の ゲ ノ ム の
重 複 が起こ り 、その後で 、 多様な 種 に 分岐し て い ま す 。その ため、 多くの 遺 伝 子 が 種 を超えて
重 複 し た状態で ゲ ノ ム中に存在し て い ま す 。それ ら の組み 合わせの中で 、 生 物 種間で相同な 重
複 遺 伝 子 ( 配 列 が最も近似) が オ ル ソ ロ グ ( Ortholog ) と な り ま す 。 パ ラ ロ グ に相当す る 遺 伝
子 は 通常、それ ら の 機 能 は大きく変 化 し て い る の に対し 、 オ ル ソ ロ グ の 関 係 に あ る 遺 伝 子 は 、
種 が異な っ ても(例えば哺乳類と魚類) 機 能 が良く保存さ れ て い ま す 。その ため、ゼブ ラ
フ ィ ッ シュでもヒ ト の モ デ ル 生 物 と し て十分 な役割を は た す こ と が できるわけ で す 。 オ ル ソ ロ
グ と パ ラ ロ グ と の 関 係 は 、 分 子 系 統 樹 を 作 製 す る こ と に よ り 理 解 できま す 。 ホ モ ロ グ ( 関 連 遺
伝 子 ) は 、共通祖先か ら 発 生 し た 遺 伝 子 の総称で 、 ホ モ ロ グ に は オ ル ソ ロ グ と パ ラ ロ グ とも含
ま れ ま す 。
オ ル ソ ロ グ と パ ラ ロ グ の 関 係 を 理 解 す る ために 、 生 物 の 進 化 の 歴 史 、 遺 伝 子 重 複 の 歴 史 に つ
い て 解 説 し ま す 。 ま た hedgehog 遺 伝 子 を モ デ ル と し て 、 分 子 系 統 樹 を 作 製 し 、 ホ モ ロ グ と パ
ラ ロ グ の 関 係 を 説 明 し ま す 。
無脊椎動 物 か ら脊椎動 物 に 進 化 す る過程で 発 生 し た ゲ ノ ム 重 複 に つ い て少し詳しく説 明 し ま
す 。 hox 遺 伝 子 、核内受容体遺 伝 子 を例に し て 、 ゲ ノ ム に刻ま れ た 遺 伝 子 重 複 の 歴 史 を 解 説 し
ま す ( こ こ で は 、 配付資料を参考に し て 説 明 し ま す ) 。
Hedgehog family members
>drosophila_hh
MDNHSSVPWASAASVTCLSLDAKCHSSSSSSSSKSAASSISAIPQEETQTMRHIAHTQRCLSRLTSLVALLLIVLPMVFSPAHSCGPGRGLGRHRA
RNLYPLVLKQTIPNLSEYTNSASGPLEGVIRRDSPKFKDLVPNYNRDILFRDEEGTGADRLMSKRCKEKLNVLAYSVMNEWPGIRLLVTESWDEDY
HHGQESLHYEGRAVTIATSDRDQSKYGMLARLAVEAGFDWVSYVSRRHIYCSVKSDSSISSHVHGCFTPESTALLESGVRKPLGELSIGDRVLSMT
ANGQAVYSEVILFMDRNLEQMQNFVQLHTDGGAVLTVTPAHLVSVWQPESQKLTFVFADRIEEKNQVLVRDVETGELRPQRVVKVGSVRSKGVVAP
LTREGTIVVNSVAASCYAVINSQSLAHWGLAPMRLLSTLEAWLPAKEQLHSSPKVVSSAQQQNGIHWYANALYKVKDYVLPQSWRHD
41
>mouse_dhh
MALPASLLPLCCLALLALSAQSCGPGRGPVGRRRYVRKQLVPLLYKQFVPSMPERTLGASGPAEGRVTRGSERFRDLVPNYNPDIIFKDEENSGAD
RLMTERCKERVNALAIAVMNMWPGVRLRVTEGWDEDGHHAQDSLHYEGRALDITTSDRDRNKYGLLARLAVEAGFDWVYYESRNHIHVSVKADNSL
AVRAGGCFPGNATVRLRSGERKGLRELHRGDWVLAADAAGRVVPTPVLLFLDRDLQRRASFVAVETERPPRKLLLTPWHLVFAARGPAPAPGDFAP
VFARRLRAGDSVLAPGGDALQPARVARVAREEAVGVFAPLTAHGTLLVNDVLASCYAVLESHQWAHRAFAPLRLLHALGALLPGGAVQPTGMHWYS
RLLYRLAEELMG
>mouse_ishh
MSPAWLRPRLRFCLFLLLLLLVPAARGCGPGRVVGSRRRPPRKLVPLAYKQFSPNVPEKTLGASGRYEGKIARSSERFKELTPNYNPDIIFKDEEN
TGADRLMTQRCKDRLNSLAISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRNKYGLLARLAVEAGFDWVYYESKAHVHCSVKS
EHSAAAKTGGCFPAGAQVRLENGERVALSAVKPGDRVLAMGEDGTPTFSDVLIFLDREPNRLRAFQVIETQDPPRRLALTPAHLLFIADNHTEPAA
HFRATFASHVQPGQYVLVSGVPGLQPARVAAVSTHVALGSYAPLTRHGTLVVEDVVASCFAAVADHHLAQLAFWPLRLFPSLAWGSWTPSEGVHWY
PQMLYRLGRLLLEESTFHPLGMSGAGS
>mouse_shh
MLLLLARCFLVILASSLLVCPGLACGPGRGFGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSERFKELTPNYNPDIIFKDEENTGAD
RLMTQRCKDKLNALAISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRSKYGMLARLAVEAGFDWVYYESKAHIHCSVKAENSV
AAKSGGCFPGSATVHLEQGGTKLVKDLRPGDRVLAADDQGRLLYSDFLTFLDRDEGAKKVFYVIETLEPRERLLLTAAHLLFVAPHNDSGPTPGPS
ALFASRVRPGQRVYVVAERGGDRRLLPAAVHSVTLREEEAGAYAPLTAHGTILINRVLASCYAVIEEHSWAHRAFAPFRLAHALLAALAPARTDGG
GGGSIPAAQSATEARGAEPTAGIHWYSQLLYHIGTWLLDSETMHPLGMAVKSS
>xenopus_shh
MLVATQSLLLLSFICTLVTPPGLACGPGRGIGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSDCFKELTPNYNPDIMFKDEESTGAD
RLMTQRCKDKLNALAISVMNQWPGVKLRVTEGWDEDGHHLEESLHYEGRAVDITTSDRDRSKYGMLGRLAVEAGFDWVYYESKAHIHCSVKAENSV
AAKSGGCFPAGARVMVEFGGTKAVKDLRPGDRVLSSDPQGNLLYSDFLMFIDQERDVKKLFYVIETSQRKIRLTAAHLLFVAQTKVNGTRSFKSVF
ASNIQPGDLIYTADPKTMTLKAVKVEKVDLEEDTGAYAPLTAHGTVVIDQVLASCYAVIEEHTWAHLAFAPLRFGMSLSSYIYPRDSSPPSGLQPH
HQVDLQSHHQVDLQSHHQVDLQSHHQLEGIHWYSQLLYQIGTWLLDSNSLHPLGMATKSS
>xenopus_dhh
MPAVRIVILAICCGLLLVPVRCCGPGRGPVGRRRYMRKLVPLHYKQFVPNVPEKTLGASGKSEGKIHRGSERFIELVPNYNPDIIFKDEEKTGADR
LMTERCKDRVNALAISVMNMWPGVKLRVTEGWDEDGHHAHDSLHYEGRALDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHVSVKADNSLG
VRSGGCFPGTAMVMMGTGERKPLSELKIGDTVYTTDETGQLITSVVLLFLHRNPYKTATFVLIEAEGHPSKLLVTPNHLLFIQSSSSAGFLPFAYR
VQIGDLVQIYVNGTQVQSSKVVRVSLEEQTGVYAPMTEHGTLLVDGVLTSCYATVESHTLAHVSLAPLRLFQGIASMLPDLDMSDGVHWYCHILYV
LAKYVLWWDMP
>xenopus_ihh
MQLPKVVLLLCAAALLLSGAVRGCGPGRVVGRRRRPTKLSPLSYKQFSPNVPEKTLGASGRYEGKISRNSERFKELTPNYNPDIIFKDEEITGADR
LMTQRCKDRLNSLAISVMNQWPGVKLRVTEGWDEDGHHFEESLHYEGRAVDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHCSVKSEHSAA
AKTGGCFPGEALATLESGEKIPVSQLSPGLRVLAMDNSGRPTYSDFLSFLDHSPKEEHMFQVIKTQDPHRRLFLTPAHLIFVSDNYSTPASEFQAV
FASSVRPGQYILVSNVVGLIPAKVRSVNTQTNYGAYAPLTQHGTLVVDDVVVSCFALVQKQRLAQIVYWPLRVLYNLGIIAGTQPSQQMGIHWYSK
ALYHLGRLILHGNEFHPLGIVQLES
Hedgehog family members
>c_elegance_hh
MRAVLLTILILFKEVTGTSFLQTAAHAVRDFKLPAFSDTNGHACFSTDSWMTTPSGKKRMDQVGIGDLVLTGNLTAT
YYTPIITWMHREPENRYNFYTIMTEYGKMLAVSAKHLIYRNLCDENYAEYVKYLPKGRNVVYAEELKVGDCLVLLYK
GKFRQQRVMRISITERKGIYAPITKNGRIIVNDIVASVFSGIKHTRLQSDYYSTIAYAQSWLWIFGETVFHKATIPI
GSALASDVLRLVIP
42
>C_elegance_hh_2
MIFLLFTLSILSHVEAGSFKNIGLSTDNKHQSPCIWNQTHAWSHPYQSLIVECCDESLKDLLQNFIRQGK
AGSLGDLAKVIQRKAQLEFHASFEAIICKSNFAISTHYHGSQACKVHVENQYFLIYETPVQYDPFNMHME
NYLSSIDSSDPLGSTKPQGLRGGFKDHRDDVTAGENLSVQPDADNILQYPNRWSQQDAKEEIFTTEASIE
NAFVLGTNMSHLPDIAEIDLVGPVPVPKNFTNLRIRDRLPENTHCEKERRDGNKCCSGPLASTMRDAMSQ
MASSPDFGPGGEGIIANRIQHSVQHRFKSSYEVIVSRSDFMISTRSGEKICKFQSKGFYILAYATPKQYD
IEKVEEERKLADISILDPLGSMESNFPHEAPQNVQLLLESSGDRVGFPVGSHCLEEVRTGSKCCSIDMFN
AMNAAYNTHMASSYFNAYDIRNISKVVQWNVEEVFQHSAEVIVALDDFVYASHYNDSFTCKYRVDRYHIL
AYLTPDHNLDKRISEVEIPNQITPSPYWITPVPMTVHQQPMFNLQQNLLPYQLPTHFSSPFTYAFGRMKR
QIGTSPYPIHLSIFHDIGYAIPIFCPSTLTGLFGSIICDGGVAYDMIRIVEETRQQPGFDKHNSRAMAKM
ITRTMERRFDTTFDSIAAEADFAWKTQKFNGRVSKLYLGGYSALSFQSSPDPPPASDFVDVANDPTVDGP
VYTDREQEDDDNDDDDGGDDMSSTSTTTTTTIPPPFFALPVPPPPPVPPPPPPPFLTCFSRDTWVTTPSG
KKRMDEIEIGDYVLTADLKTALFSAITLWIHREPETVQEFLEIKTDNGKTLQLTAGHFIYATECRYLPSK
NSSLLNSTPERYRHLIDTLPDDSETKLASQLKIGECLLIHNGDQFRMQKIDSISKTVSTGIYSPLTENGR
ILVNDVLASCYSEVQQNVLQTTFFWAFDRLRNLIVQYFGDLYLDEIELPTGTSLYKEVLTLVIPIRK
DAN family members>zebrafish_dand5
MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVP
FRNSPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDM
NKQSCAAVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRG
SEVRERRVLIVEECKCETSSEEAKVQNTDMFNL
>zebrafish_gremlin-2
MFWKLAIPAILAWTLFASTETKKQRPQGSIPSPYKLKGNDLSSPSHALASLPQHTASARRQKGKHDMLSS
SREALVVTERKYLKSDWCKTQPLRQTVSLEGCISRTVINRFCYGQCNSFYIPRHLTSQSSHRSRKTASTP
DHTTSFQSCAFCRPSRITTVTVRLHCPGLQPPYRQRKVQRIKQCKCVSVNVNAAY
>zebrafish_gremlin-1
MGRFTDRFFSKISPGRSSSTLTVMPASCASSSGWILCAVLLSSALLWCPTESKRNRGAIPHPDKNTPNES
SRSPQQQESASGSRARSRGSEEVLESSQEALHVTERRYLKRDWCKTQPLKQTIHEEGCISRTIINRFCYG
QCNSFYIPRHVRREEGAFQSCSFCKPKRFTTMSFTLSCPDQQPPTRKKRVQRVKQCRCISIELD
>Human_gremlin-1
MSRTAYTVGALLLLLGTLLPAAEGKKKGSQGAIPPPDKAQHNDSEQTQSPQQPGSRNRGRGQGRGTAMPG
EEVLESSQEALHVTERKYLKRDWCKTQPLKQTIHEEGCNSRTIINRFCYGQCNSFYIPRHIRKEEGSFQS
CSFCKPKKFTTMMVTLNCPELQPPTKKKRVTRVKQCRCISIDLD
>Human_gremlin-2
MFWKLSLSLFLVAVLVKVAEARKNRPAGAIPSPYKDGSSNNSERWQHQIKEVLASSQEALVVTERKYLKS
DWCKTQPLRQTVSEEGCRSRTILNRFCYGQCNSFYIPRHVKKEEESFQSCAFCKPQRVTSVLVELECPGL
DPPFRLKKIQKVKQCRCMSVNLSDSDKQ
>Hman_cerberus
MHLLLFQLLVLLPLGKTTRHQDGRQNQSSLSPVLLPRNQRELPTGNHEEAEEKPDLFVAVPHLVATSPAG
EGQRQREKMLSRFGRFWKKPEREMHPSRDSDSEPFPPGTQSLIQPIDGMKMEKSPLREEAKKFWHHFMFR
KTPASQGVILPIKSHEVHWETCRTVPFSQTITHEGCEKVVVQNNLCFGKCGSVHFPGAAQHSHTSCSHCL
PAKFTTMHLPLNCTELSSVIKVVMLVEECQCKVKTEHEDGHILHAGSQDSFIPGVSA
43
>Human_dand5
MLLGQLSTLLCLLSGALPTGSGRPEPQSPRPQSWAAANQTWALGPGALPPLVPASALGSWKAFLGLQKAR
QLGMGRLQRGQDEVAAVTLPLNPQEVIQGMCKAVPFVQVFSRPGCSAIRLRNHLCFGHCSSLYIPGSDPT
PLVLCNSCMPARKRWAPVVLWCLTGSSASRRRVKISTMLIEGCHCSPKA
44
12 月 10 日 ( 第 10 回 )
実 習
代 謝 経 路 デ ー タ ベ ー ス の 利 用
無料で公開さ れ て い る 代 謝 経 路 の デ ー タ ベ ー ス と し て最も充実 し て い る の が 、京都大学 化 学
研究所が 統括し て い る KEGG (Kyoto Encyclopedia of Genes and Genomics) で あ る 。 代 謝 経 路
の マ ッ プ を 調 べ る こ と が できるだけ で なく、 遺 伝 子 の 機 能 、 配 列 、 タ ン パ ク 質 の立体構 造も検
索 できる 。 ク ロ ーニン グ し た 遺 伝 子 がどの ような 代 謝 経 路 で 機 能 し て い る か 、 あ る い は 代 謝異
常の メカニズ ム なども調 べ る こ と が できる 。
ま た さ ま ざ ま な 化 合 物 (抗生 物 質 等 )や市販の 医薬品の 構 造 、薬理 作 用 、副作 用 を 検 索 す る
こ ともできる 。 遺 伝 子や化 合 物 の 機 能や相互作 用 を 調 べ る場合 、 ま た レポー ト 作 成 等 にも役立
つ 。 日本語表記の サ イ トも利 用 できる 。
KEGG MEDICUS と名付け ら れ た 、 医薬品・疾患・ パ ス ウ ェ ー の 統 合 デ ー タ ベ ー スも公開さ
れ て い る 。疾患・ 医薬品・環境物 質 など社会的ニー ズ の高い デ ー タ を 、 ゲ ノ ム 情 報 を 基盤と し
た 生体シ ス テ ム 情 報 と い て 統 合 し た リ ソ ー ス で 、 研究者だけ で なく、 医 療従事者や一般の人に
も情 報 を 提供し て い る 。
KEGG ブ ラ ウ ザ : http://www.genome.jp/kegg/pathway.html
KEGG Pathway を開け て み よう。 パ ス ウ ェ ー の項目は 、以下ように 分類さ れ て い る 。
1. Metabolism ;代 謝 経 路 (ビタ ミ ン A, retinol metabolism, の 代 謝 経 路 を 調 べ て み よ
う。 代 謝産物 を 示 す が ア ク テ ィ ブ で 構 造 等 が表示 さ れ る 。 ま た 代 謝 を司る酵素名も◯ア ク テ ィ ブ で 、 配 列 情 報 等 が表示 さ れ る )
2. Genetic Information Processing ;遺 伝 子 か ら蛋白質 合 成 経 路 ・蛋白の修飾と 分
解 ・ ゲ ノ ム の修復 等 ( homologous recombination と non-homologous end-joining の 経 路
を比較し て み よう)
3. Environmental Information Processing ;細 胞 内 シ グ ナ ル 伝 達 経 路 ・ 分泌性 シ グ ナ
ル 因 子 を介し た 細 胞間相互作 用 ( TGF-beta の 細 胞 内 伝 達 系 を 調 べ て み よう。 発現の促
進 と抑制( アゴニス ト ) の 関 係 が 分 か る )
4. Cellular Processes : 細 胞 の活動 、 細 胞 分裂サ イ ク ル 等 ( Oocyte meiosis (卵母細
胞減数分裂) を 調 べ て み よう)
5. Organismal system;免疫系 ・ 内 分泌制御経 路 等 ( GnRH 、 生殖腺刺激ホ ル モ ン放
出 ホ ル モ ン 、 の 内 分泌経 路 を 調 べ て み よう)
6. Human Deseases : 発 ガ ン 経 路 ・ 代 謝異常等 ( Melanoma, プ リ オ ン病 , diabetes( 1型糖尿病、 2 型糖尿病) の 発症経 路 を 調 べ て み よう)
7. Drug Development :抗生 物 質 ・薬剤の 化 学 構 造 ( penicillin, antidepressants を 調 べ
て み よう。 合 成 経 路 、薬剤の 分 解酵素等も表示 さ れ る )
45
遺 伝 子 の キ ー ワ ー ド で パ ス ウ ェ ー を 検 索 す る時の操作 は下記の 通 り ( 遺 伝 子名か ら パ ス
ウ ェ ー に入る )
練習 に hh; hedgehog の シ グ ナ ル パ ス ウ ェ ー を 見 よう
1. 先頭ペ ー ジ で KEGG PATHWAT を ク リ ッ ク
2. 枠に hedgehog を入力し て GO3 . hedgehog が 関与す る パ ス ウ ェ ー ( Entry ) が 複数表示 さ れ る
4. 試し に map04340 を選択し て み よう。
5. パ ス ウ ェ ー が拡大さ れ る 。 各 遺 伝 子 が ア ク テ ィ ブ で 、 配 列 ・ 機 能 情 報 に リ
ン ク し て い る 。
6. 上の HEDGEHOG SIGNALLING PATHWAY を選択す る と 、 こ の シ グ ナ ル の 説 明
を 見 る こ と が できる 。
練習 に estradiol の 合 成 経 路 を 調 べ て み よう
1. 先頭ペ ー ジ で KEGG PATHWAT を ク リ ッ ク
2. 枠に estradiol を入力し て GO3 . estradiol が 関与す る パ ス ウ ェ ー ( Entry ) が 複数表示 さ れ る
4 . Steroid hormone biosynthesis を あ け る と cholesterol か ら の 合 成 経 路 を 見 ら
れ る
5. 反応 を 触媒す る酵素名が ア ク テ ィ ブ で反応 系 、 配 列 等 の 情 報 を 見 る こ と が
できる
6. ま た 各 代 謝産物 の 化 学 構 造も表示 できる
遺 伝 子 の 化 合 物 の 構 造 を 検 索 す る時の操作 は下記の 通 り
練習 に ampicillin の 構 造 を 調 べ て み よう
1. 先頭ペ ー ジ で KEGG DRUG を ク リ ッ ク
2. 枠に ampicillinを入力し て GO3 . Entry を選択す る と 構 造 等 が 見 ら れ る
12 月 3 日 ( 第 9 回 )
KEGG の BLAST検 索 を 使 っ て 、 調 べ た い 遺 伝 子 ・ タ ン パ ク 質 が乗っ て い る パ ス ウ ェ ー を 検
索 す る こ ともできる .1. KEGG2 先頭ペ ー ジ上段の GENES を ク リ ッ ク 。 BLAST を開け る 。
2 . 例と し て 、下の 塩 基 配 列 (私達 の 研究グ ル ー プ が ウ ナギか ら ク ロ ーニン グ し
た 遺 伝 子 で まだデ ー タ ベ ー ス に は登録し て い な い ) で BLASTX 検 索 し て み よ
う
>test_DNA_sequence-2
ATCACTGCGTCTTGTGTCCTATCGGTCTAGCCTAGCCACTGTCTANAAGCTATAGGAAGGTTTCAGTATTGGGAGCCATGTTTGGGAGC
CTGCTGTTCACTGTGCTGTGTGAGGCAGCAGTGGCCCTCATCAACCCAAATCTAAGCCTCCATTGGGAGATGTGGAAGGAGGGACATGA
CAAGACCTACCTGTTTAAGGCTGAAGAGTTTGCACGCCGCCAGATCTGGGAGAAGAACCTGAAGCTGATAACTCTGCATAATTTGGAGG
CGTCCATGGGAATGCACACCTATGATCTGGGCATGAACCACCTAGGAGACTTGACTACCGAGGAGATTCTTGACGTGCTAGCTGTAACT
CGTGTGCCTCCAAACTTCAGCAGGGGTCCTTCTCCCTTTGTGGGGGTATCCAGGGCCCCTGTGCCTCACAATGTTGATTGGCGAAGAAA
46
GGGCTATGTCACAGAAGTCAAGAGTCAGGGGCGTTGTGGCTCCTGCTGGGCCTTCAGTGCTGCAGGTGCCCTGGAGGGCCAGCTGATGA
AGACTCAGGGAACACTTGTATCCCTCAGCCCTCAGAACCTGGTTGACTGCTCCTACAAATATGGCAACGAGGGCTGTCATGGAGGGTTC
ATGACTCAAGCCTTCCAGTATGTCATTGAGAACGGGGGCATTGAGTCTGACTTTTCATACCCTTACACTGGCATGGAAGAACAATGCAG
ATATGATTCAGAACTCCGTGTTGCCAACTGTTCCAGCTACAGGTTTCTTCCTGAAGGTGATGAGGTTGCATTAAAATGGGCTCTGGCCA
CTGTTGGACCAATCTCTGTGGCTATTGATGCTGCTCGACCTAATTTCCACTTCTACCGGAGTGGTGTGTACCATGACCCTACCTGTACC
CAAGAAGTAAACCATGGTGTTCTAGCAGTTGGCTATGGTACGCTCAATGGTGAGGACTACTGGCTTGTGAAGAACAGCTGGGGACAGCC
TTTTGGGGAACAGGGCTACATTCGCATGGCACGAAACAAGAACAACCAGTGTGGCGTTGCCTTGTATGCCTGCTACCCCATTATGTGAC
GACCTGAAGCAAAGGATTGATTTCTAACTTGAAACATTTTAAAATTTTTATTTTGATTTGCACCTGTGCATGTTACTGATTTGTAAAGA
ATACTGTTAAAATGATTTGTATTAAAAAAATATATATTTTTAGATGTGGAATTTTAGTTGAACCTAAATAAATAAATGTAAAAAAAAA
1. ゼブ ラ フ ィ ッ シュDre の エ ン ト リ ー を開け て み よう
2 . Pathway を開け て み よう。 検 索 し た 遺 伝 子 の パ ス ウ ェ ー上の 位置が 分 か る
KEGG MEDICUS利 用 できる サ ービス
・ KEGG MEDICUS 医薬品情 報
・ KEGG MEDICUS 疾患情 報
・ KEGG MEDICUS 医薬品相互作 用
・ KEGG BRITE 医薬品分類
・ KEGG お薬情 報
・ KEGG 先頭ペ ー ジ上段で 、 MEDICUS を選択
・ Imatinib と言う医薬品で キ ー ワ ー ド 検 索 し て み よう
・効果 、 製 造会社、 化 学 構 造 等 を知る こ と が できる :
講 義 : 論文の 構 成 、文献デ ー タ ベ ー ス
1. 実 習 :文献検 索 ( PubMed )
講 義
配 列 情 報 と文献の 検 索
研究計 画 を立て る場合 、その 研究に 関 連 し た過去の 論文を リ ス ト ア ッ プ し て 、既に 報告さ れ
て い る 成 果 を 調 べ ておくこ と が大変 重 要 で す 。 こ の操作 に よ り 、 こ れ か ら 進める 研究テ ー マ に
つ い て 、 研究がどこ ま で 進んで い る の か 、何が 分 か っ て い な い の か を 調 べ る訳で す 。そし て未
知の 生 物現象を 解 明 す る の に 、最も有効な 計 画 を立案し ま す 。もちろん研究で 遺 伝 子 を扱う場
合 、その 遺 伝 子 の 配 列 、 こ れ ま で に 分 か っ て い る 性 質 を 調 べ ておくこ とも重 要 で す 。 こ の 検 索
操作 をちゃんと し ておか な い と 、 「せっ かく得ら れ た 実験成 果 が既に 報告さ れ て い た 」 と言う
ような悲惨な こ とも起きかねません。
ま た卒業 論文や投稿用 論文の 作 成時に は 、緒言に 研究の 歴 史 と背景、 研究内容の意義 を述べ 、
47
考察で は 実験結 果 と既知の 成 果 を比較検討し 、 研究で得ら れ た新し い知見 に つ い て議論 し ま す 。
論文を仕上げる時にも、 関 連 論文を収集 し て精査す る必要 が あ り ま す 。文献以外にも、 ク ロ ー
ニン グ し た 遺 伝 子 と 関 連 遺 伝 子 と の ア ラ イ メ ン ト を行うこ とや、 分 子 系 統 樹 を 作 成 す る の に 関
連 遺 伝 子 を デ ー タ ベ ー ス か ら引き出 し てくる こ と が必要 と な る こ と が あ り ま す 。
例えば、自分 の 研究で ウ シやブ タ などの家畜、 あ る い は 作 物 で 遺 伝 子 を ク ロ ーニン グ し た と
し ま す 。 遺 伝 子 機 能 に 関 す る 研究が 進んだ現在で は 、 モ デ ル 生 物 ( マ ウ ス 、ニワ ト リ 、ゼブ ラ
フ ィ シュ、 シ ョ ウ ジ ョ ウ バ エ 、線虫、酵母、 シ ロ イ ズ ナ ズ ナ 等 ) のどれ か で相同遺 伝 子 の 機 能
が 解 析 さ れ 、 論文の形で 出版さ れ て い る こ と が 多 い と言えま す 。その 論文を 読めば、 ク ロ ーニ
ン グ し た 遺 伝 子 の持つ 機 能 の 概 要 を知る こ と が できま す 。 デ ー タ ベ ー ス を 利 用 す れば、 こ の様
な 情 報も簡単に収集 できま す 。 遺 伝 子 を BLAST 検 索 し 、 モ デ ル 生 物 の相同性 の高い 遺 伝 子 配 列
を探し 、そこ か ら文献情 報 を探す こ と が 可 能 で す 。
今日 は 、 研究計 画 を立て る時や論文を書く際 、 ク ロ ーニン グ さ れ た 遺 伝 子 に 関 連 す る 論文の
検 索 、 研究や論文作 成 で必要 な 論文の 検 索 方 法 を 実 習 し ま す 。
文献の 検 索 に は 、 ( 1 ) NCBIの PuBMed 、 ( 2 )大学 の 図書館の オ ン ラ イ ン ジャー ナ ル 、
( 3 ) Scopus( Elsevier 社の有料検 索 シ ス テ ム ) が 利 用 できま す 。 PuBMed の 使 い勝手が最近
非常に よくな っ た の で 、ほとんどの こ と は PuBMed で す み ま す 。従っ て 、 PuBMed の 使 い 方 を
中心に 演 習 し 、大学 の 図書館の オ ン ラ イ ン ジャー ナ ル に つ い て少し 解 説 を 加えま す 。
文献検 索 を 使う目的 に は 、下記の ように幾つ か の シ チュエ ー シ ョ ン に 分 か れ ま す 。 いずれも
PuBMed で 可 能 で す 。
1. 特 定 の 論文をダウ ン ロ ー ド し た い 。
2. あ る 研究者がどの ような 論文を 出版し て い る か知り た い
3. あ る 生 物現象に 関 す る 論文をもれ なく調 べ た い 。
4. 作 成中の 論文の考察に必要 な 論文を探し た い
5. 扱う遺 伝 子 に 関 連 す る 論文を 調 べ た い 。
実 習
文献の 検 索
使 用 す る ウ ェ ブ サ イ ト : NCBI使 用 す る ア イ テ ム : PubMed 上の枠の下に あ る Advanced ボタ ン を 使う。
左の All Fields ボタ ン を ク リ ッ ク す る と 、 著者名、 出版年度 、 タ イ ト ル中の ワ ー ド 、
Abstract中の ワ ー ド 、 Journal (雑誌)名で 検 索 できる シ ス テ ム に な っ て い る 。 こ れ
ら をうまく使うと必要 な文献をうまく検 索 す る こ と が 可 能 で あ る 。それぞれ に つ い て
授 業 で は 実 習 し ま す 。東北大学 図書館が購読契約し て い る雑誌、 あ る は Plos One の よ
うな on-line journal で あ れば、 検 索 結 果 の ペ ー ジ か ら 論文の pdf ファイ ル を と りだし て 、
48
プ リ ン トやダウ ン ロ ー ド が できま す 。
1. 特 定 の 論文をダウ ン ロ ー ド し た い 。
例えば、山中先生 が ノ ー ベ ル賞をもらうこ と に な っ た iPS 細 胞 の 論文を探し て み よ
う。
Author: Yamanaka ShinyaJournal: Cell
2. あ る 研究者がどの ような 論文を 出版し て い る か知り た い
例えば、私と 研究室の助教の横井さんの共著論文を探し て み よう。
Author: Suzuki TohruAuthor: Yokoi Hayato
3. あ る 生 物現象に 関 す る 論文をもれ なく調 べ た い 。 論文の考察に 関 連 す る 論文を探し た い 。
例えば、魚類の iPS 細 胞 に 関 す る 論文が 出版さ れ て い る か ?
Title/Abstract: FishTitle/Abstract: iPS cell
成長ホ ル モ ン の 日周リ ズ ム に 関 す る 論文を知り た い
Title/Abstract: growth hormoneTitle/Abstract: circadian rhythm
4. 扱う遺 伝 子 に 関 連 す る 論文を 調 べ た い 。
例えば、癌遺 伝 子 Brca2 に 関 す る 論文を 調 べ た い 。
Title/Abstract: Brca2Title/Abstract: human or mouse or zebrafish
BLAST 検 索 結 果 か ら 、 検 索 し た 遺 伝 子 に 関 す る文献情 報 を収集 す る こ ともできま す 。 リ ス ト
ア ッ プ さ れ てきた 遺 伝 子 の名称が ア ク テ ィ ブ で 、それ を ク リ ッ ク す る と 配 列 情 報 に 加えて 、
PUBMED の番号を添えた形で 関 連 の 論文もリ ス ト ア ッ プ さ れ て い ま す 。 PUBMED 番号を ク リ ッ
ク す る と文献情 報 に入る こ と が できま す 。
test_sequence-1 で試し て み よう。
>test_sequence-1(zebrafish_charon)_peptide
MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFP
AFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETV
TVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLI
「 電 子 ジャー ナ ル 」 へ の ア ク セ ス の 方 法
東北大学 ホ ー ム ペ ー ジ→東北大学付属図書館→電 子 ジャー ナ ル リ ス ト ( 学 内者限定 )→
雑誌名の キ ー ワ ー ド 検 索 OR ア ル ファベ ッ ト順で 検 索→ volume, page 入力・ 検 索
49
EndNote文献の ラ イ ブ ラ リ ー の 作 成 、 論文へ の文献の引用 、文献リ ス ト の 作 成 に は 、 EndNote が
広く使われ て い ま す 。市販品は 6 万円程度で か な り高価で す が 、 論文を書く人に は必携
で す 。
短期間で あ れば、試供品が 使えま す 。 ま た 機 能 は か な り 製薬さ れ て い ま す が 、無料版も
公開さ れ て い ま す 。
Impact factor科学 分野毎に 、 複数の Journal が 出版さ れ て い ま す 。どれだけ Journal 内 の 論文が 、他の 論
文に よ っ て引用 さ れ て い る か 、 す なわち引用 回数に よ っ て 、 Journal の評価が 分 か れ ま す 。
それ ら を数値化 し たもの に Impact factor が あ り ま す 。 Impact factor は 、 「大学 図書館」
の 「 デ ー タ ベ ー ス 」 に あ る 「 InCites Journal Citation Reports (JSR) 」 で 、 調 べ る こ と が
できま す 。
50
12 月 17 日 ( 第 11 回 )
12 月 24 日 ( 第 12 回 )
酒井先生 が下記の 内容で 授 業 を行い ま す 。
配 列 の ア ラ イ ン メ ン ト手法 とBLAST検 索 の 原 理
・ 配 列 の ア ラ イ ン メ ン ト と は
・ 全域ア ラ イ ン メ ン ト と局所ア ラ イ ン メ ン ト
・ ア ミ ノ 酸置換行列
・ 動 的 計 画 法 に 基づく局所ア ラ イ ン メ ン ト の求め方
・BLASTはどの ように 検 索 を行っ て い る の か
( 動 的 計 画 法 と の違い と 、それ に ともなう利 点 、問題 点 )
進 化 系 統 樹 とCLASTAL Wで 用 い ら れ て い る近隣結 合 法 の 原 理
・ 種 の 進 化 モ デ ル
・ 分 子時計仮説
・ ウ ル ト ラ メ ト リ ッ ク木と 加 法木
・UPGMA法
・近隣結 合 法
以上に つ い て 概 説 す る 。
講
51
1 月 7 日 ( 第 13 回 )
バ イ オ デ ー タ ベ ー ス の 利 用
遺 伝 子 の 機 能 を知り た い場合 に は 、ポス ト ゲ ノ ム の モ デ ル 生 物 ( マ ウ ス 、ゼブ ラ フ ィ ッ シュ、
シ ロ イ ズ ナ ズ ナ 等 ) の 検 索 サ イ ト が 重宝し ま す 。 こ れ ら は 、 バ イ オ デ ー タ ベ ー ス と呼ばれ ま す 。
モ デ ル 生 物 の な か でも、 特 に マ ウ ス とゼブ ラ フ ィ ッ シュの デ ー タ ベ ー ス が充実 し ており 、 遺 伝
子 の 機 能だけ で なく発現パ タ ー ン ( 遺 伝 子 が何時、どの組織で 、どれだけ の 量 が 発現す る か ) 、
遺 伝 子 ノ ッ ク ア ウ トやノ ッ クダウ ン の表現型もデ ー タ ベ ー ス 化 さ れ ており 、 遺 伝 子名の キ ー
ワ ー ド 検 索 で デ ー タ を入手す る こ と が 可 能 で す 。
ヒ ト の 遺 伝 子 機 能 と 遺 伝 子 疾 患 の デ ー タ ベ ー ス と し て NCBIに OMIM ( Online Menderian Inheritance in Man ) が公開さ れ て い ま す 。 遺 伝 子名で キ ー ワ ー ド 検 索 す る と 、 遺 伝 子 の 機 能 、
遺 伝 子疾患が存在す る場合 に は 、 配 列 変異と疾患の表現型を知る こ と が 可 能 で す 。
マ ウ ス の デ ー タ ベ ー ス ( MGI: mouse genome informatics ) の 特徴と し て 、 遺 伝 子ごと に ノ ッ
ク ア ウ ト マ ウ ス の表現型が デ ー タ ベ ー ス 化 さ れ ており 、表現型か ら 遺 伝 子 の 機 能 を 調 べ る こ と
が できま す 。 マ ウ ス の デ ー タ ベ ー ス で は 、 遺 伝 子 の正確な マ ッ プポジ シ ョ ン ( 連 鎖 地 図 、 ゲ ノ
ム 配 列上) 等も示 さ れ て い ま す 。
ゼブ ラ フ ィ ッ シュの デ ー タ ベ ー ス ( ZFIN: zebrafish Organism Data Base ) に は 、 in situ ハイ
ブ リダイゼー シ ョ ン に よ る 発現解 析 の デ ー タ が 写真で掲載さ れ ており 、 遺 伝 子 発現に 関 す る組
織レ ベ ル の 情 報 を得る こ と が できる 特徴が あ り ま す 。脊椎動 物中で あ ればオ ル ソ ロ グ 遺 伝 子
(異な る 生 物 の同一 遺 伝 子 ) の 発現パ タ ー ン は類似し て い る こ と が 多 い の で 、 マ ウ ス 、 ウ シや
ニワ ト リ を 研究対象に す る場合 でも参考と な り ま す 。
論文や単行書を 読んで 機 能 が 分 か ら な い 遺 伝 子 ( タ ン パ ク 質 ) が で てきた時に は 、それ ら の
遺 伝 子 の 機 能 を 調 べ る 必 要 が あ り ま す 。 こ の よ う な と き に は NCBI の OMIM (Online Mendelian Inheritance in Man) と マ ウ ス ・ゼブ ラ フ ィ ッ シュの ウ ェ ブ サ イ ト を 使うと 情 報 を
得る こ と が できま す 。 授 業 で は 、 こ れ ら の サ イ ト の 使 い 方 と 特徴に つ い て 説 明 し ま す 。
OMIM の 使 い 方
ヒ ト で 分 か っ て い る 遺 伝 子 の 機 能 を詳細 に記述し て い る 。 関 連文献もリ ス と さ れ て い る 。
る
1. NCBIを開け 、左上の All List (A-Z)か ら Online Menderian Inheritance in Man (OMIM) を選択
す る 。
2 . 枠内 に 遺 伝 子名を入力し て 検 索
練習 に growth hormone ( 成長ホ ル モ ン ) を 検 索 し て み よう
growth hormone 遺 伝 子および関 連 遺 伝 子 の 配 列 変異に よ っ て起こ る症候群の リ ス ト が表
記さ れ る 。 遺 伝 子 の 機 能 、 変異に伴う疾患、 タ ン パ ク 質 の 構 造 、 関 連 論文を 調 べ る こ と
が できる 。
52
MGI, ZFIN の 使 い 方
ポス ト ゲ ノ ム 研究の モ デ ル 生 物 の ウ ェ ブ サ イ ト を 利 用 し て み よう。 こ れ ま で の 研究に よ っ て 明
ら か に さ れ て い る 遺 伝 子 の 機 能 が 検 索 できる 。
マ ウ ス ( MGI )
mouse genome informatics : http://www.informatics.jax.org/ 1 . 先頭ペ ー ジ の QuickSearch の枠内 に 遺 伝 子名を入力す る
2 . 入力し た 遺 伝 子 の 情 報 、 遺 伝 子改変 マ ウ ス が リ ス ト さ れ る
試し に Pax6 (眼の 発 生 の上流に あ る 転 写 因 子 ) を入力し て み よう
Pax6と言うワ ー ド を含む遺 伝 子 リ ス ト が表示 さ れ る 。 Pax6 を選択す る
得ら れ る 情 報
Symbol/Name/ID : 遺 伝 子 の正式名称、略記
Synonyms :同義語(別名)
Genetic map : 遺 伝 子 の 連 鎖 地 図上の 位置
Sequence Map : 遺 伝 子 の 物 理 地 図上の 位置
Mammalian Homology :哺乳類の相同・類似遺 伝 子
Sequences : ゲ ノ ム 塩 基 配 列 ・ cDNA 塩 基 配 列 ・ ア ミ ノ 酸 配 列 情 報
Phenotypes; ノ ッ ク ア ウ ト マ ウ ス の表現型。 遺 伝 子 の 生 物 機 能 が 分 か る
Polymorphism: 系 統間で 見 ら れ る 配 列 多型。 SNPs ( 1 塩 基 多型) 等
Gene Ontology (GO) : 遺 伝 子 の 機 能 、 構 造
Expression : 発現す る組織の リ ス ト
Protein Domains : 転 写産物 が持つ ド メ イ ン 構 造 の リ ス ト
References : 関 連文献
ゼブ ラ フ ィ ッ シュ( ZFIN)
The Zebrafish Model Organism Database : http://zfin.org/ 1 . Genes/Makers/Clones を開け る
2 . Name/Symbol に 遺 伝 子名を入力し て 検 索
試し に pax6 と入力し て 検 索 し て み よう。
魚類で単独に起こ っ た ゲ ノ ム 重 複 の ため pax6a と pax6b が あ る
Symbol-name で は 遺 伝 子 の 各 種 情 報 が表記さ れ る
Expression で は 、 遺 伝 子 発現の デ ー タ が表記さ れ る
Phenotypeで は 、 ノ ッ クダウ ン と ノ ッ ク ア ウ ト の表現型が表記さ れ る
Locationで は 、染色体上の 位置が表記さ れ る
53
1 月 14 日 ( 第 14 回 )
講 義
次 世 代 シ ー ケ ン ス で 読 み 取 ら れ た リ ー ド の 情 報 処 理
ト ラ ン ス ク リ プ ト ー ム 解 析 ( RNA配 列 の 解 析 )
ゲ ノ ム シ ー ケ ン ス
HiSeq2000 だと 一 つ の リ ー ド長は 100bp 、 HiSeq2500 だと 125bp で 、依頼解 析 に 出 す と 、 1サ ン プ ル あ た りギガ オ ーダー の リ ー ド が USB に コピー さ れ て送ら れ てきま す 。 日本で は 、 次 世
代 シ ー ケ ン ス 解 析 を広く普及す る ために 、 遺 伝 学 研究所に よ り 、 次 世 代 シ ー ケ ン ス の リ ー ド を
情 報 処 理 す る プ ロ グ ラ ム (Pipeline) が 、 ウ ェ ブ上で無料で 利 用 できる ように 整備さ れ て い ま す 。
有料の プ ロ グ ラ ム の場合 、半年契約で 50 万円あ ま り と高額で す 。 解 析 は 、大型コ ンピュー
タ ー が必要 な の で 、 ク ラ ウ ド シ ス テ ム で 、 配 列 を Pipeline で送り 、 遺 伝 研 の コ ンピュー タ ー で
情 報 処 理 さ れ 、数日後に 解 析 デ ー タ が送ら れ てくる シ ス テ ム に な っ て い ま す 。
シ ー ケ ン ス の サ ン プ ル は 、 ゲ ノ ム DNA の場合 と組織・ 細 胞 に 発現す る mRNA(cDNA) に大別さ
れ ま す 。 ま た 、 解 析 の対象生 物 は 、参照ゲ ノ ム の あ る 生 物 、新規に シ ー ク エ ン ス す る 生 物 に 分
か れ ま す 。参照ゲ ノ ム の あ る 生 物 で は 、 ゲ ノ ム 配 列 の デ ー タ ベ ー ス とcDNA の デ ー タ ベ ー ス が
準備さ れ て い る の で 、 ゲ ノ ム DNA 、 RNA の リ ー ド ともに参照配 列 に直接マ ッ プ す る こ と が でき
ま す 。 ゲ ノ ム DNA で あ れば、 サ ン プ ル間で 、 SNP や配 列 の挿入・欠損を 見 いだす こ と が 可 能 で
す ( ゲ ノ ム リ シ ー ケ ン ス ) 。 RNA で あ れば、 各cDNA に マ ッ プ さ れ る リ ー ド数をカウ ン ト と し
て 、 サ ン プ ル間で比較す る こ と に よ り 、組織に 発現す る 全 遺 伝 子 を同定 す る と ともに 、 サ ン プ
ル間で現量 を比較す る こ と が 可 能 で す ( ト ラ ン ス ク リ プ ト ー ム 解 析 ) 。
参照ゲ ノ ム の な い 生 物 の場合 、 リ ー ド を 一度、 ア セ ン ブ ル す る必要 が あ り ま す 。 こ れも遺 伝
研 の Pipeline で 実行できま す 。 ゲ ノ ム の場合 、現在だと HiSeq2500 の リ ー ド を繋いだ
Contig に 、 PacBio の 次 世 代 シ ー ケ ン ス 解 析 の リ ー ド ( 約 10kb) を併用 す る こ と で か な り長い
Scaffold に ま で つ なぎ合わす こ と が 可 能 で す (de novo ゲ ノ ム シ ー ケ ン ス ) 。 RNA の場合 、 リ ー
ド を ア セ ン ブ ル し て得ら れ る Contig が コ ー ド す る 遺 伝 子 を BLASTX に よ り同定 し ま す が 、 こ の
操作も Pipeline の Maser が 解 析 し てくれ ま す 。 さ ら に KEGG の 代 謝 パ ス ウ ェ ー へ の GO(gene ontology)ア ノ テ ー シ ョ ンも同時に 実行し てくれ ま す 。
次 世 代 シ ー ケ ン ス を 使 っ た ゲ ノ ム シ ー ク エ ン ス に よ り 、 こ れ ま で の 連 鎖 解 析 で は同定困難で
あ っ た疾患や形質 の 原 因 遺 伝 子 を 見 つ け 出 す こ と が 可 能 と な っ て い ま す 。最近の 報告例を 使 っ
て 、紹介し ま す 。
Whole genome association study (WGAS)コ ン ト ロ ー ル群と 実験群(表現形質 :例えば左利き) で 、 全 ゲ ノ ム にわた っ て SNP の
出現頻度を比較す る 。表現型の責任遺 伝 子近傍の SNP で は表現型集団で 一致度が高くな
る の で 、それ を 検 出 す る こ と で責任遺 伝 子 の ゲ ノ ム上の 位置を 特 定 す る 。
Exome 解 析
メ ン デ ル 遺 伝 す る 1 遺 伝 子 に よ る レ ア な 遺 伝 子疾患の場合 、 コ ー ド領域の 変異に よ り
54
ア ミ ノ 酸 の置換 が起こ っ て い る こ と が 多 い 。 こ の 技 術 で は 、 ゲ ノ ム の エ ク ソ ン の み 配 列
を 解 読 す る こ と で 、患者に 特異的 な 塩 基置換 、 InDelを 検 出 す る こ と で 、 遺 伝 子疾患の
責任遺 伝 子 を 特 定 す る 。総エ ク ソ ン の 塩 基 配 列 は 、 ゲ ノ ム の 1 %程度な の で 、 解 析 量 が
少なくて すむ。場合 に よ っ て は 、 5 名程度の患者を 解 析 す るだけ で 、 原 遺 伝 子 が 特 定 さ
れ る例もあ る 。
Rad-Seq ゲ ノ ム を 特 定 の制限酵素で消化 し 、消化断片の末端を 次 世 代 シ ー ケ ン ス で 解 析 し 、
SNAP を 検 出 す る 。 通常の NGS ゲ ノ ム 解 読 で は ラ ンダム に断片化 す る の で 、 集団間で
リ ー ド を直接比較す る こ と は不可 能 で あ る の に対し 、 Rad-Seq の場合 に は 、制限酵素の
切り口がそろっ て い る の で 、 ゲ ノ ム 全体にわた っ て リ ー ド を高速か つ間便に 系 統間で す
る こ と が 可 能 で あ る 。 農林水産で の品種 の 解 析 に有効だと思われ る 。
講 義ポス ト ゲ ノ ム 研究
様々な 生 物 の ゲ ノ ム 配 列 が 解 読 さ れ る ように な り 、 ゲ ノ ム 配 列 を 使 っ た新し い 研究が ス タ ー
ト し て い ま す 。 ゲ ノ ム 配 列 が 利 用 できる と言う前 提 のもと に始ま る 研究がポス ト ゲ ノ ム 研究で
す 。その 内容は 、 遺 伝 子 の 機 能 解 析 、 生 物 進 化 、 遺 伝 子疾患の 原 因 遺 伝 子 の探索 など多岐にわ
た り ま す 。 こ の 授 業 で は 、時間の 関 係 か ら 「 生 物 進 化 と ゲ ノ ム 」 の トピッ ク ス に つ い てだけ紹
介し ま す 。
ポス ト ゲ ノ ム 研究- 1
比較ゲ ノ ム 学 : 進 化 に伴うゲ ノ ム 構 造 の 変 化
進 化 的 に隔た っ た 多様な 生 物 で ゲ ノ ム 解 読 が行われ た こ と に よ り 、 種 内 の パ ラ ロ グ の 検
索 、 ま た異な る 生 物間で オ ル ソ ロ グ を比較す る こ と 、 遺 伝 子 ファミ リ ー の メ ン バ ー を比較
す る こ と が 可 能 に な り ま し た 。 ま た染色体上の 遺 伝 子 の 配 列 を 系 統 的 に離れ た 生 物間で比
較す る こ と に よ り 、それ ら の共通祖先生 物 の染色体構 造 を推定 す る こ と が 可 能 と な っ て い
ま す 。比較ゲ ノ ム は 、 こ の ように 生 物間で ゲ ノ ム を比較し て 、 進 化 を 論じる 研究分野で す 。
授 業 で は 、哺乳類と魚類の比較ゲ ノ ム を紹介し ま す 。
フ グ と ヒ ト は 、 進 化 的観点 か ら 見 る と脊椎動 物 系 統 樹 の両端に 位置し ま す 。脊椎動 物 は 、
大部 分 の魚類を含む条鰭類、それ と シ ー ラカン ス ・肺魚および四肢動 物 を含む総鰭類の 2
つ の グ ル ー プ に大別さ れ ま す 。条鰭類と総鰭類は4億5千年前 に 分岐し ま し た 。 フ グ と ヒ
ト の ゲ ノ ム 構 造 を比較す る こ と に よ り 、4億 5 千年前 に 生きて い た総鰭類と条鰭類の共通
祖先(もちろん現存し な い ) の ゲ ノ ム 構 造 が 明 ら か と な り 、その後の ゲ ノ ム 構 造 の 変 化 が
解 明 さ れ ま し た 。 解 析 の 結 果 、脊椎動 物 の ゲ ノ ム の 進 化 に つ い て 、 次 の ような 予想もさ れ
て い な か っ た 結 果 が得ら れ ま し た 。
( 1 ) 4億 5 千年前 に 生きて い た総鰭類と条鰭類の共通祖先は 1 2組の染色体を
持っ て い た 。
( 2 ) 総鰭類で は条鰭類と 分 か れ た直後に 、 ゲ ノ ム に大量 の レ ト ロ ウ ィ ル ス が挿
入さ れ 、 ゲ ノ ム サ イ ズ が大きくな っ た 。その後染色体間の 転移と融合 ( ミ キ シ ン
55
グ ) が頻繁に起こ っ た 。
(3) 条鰭類で は総鰭類と 分 か れ た直後に 、 ゲ ノ ム の倍化 (脊椎動 物 の誕生 か ら
数える と3度目) が起こ っ た 。 重 複 し た 遺 伝 子 の大部 分 は片方 が ゲ ノ ム か ら脱落し
た が 、約 20 %の 遺 伝 子 は倍加 し た ま ま現在でも機 能 遺 伝 子 と し て働い て い る 。そ
の ため、 ゲ ノ ム上の 遺 伝 子数は条鰭類の 方 が総鰭類よ りも 20 %程多 い 。 こ の よう
な 遺 伝 子数の 増 加 が 、魚類に形態や環境適応 の 多様性 をもた ら し た の で は な い か と
考えら れ て い る 。 ま た条鰭類で は染色体へ の レ ト ロ ウ ィ ル ス の挿入はわずか で あ り 、
染色体の ミ キ シ ン グもわずか で あ る 。
ま た 、無脊椎動 物 でも進 化 的 に 重 要 な 位置に あ る ホヤやナ メ ク ジ ウ オ の ゲ ノ ム 解 読 が行
われ 、哺乳類でも多数の 生 物 の ゲ ノ ム が 解 読 さ れ て い ま す 。 生 物間で ゲ ノ ム を比較す る こ
と に よ り 、臭覚受容遺 伝 子 が無脊椎動 物 か ら脊椎動 物 の 進 化 の過程で 遺 伝 子数を 増 加 し て
きた こ と が 、 明 ら か に な っ て い ま す 。 ま た胎盤の 進 化 で は 、 レ ト ロ ト ラ ン スポゾン由来の
遺 伝 子 が 重 要 な役割を 果 た し て い る と いう、意外な事実も示唆さ れ て い ま す 。 ま た ヒ ト と
チ ン パ ン ジ ー で は 、 塩 基 の置換率は た っ た 1.23%で す が 、反復 配 列 の挿入が ヒ ト の 方 が か
な り 多 い こ と が 分 か り ま し た 。 こ の ように挿入配 列 は 、以前考えら れ て い た ような たんな
る ガ ラ ク タ で は な い こ と が 分 か っ てきま し た 。
シ ン テ ニ ー
異な る脊椎動 物 (例えば、 ヒ ト - マ ウ ス 、 ヒ ト - フ グ ) を過去に遡る と 、共通祖先が存在し
ま す 。共通祖先か ら 分岐し た あ と 、それぞれ の 系 で 転座と融合 が起こ っ て い る が 、小さ な ブ
ロ ッ ク単位 で 見 る と 遺 伝 子 の並びが 一致す る領域が あ り ま す 。染色体上で 遺 伝 子 の並びが 一致
し て い る状態は 、 シ ン テニー と呼ばれ ま す 。 全 ゲ ノ ム が 解 読 さ れ る と ゲ ノ ム 全体を 生 物間で比
較す る こ と が 可 能 と な り 、 シ ン テニー の様子 が 明 ら か と な り ま す 。
ヒ ト と マ ウ ス を比べ る と 、哺乳類同士の ため、 明瞭に シ ン テニー の保存状態が 見 て 取 れ ま す 。
一 方 、魚類で は四肢動 物 と 分 か れ て か ら直後に 全 ゲ ノ ム の 重 複 が起こ っ て い る ため、魚類の
染色体は ヒ トやマ ウ ス の染色体に対し て 2 重 の シ ン テニー を 示 す 特徴が あ り ま す 。
56
1 月 21 日 ( 第 15 回 )
講 義
推薦図書
ゲ ノ ム 関 連
「 ゲ ノ ム 第4版」 T.A. Brown 著.石川冬木/中山潤一監訳・ メ デ ィカル ・ サ イ エ ン ス ・ イ
ン タ ー ナ シ ョ ナ ル社( 8,800 円)
「 ゲ ノ ム 研究実験ハン ド ブ ッ ク 」辻本豪三、田中利男・羊土社( 6,500 円)
「比較ゲ ノ ム か ら 読 み 解く生命シ ス テ ム 」藤山秋佐夫監修・秀潤社( 4,000 円)
バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 関 連
「 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 基礎講 義 - 一歩進んだ発想を み がくために 」岡崎康司 / 坊農秀雅 監訳・ メ デ ィカル ・ サ イ エ ン ス ・ イ ン タ ー ナ シ ョ ナ ル社( 3,900 円)
「 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス がわか る 」菅原秀明 ・羊土社( 4,200 円)
「 ゲ ノ ム 情 報 は こう活かせ」岡崎康司 / 坊農秀雅・羊土社( 4,410 円)
「即活用 の ための バ イ オ イ ン フ ォ マ テ ィ ッ ク ス入門 」広川貴次 / 美宅成 樹著・中山書店
( 3,500 円)
「 バ イ オ デ ー タ ベ ー ス と ウ ェ ブツー ル の手と り足と り活用 法 」中村保一 ら 編 集 ・羊土社
( 3,800 円)
「 できる バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 」広川貴次 / 美宅成 樹著・中山書店( 3,500 円)
「 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 」 メ デ ィカル ・ サ イ エ ン ス ・ イ ン タ ー ナ シ ョ ナ ル 社
( 9,500 円)
「 バ イ オ リ ソ ー ス&デ ー タ ベ ー ス活用 術 」秀潤社( 4,600 円)
「 バ イ オ イ ン フ ォ マ テ ィ ク ス事典」 日本バ イ オ イ ン フ ォ マ テ ィ ク ス 学会編 集 ・共立出版
( 14,000円)
次 世 代 シ ー ケ ン シ ン グ に 関 連 し た バ イ オ イ ン フ ォ マ テ ィ ッ ク ス
「 Dr. Bonoの 生命科学 デ ー タ 解 析 」坊農秀雅・ ( 4,410 円) メ デ ィカル ・ サ イ エ ン ス ・ イ
ン タ ー ナ シ ョ ナ ル社( 3,000 円)
57
ウ ェ ブ サ イ ト
研究室 home page http://www.agri.tohoku.ac.jp/bioinfor/index-j.html =========================================================================
文献検 索 、 塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 ORF finder 、 Map viewer 等
NCBI http://www.ncbi.nlm.nih.gov/ (National Center for Biotechnology Information)
塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 分 子 系 統 樹 作 成 、 シ ー ク エ ン ス登録等
DDBJ http://www.ddbj.nig.ac.jp/Welcome-j.html (DNA Data Bank of Japan)
塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 タ ン パ ク 質 の 構 造 ( ド メ イ ン ・ モ チ ー フ 検 索 等 ) 解 析
EBI http://www.ebi.ac.uk/Information/ (European Bioinformatics Institute)
ゲ ノ ム 配 列 の デ ー タ ベ ー ス
Ensembl http://www.ensembl.org/index.html=======================================================================
分 子 系 統 樹 作 成
ClustalW http://clustalw.genome.jp/ =======================================================================
タ ン パ ク 質 ・ 遺 伝 子 の 機 能 検 索
オ ン ト ロ ジ ー
http://www.geneontology.org/ http://www.pir.uniprot.org/ ド メ イ ン ・ モ チ ー フ 検 索 http://www.ebi.ac.uk/Information/ シ グ ナ ル ペ プ チ ド の 予 測
http://www.cbs.dtu.dk/services/SignalP/ 3D 立体構 造 の 予 測 、 DNA の翻訳 http://ca.expasy.org/ノ ッ ク ア ウ ト マ ウ ス の表現型 http://www.informatics.jax.org/ =======================================================================
転 写 調節領域の モ チ ー フ 検 索
転 写 因 子 の 結 合 部 位 予 測 http://www.cbrc.jp/research/db/TFSEARCHJ.html ======================================================================
代 謝 経 路
KEGG http://www.genome.jp/kegg/pathway.html 58
=======================================================================
ゲ ノ ム 研究の モ デ ル 生 物
マ ウ ス
http://www.informatics.jax.org/ツメ ガ エ ル http://genome.jgi-psf.org/cgi-bin/runAlignment?db=frog4x1ミ ド リ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス
http://www.genoscope.cns.fr/externe/tetranew/ト ラ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス
http://fugu.biology.qmul.ac.uk/ト ラ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス
http://genome.jgi-psf.org/cgi-bin/runAlignment?db=fugu6&advanced=1ゼブ ラ フ ィ ッ シュ http://zfin.org/
http://www.ensembl.org/Danio_rerio/index.htmlメダカ http://shigen.lab.nig.ac.jp/medaka/
http://medakagb.lab.nig.ac.jp/Oryzias_latipes/index.htmlシ ョ ウ ジ ョ ウ バ エ
http://www.ncbi.nlm.nih.gov/BLAST/Genome/Insects.html http://genome.med.yale.edu/lab/index.htm線 虫
http://omicspace.riken.jp/Ce/rnai/jsp/index.jsp 酵 母
http://www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=4932 http://www.fhcrc.org/science/labs/kruglyak/Data/
=======================================================================
cDNA, EST 情 報
マ ウ ス cDNA http://fantom3.gsc.riken.jp/index.htmlア フ リカツメ ガ エ ル EST http://xenopus.nibb.ac.jp/ メダカ EST http://medaka.lab.nig.ac.jp/est_index.htmlカタユウ レ イボヤ EST http://ghost.zool.kyoto-u.ac.jp/indexr1.html
=========================================================================
microarray に 関 す る 情 報
ヒ ト繊維芽細 胞 http://genome-www.stanford.edu/serum/data.htmlシ ョ ウ ジ ョ ウ バ エ http://genome.med.yale.edu/Lifecycle/
=========================================================================
その他
59
http://genes.mit.edu/GENSCAN.html http://www.tigr.org/software/microarray.shtml http://motif.genome.jp/ http://www.rcsb.org/pdb/
=============================================================
60