Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
第10回 シーケンス講習会RNA-seq library調製法の特徴と選び方
理化学研究所 (RIKEN) ライフサイエンス技術基盤研究センター (CLST) 機能性ゲノム解析部門 (DGT) ゲノムネットワーク解析支援施設(GeNAS) 野間 将平
概略
l シーケンスをする目的は?
l よいシーケンスライブラリーとは?
– RNA-seq ライブラリーのムリ・ムダ・ムラ
l いろいろなRNA-seqライブラリーの特徴
– 性能比較実験の結果から
RNA シーケンスをする目的 l RNAを研究することで分かること
– RNA-seq は細胞・組織の”今”の状態を知る
l ライブラリー作製・シーケンスは解明のための通過点(一手段) – RNA抽出が完了した時点で結果は出ている
– そこから いかに情報を失わず、シーケンスに持ち込むか
減らしたいRNA シーケンスのムリ・ムダ・ムラ
l ムリ
– RNAが本来持っていた情報が正確に反映されていない状態
• 結果にバイアスがかかった状態
• RNAの品質、サンプル量
l ムダ
– RNAの持つ情報は極力失いたくない
• とはいえ、Total RNA をそのままシーケンスするとほとんど(9割) がrRNA • 現行のシーケンサー能力やコストを考慮するとrRNA を効率的に除去する必要がある
– Oligo dT Beads – RiboZero (Epicentre/Illumina) – GeneRead rRNA Depletion Kit (QIAGEN) etc…
– PCR条件の最適化
• PCR duplicate の 割合を減らす
l ムラ
– 結果が再現しない
• サンプリング、RNAの品質、実験環境、手技
Stranded RNA-seq 手法比較
l 評価対象
– TruSeq Stranded RNA (Illumina) – ScritSeq v2 (Epicentre) – RNA ligase base method (GeNAS)
l Human Brain total RNA 1ug を使用して各手法 n=3 でlibrary 調製
l rRNA 除去にはRiboZero Goldを使用
– Non-cording RNAも含まれる
l 3mix ibrary / lane でHiSeq2500 100PE でシーケンス
l Genomic Work Bench (CLC Bio) で解析
TruSeq Stranded RNA Sample prep cDNA synthesis /Ligate adapter / PCR amplification
UUA
1st strand cDNA synthesis with random hexamer
U AAT A
RNA First strand cDNA
UUA U AAT A 1st strand cDNA
2nd strand cDNA
5’ 3’
5’
3’
5’ 3’
5’
5’ 3’
3’ 5’
UUA U AAT A
5’ 3’
3’
5’ AAT A
UUA U Pol
Pol
2nd cDNA synthesis with random hexamer Incorporates dUTP instead of dTTP
Amplify with High-‐fidelity Taq Strand selecFve amplificaFon
5’ 3’
End repair, adenilaFon Adapter ligaFon
Total 2day
ScriptSeq v2
h7p://www.arb-‐ls.com/products/scriptseq_v2_rna_seq_library_preparaFon_kit/
Total 1day
RNA ligase base method AAAAAAAA
AAAAAAAA AAAAAAAA Poly(A )RNA selecFon or rRNA removal
Random fragmentaFon by sonicaFon P Phosphatase treatment and
PolynucleoFde Kinase treatment Pre-‐adenylated 3’ linker ligaFon
App P 5’ linker ligaFon Reverse transcripFon reacFon
RT primer PCR and size selecFon (AMPure beads) P
Sequencing by Illumina GAIIx, HiSeq2000, HiSeq2500
Total 3day
再現性Technical replica
hg19 refseqにmappingしてRPKM算出 Log10(1+RPKM) でプロット 各手法とも再現性は高レベル
GeNAS RNA ligase base
Epicentre TruSeq stranded
r=0.99 r=0.99 r=0.99
手法間での発現量相関
RNA ligase base
TruS
eq s
trand
ed
Scr
iptS
eq
TruSeq stranded
Scr
iptS
eq
RNA ligase base
R=0.95 R=0.92
R=0.98
異なる調製法のライブラリーを単純比較するのは危険
Strand Specificity
TruSeq RNA Non-stranded
TruSeq RNA stranded
ScriptSeq v2
RNA ligase base
l Read1 のFastq をCLC Genomics Workbench 6.0.2にimport l hg19, ERCC ref seq にmapping l PCR duplicateを除去
l ERCCに対するreadの方向を比較
53.03%
98.74%
94.47%
99.96%
Coverage evenness
A:RNA ligase base B:TruSeq Stranded C:ScriptSeq
A
B
C
A
B
C
Coverageスケールはそれぞれ異なる
TruSeq Strandedが安定して全体をカバーできている 他はcoverageに偏りあり Replicate間で偏り傾向は一致していたので手法に依存したバイアスがある推測される
検出遺伝子数 TruSeq Stranded
(17165)
ScriptSeq (16245)
RNA ligase base (17093)
14301
1726
365
675
701
463
904
TriplicateでRPKM 1< 示したものをカウント
14
検出遺伝子数
0
5000
10000
15000
20000
25000
30000
35000
40000
1.E-03 1.E-02 1.E-01 1.E+00 1.E+01 1.E+02
G eN AS
Illum ina
Epicentre 1
一定のRPKM以上で検出された遺伝指数
RPKM
Number of gene detected
●RNA ligase base ●TruSeq Stranded ●ScriptSeq v2
1
10
1.000E+00 1.000E+01
理論値
RPKM ERC C RPKM
G eN AS RPKM
Illum ina RPKM
EpicentreRPKM
ERCCによる定量性の検証
Read count 10未満を外れ値として除外してプロット
RPKMで取ったスピアマン相関係数 RNA ligase base : 0.90 TruSeq Stranded : 0.94 ScriptSeq v2 : 0.91
手法間の相対比較
l 手法毎に得手・不得手はある
– 現時点でTruSeq Strandedが相対的に優れている点が多い
手法名 Illumina
(TruSeq Stranded) Epicentre (ScriptSeq v2)
GeNAS (RNA ligase base)
必要サンプル量 ○ 0.1-1.0ug ○ 0.1-1ug △ 1ug≦
コスト △
48反応/kit △
6反応/kit △
試薬を個別に用意する必要あり
操作性 ○ 2day ◎ 1day △ 3day 再現性 ◎ R=0.99 ◎ R=0.99 ◎ R=0.99
Strand Specificity ○ △ ◎
Coverage evenness ○ △ △
定量性 ◎ ○ ○
◎極めて優れる ○ 優れる △ 普通
Agilent, NuGEN などからもStrand specificな RNA-seq library prep kit は販売されている