Upload
others
View
9
Download
0
Embed Size (px)
Citation preview
© 2013 Illumina, Inc. All rights reserved.Illumina, IlluminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iSelect, MiSeq, Nextera, NuPCR, SeqMonitor, Solexa, TruSeq, TruSight, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners.
Sequence Analysis Viewer (SAV)でMiSeqのRun結果を評価する
小林 孝史イルミナ株式会社
テクニカルアプリケーションサイエンティスト
2
Sequence Analysis Viewer (SAV)とは?イルミナが頒布している「ランの状況をモニターするソフトウェア」です。→個別のクラスター由来の配列を参照できるわけではありません。
3
Sequence Analysis Viewer (SAV)とは?
SAVをインストールできるPCの条件
WindowsXP/Vista/7が必要。
イルミナ株式会社のホームページからダウンロードが可能です(次ページ以降参照、MyIlluminaのアカウントは必要ではありません)http://support.illumina.com/sequencing/sequencing_software/sequencing_analysis_viewer_sav/downloads.ilmn
MiSeqやHiSeqでは購入時にSAVがインストールされています。
4
SAVのダウンロード、およびセットアップイルミナのwebsiteに行く (www.illuminakk.co.jp)→サポート、シーケンサー「ソフトウェア」をクリック
5
SAVのダウンロード、およびセットアップSequencing Analysis Viewerをダブルクリック
6
SAVのダウンロード、およびセットアップ
Downloadを選択
7
SAVのダウンロード、およびセットアップ
ユーザーガイド
インストーラー
ZIP形式のインストーラー( 新のもの)をダウンロードください
8
SAVを使用する目的
A)ランが正常に行われたかを評価したい。
B) fastqファイルなど大きなサイズのファイルを送る前に、ランの状態を共同研究者と情報共有したい。
C) テクニカルサポートにランの診断を依頼したい。
ランのモニターに必要なファイルは下記の3つです。:D:¥Illumina¥MiSeqOutput¥<Run_Folder>(MiSeqの場合)DあるいはE:¥Illumina¥HiSeqTemp¥<Run_Folder>(HiSeqの場合)の中の①InterOp フォルダー (フォルダーごと必要です)②Runparameters.xml③Runinfo.xml
上記のファイルはBaseSpaceでも簡単に共有可能です。
9
Analysisタブランフォルダーを設定(Full Path)してRefresh
10
Imagingタブ
11
Summaryタブ
12
Quality Scoreの分布
13
%>=Q30:ラン中全サイクルにおいてQ30以上でベースコールされた塩基の割合まず%>=Q30の割合を見てランの状況を見極める。
Quality Score (Q score)
14
なぜQ30 で評価するのか?
Q Score = Phredクオリティスコア
ベースコールにおけるエラー率の予測指標
Phredというプログラムで算出
Q30=Quality Score 30
%>=Q30 はラン全体の平均値を示す
– ラン全体の値、リード毎、サイクル毎ではない。
%>= Q30 の値は様々な要因に左右される
– %>=Q30 が良ければRunは成功
PhredScore
% Error Error の確率
Q10 10% 1 in 10
Q20 1% 1 in 100
Q30 0.1% 1 in 1,000
Q40 0.01% 1 in 10,000
Ewing B, Hillier L, Wendl MC, Green P (1998). "Base-calling of automated sequencer traces using phred. I. Accuracy assessment".Genome Res. 8 (3): 175–185.
15
それぞれの装置における %>=Q30の仕様(PhiXを使用したデータです)
1x35bp 2x50bp 2x100bp 2x150bp 2x250bp 2x300GAIIx ≥90% ≥85% ≥80% N/A N/A N/A
HiSeq High
Output
≥90% ≥85% ≥80% N/A N/A N/A
HiSeq Rapid Run
≥90% ≥85% ≥80% ≥75% N/A N/A
MiSeq(MCS2.3)
≥90% ≥85% ≥80% ≥80% ≥75% ≥70%
一般的にランのサイクル数が長くなるとQ scoreは低下します。
16
良好なQ Scoreを得るためには
適度なクラスター密度を持つこと→Bulletinを参照ください:– https://my.illumina.com/MyIllumina/Bulletin/DuMEdxXEKUeuxZo
uJdr7TA/cluster-density-specifications-for-illumina-sequen
サンプルの塩基バランスが良いこと(偏りのない配列)
17
サイクル毎のQ30 の見方サイクル毎のQ30 以上のQ scoreでベースコールされた塩基の割合
18
サイクルごとの%>=Q30の推移
良好なラン
→Read後半まで高い%>=Q30を維持
19
Sequence Analysis Viewer: Data By Lane
20
適正なクラスター密度を狙って実験を行う
適正なクラスター濃度でないと、Q scoreが低くなったり
% Cluster Passing Filter (% Cluster PF)が得られない可能性があります
Software Version
RecommendedCluster Density
(K/mm2)HCS 1.4 (and later) 200-850SCS 2.8 (and later) 100-800MCS 2.0 (and later) 50-960
クラスター密度(Cycle1-4のデータで算出される)
Cluster PFの数値(後で説明)
21
クラスター密度が高すぎると…
オーバークラスター(クラスターができすぎ)
適正なクラスター密度
隣のクラスターとの距離を保てる隣のクラスターと区別できない(Q score低下)正しいクラスター密度が計算できない
22
Saturated!→Q scoreが低くなる!
クラスター密度が高すぎると…
23
Sequence Analysis Viewer: Data By Cycle
24
V1 reagent (販売終了)HiSeqの波形に似ている
V3 reagentV2 reagent
MiSeqの場合はReagentのバージョンによってIntensityのカーブが異なる→シグナルを取得する時間がそれぞれで異なるため
MiSeqの試薬バージョンにより波形が異なります
25
試薬の送液不良
品質低下など
短いライブラリー
一時的なフォーカス外し
Readの後半まで
インテンシティーが
なだらかに上昇する
順調なラン
SAVの結果からできるトラブルシュート(MiSeq, V2試薬を使用)
Case2Case1
26
Intensity取得に不具合があったサイクルの特定
1塩基表示に切り替え(この場合はG)
→当該サイクルのThumbnail imagesを見てみる
27
流路の不具合の例
28
FWHM:フォーカスがうまく取れているかの指標
29
FWHMとは?
FWHM :Full Width Half Max– Intensityが最大値の半分の時のクラスターの幅
数値はライブラリーの長さなどに依存します。
ぼんやりとした大きなクラスター 明るくシャープなクラスター
30
数値はライブラリーの長さなどに依存します。→急激な数値の変化がある場合は正常にランが行われていない可能性があります。
FWHMとは?
31
%Base:それぞれのサイクルの塩基のばらつき
32
偏りのある塩基配列(PCR断片など)塩基のばらつきのよい配列(全ゲノムなど)
塩基のばらつきに注意してクラスター密度を決定する
偏りのある塩基配列の場合は、PhiXを入れたり密度を小さくするなど工夫が必要。
詳しくは…
33
Sequence Analysis Viewer: Flowcell Chart
34
Sequence Analysis Viewer: Qscore Heatmap
35
% Cluster Passing Filter
36
% Cluster Passing Filter
Pass Filterしたクラスターとは?
– Chastity Filteringをパスしたクラスター、
クラスター上のシグナルの「純度」によりフィルタリング
– PFしないリード:
Chastity<0.6のサイクルが25サイクルまでに2サイクル以上検出
完全に重なったようなクラスタは、このフィルタによるフラグの有無で、選択することができる
クラスター密度(Cycle1-4のデータで算出される)
Cluster PFの数値(Cycle1-25で算出される)
37
Run の結果を評価するー Phasing/Prephasing
38
Run の結果を評価するーPhasing/Prephasing
PhasingとPrephasing– 1クラスター中の数分子のサイクルの進みと遅れ (通常~0.2-0.5%)
39
Phasing と Prephasingについて
一つのクラスターを形成するライブラリー鎖(1000分子ほど)のうち、
低い%(通常~0.2-0.5%)のライブラリーは正しく反応が生じていないものがある。
Phasing Prephasing
AAC C C C C
G
一つのクラスターの中のライブラリー
40
PhasingとPrephasingの意義
PhasingとPrephasingは酵素反応や試薬Deliveryの失敗を補正する
– 試薬のライン中でのコンタミ(Washが不十分)
– 試薬の品質(使用期限)
– 室内温度
– 装置のFC・Reagent Chiller温度
バランスの悪い塩基配列の場合計算ができない
41
おまけ)イルミナ・テクニカルサポートにSAVデータの診断を依頼する
1. デスクトップシェア(GoToAssistシステム)を使用して、イルミナから装置にリモート接続させていただき直接データを拝見させていただく。
→MiSeqなどの装置がインターネットに接続されている必要がある。(イルミナのwebsiteなど一般的なwebsiteが閲覧できれば可能です)
2. SAVでランを参照するのに必要なファイルをテクニカルサポートまで送付いただく。
D:¥Illumina¥MiSeqOutput¥<Run_Folder>の中の下記4ファイルを送付ください。InterOpフォルダーRunparameters.xmlRuninfo.xmlSampleSheet.csv
3. BaseSpaceでランをシェアいただく。SAVデータをダウンロードして送付いただく。
42
BaseSpaceからSAVデータをダウンロードする
43
BaseSpaceからSAVデータをダウンロードする
44
BaseSpaceからデータをシェアする
45
このアドレスをメールに添付して送付いただく
BaseSpaceからデータをシェアする
© 2013 Illumina, Inc. All rights reserved.Illumina, IlluminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iSelect, MiSeq, Nextera, NuPCR, SeqMonitor, Solexa, TruSeq, TruSight, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners.
Thank You!
47
SAV Support Page:– http://support.illumina.com/sequencing/sequencing_software/sequen
cing_analysis_viewer_sav.ilmn
SAV User Guide:– http://support.illumina.com/documents/documentation/Software_Doc
umentation/SAV/SequencingAnalysisViewer_UserGuide_15020619D.pdf
TechSupport Bulletin Board (on MyIllumina):– https://my.illumina.com/Home/Index
Ewing B, Hillier L, Wendl MC, Green P. (1998): Base-calling of automated sequencer traces using phred. I. Accuracy assessment. Genome Res. 8(3):175-185
Additional Resources