第1回バイオインフォマティクス実習・実践
東京医科歯科大学
統合教育機構
教養部 数学科
中林潤
今日の内容
• Zoom講義の受講時の注意など
• バイオインフォマティクスとは
• 実習のためのPC環境設定
Zoomミーティングへの参加方法
• 受講者へZoomミーティングのURL、ID、パスワードを配布
㊟これらは他者に公開してはいけません
• ミーティングURLへブラウザからアクセスする
Zoomソフトウェアがインストールされる
ミーティングIDとパスワードを入力して参加する
• Zoom登録済の場合
Start Zoomを起動、ミーティングIDとパスワードを入力して参加する
Zoomミーティングへ参加する際の注意
• 講義は全て録画しています
• 受講者のマイクはミュート、ビデオはオンにしておく
• 講義の録画、画面のキャプチャー、録音は禁止する
• 講義で得た情報の無断配布は禁止する
Zoomミーティング受講中の注意• ソフトウェアのインストール、データのダウンロードは予め実行しておく
• まず講師が画面共有でPCの操作画面を表示する
• 画面と配布資料を参考にして、手元のPCで同じ操作を実行する
• 質問がある場合、画面に向かって挙手して発言を求める
• 質問が間に合わなかった場合、チャットに書き込んでおく
• 講義終了後に質問がある場合は講師にメールで問い合わせる
技術革新の例:次世代シーケンサー
conventional next generation
期間 13 年 3.5 日
費用 1400万 ドル 1000 ドル
1990年:ヒトゲノムプロジェクト2004年:1000ドルゲノムプロジェクト
increase of data production → computational data processing
development of bioinformatics
sequencer
Development of NGS platform
Reuter JA, Spacek DV and Snyder MP Mol Cell 2015 May 21;58(4):586-97
バイオインフォマティクスとは
• データ量の爆発的な増加に伴いデータ解析手法の開発が必要となる
• バイオインフォマティクスとして発展
• バイオ + インフォマティクス
バイオ:生命
インフォマティクス:情報科学
クラウド時代の研究環境
サンプル
データ
データ
データーベース
スーパーコンピューター大規模ラボ
Windows Subsystem For Linuxの有効化
• Windows OS上でLinuxプログラムを実行する実行環境
• デフォルトでは無効となっているので、有効化する必要がある
設定を開く
画面左下のスタートメニューから設定を選択
Windowsの設定画面でアプリをクリック
アプリをクリック
プログラムと機能をクリック
プログラムと機能
Windowsの機能の有効化または無効化
ここをクリック管理者権限が必要
Windows Subsystem for Linuxにチェック
ここにチェック
Microsoft StoreでUbuntuを検索
Microsoft Storeをクリック
Ubuntuを検索
Ubuntu18.04 LTSをインストール
Ubuntu18.04LTSを選択
Ubuntu18.04 LTSを起動
スタートメニューにUbuntu18.04LTSが登録されている
Hisat2のダウンロード
• Hisat2のホームページにアクセス
https://daehwankimlab.github.io/hisat2/
• ダウンロードページから自分のOSに合ったHisat2をダウンロード
Download
Hisat2のダウンロード
• Binaries
• Index
H.sapiens
UCSC hg19
Macの場合はOSX_x86_64
Windowsの場合はLinux_x86_64
Integrative Genomics Viewerのインストール
• Integrative Gnomics Viewerのホームページにアクセス
http://software.broadinstitute.org/software/igv/
• Download IGVからインストーラーをダウンロードDownload IGV
自分のOSに合ったインストーラーをダウンロード
インストーラーを実行するとインストールされます
統計解析ソフトRのインストール
• Rはオープンソース・フリーソフトウェアの統計解析用プログラム言語およびその開発実行環境
• オークランド大学のRoss IhakaとRobert Clifford Gentlemanによって開発された
• 現在はR Development Core Teamによってメンテナンスされている
Rのダウンロードとインストール
• 日本のミラーサイト
https://cran.ism.ac.jp
https://ftp.yz.yamagata-u.ac.jp/pub/cran/
から自分のPCのOSに合った(Windows または Mac)インストーラーをダウンロードする
• ダウンロードしたインストーラーをダブルクリックして実行する
• 途中の質問はすべてデフォルト状態でインストールする
各OSのインストーラへのリンク
Windowsの場合
baseをクリック
R-4.0.0が最新バージョン
インストーラーへのリンク
Windowsの場合
• RToolsのインストール
https://cran.r-project.org/bin/windows/Rtools/
rtools40-x86_64.exeをクリックしてダウンロード
RToolsへのリンク
Rtoolsをクリック
rtools40-x86_64.exe
インストーラーへのリンク
Macの場合 インストーラーへのリンク
XQuartzのインストール
• https://www.xquartz.org/
からインストーラーをダウンロード
ダウンロードしたインストーラーをダブルクリックして展開、実行する
インストーラーへのリンク
プログラム言語Python
• 1991年Guido van Rossumにより開発された汎用プログラム言語
• 統計、データ解析用ライブラリが豊富に存在する
• ライブラリの多くはpython本体には含まれておらず、別途インストールする必要がある
Anacondaディストリビューション
• Python本体とライブラリをパッケージにしたもの
• ライブラリの追加や管理が簡便に行える
Anacondaインストーラーのダウンロードhttps://www.anaconda.com/products/individual 各OSの64-Bit Graphical Installerを選択
Anacondaのインストール
• ダウンロードしたインストーラーを実行
• 途中の質問はすべてデフォルトの状態でインストールする
第2回の予告
• 次世代シーケンスデータの基本的処理
• Hisat2で配列情報を参照ゲノムにマッピング
• Integrative Genomics Viewerで可視化
アンケートにご協力ください
第1回簡易アンケートQRコード
https://www.yokohama-cu.ac.jp/amedrc/section/support/bioinfomatics2.html
先端医科学研究センター バイオインフォマティクス解析室のHPからアンケートにアクセス