18
1212 th Asian Institute in Statistical Genetics and Genomics Soongsil University, Seoul, Korea July 17 (Mon) 22(Sat), 2017 2017 Module Schedule Session 1 (July 17-18) 1. Biostatistics using R Sungho Won Seoul National Univ. 2. Introduction to Genetics Bermseok Oh Kyung Hee Univ. 3. Multi-omics Data Analysis Hokeun Sun SungHwan Kim Pusan National Univ. Keimyung Univ. 4. Epigenome Analysis Tae-Young Roh POSTECH Session 2 (July 19-20) 5. Cancer Genomics Sanghyuk Lee Ewha Womans Univ. 6. Analyses of Coding and Noncoding Transcriptomes: Assembly, Quantification, DEG, Isoform Analysis, RNA-seq-based ITH Analysis, miRNA Analysis, Single-cell Analysis Jin-Wu Nam Hanyang Univ. 7. Genome Data Analysis using Korea Biobank Array Bong Jo Kim KNIH 8. Applications of NGS toward Translational Genomics Murim Choi Seoul National Univ. Session 3 (July 21-22) 9. NGS Cancer Gene Panel Analysis and Applications Yeun-Jun Chung Seung-Hyun Jung The Catholic Univ. 10. Statistical Genomics - Methods and Analyses for Omics Data Ingo Ruczinski Johns Hopkins Univ. 11. Introduction to Genome Informatics Sangsoo Kim Soongsil Univ. 12. Genomic Epidemiology Ji Wan Park Hallym Univ.

th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

12th Asian Institute in Statistical Genetics and Genomics

Soongsil University, Seoul, Korea

July 17 (Mon) – 22(Sat), 2017

2017 Module Schedule

Session 1 (July 17-18)

1. Biostatistics using R Sungho Won Seoul National Univ.

2. Introduction to Genetics Bermseok Oh Kyung Hee Univ.

3. Multi-omics Data Analysis Hokeun Sun

SungHwan Kim

Pusan National Univ.

Keimyung Univ.

4. Epigenome Analysis Tae-Young Roh POSTECH

Session 2 (July 19-20)

5. Cancer Genomics Sanghyuk Lee Ewha Womans Univ.

6.

Analyses of Coding and Noncoding

Transcriptomes: Assembly, Quantification,

DEG, Isoform Analysis, RNA-seq-based ITH

Analysis, miRNA Analysis, Single-cell Analysis

Jin-Wu Nam Hanyang Univ.

7. Genome Data Analysis using Korea Biobank

Array Bong Jo Kim KNIH

8. Applications of NGS toward Translational

Genomics Murim Choi Seoul National Univ.

Session 3 (July 21-22)

9. NGS Cancer Gene Panel Analysis and

Applications

Yeun-Jun Chung

Seung-Hyun Jung The Catholic Univ.

10. Statistical Genomics - Methods and Analyses

for Omics Data Ingo Ruczinski Johns Hopkins Univ.

11. Introduction to Genome Informatics Sangsoo Kim Soongsil Univ.

12. Genomic Epidemiology Ji Wan Park Hallym Univ.

Page 2: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

1. R 을 이용한 기초통계학 (Biostatistics using R)

강사: 원성호, 김진흠

소속: 서울대학교 보건대학원, 수원대학교 통계정보학과

강의 개요: 본 강좌에서는 기초통계학의 기본 개념을 학습과 상용 소프트웨어인 R 을 이용한

실습을 병행하고자 한다. 본 강좌에서 사용하는 R 패키지는 SAS, SPSS, MINITAB, STATA 등과

달리 무료로 제공되고 저장 공간이 많이 필요하지 않아, 현재 가장 널리 사용되고 있는

소프트웨어 중의 하나이다. 또한 다른 패키지와 달리 개발이 용이하여 최근 연구 결과들이

패키지에 탑재되는 주기가 짧아 통계 관련 연구에 매우 유용하게 사용되고 있다. 본 강좌에서는

R 의 설치 및 기본 사용법, 그리고 R 을 활용한 그래픽스, 일변량 자료를 정리하고 요약하는 방법,

등 R 을 활용한 자료 처리 방법론 그리고 상관분석 및 회귀분석, 범주형 자료의 독립성 검정을

포함하는 이변량 자료의 분석 방법, 모수 추정과 통계적 가설검정, 두 집단의 비교를 위한 통계적

방법, 분산분석 등 기초 통계 이론에 대하여 강의할 것이다.

교육 일정

일자 시간 강의 내용 담당 강사명 구분

Session 1

(09:20-10:50) R 의 설치 및 소개 원성호 인터넷접속필요

Day 1

2017.07.17(월)

Session 2

(11:00-12:30) R 을 활용한 graphics 원성호 인터넷접속필요

Session 3

(14:00-15:30) 일변량 자료의 정리 및 요약 원성호 인터넷접속필요

Session 4

(15:40-17:10) 확률과 확률분포, 표본분포 원성호 인터넷접속필요

Session 5

(09:20-10:50) 추정 김진흠 인터넷접속필요

Day 2

2017.07.18(화)

Session 6

(11:00-12:30) 통계적 가설검정 김진흠 인터넷접속필요

Session 7

(14:00-15:30) 두 집단의 비교, 분산분석 김진흠 인터넷접속필요

Session 8

(15:40-17:10)

이변량 자료의 분석: 상관분석 및

단순회귀분석, 독립성검정 김진흠 인터넷접속필요

Page 3: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

2. 유전학 기초 (Introduction to Genetics)

강사: 오범석

소속: 경희대학교 의과대학

강의 개요: 유전학 비전공자를 위하여 전달유전학, 분자유전학, 집단유전학, 질병유전학,

통계유전학 등의 기본 개념을 이해시킨다. 멘델의 유전법칙, 가계도, 유전자의 구조 및 발현,

염색체의 구조, Human Genome Project 및 유전변이, 유전질환의 기전 및 Genetic counseling,

복합질환의 유전학적 이해 등의 주제를 다룬다. 표현형질이 세대간 어떻게 전달되는가,

표현형질을 결정하는 유전자는 유전체 상에서 어떤 모양으로 존재하는가 그리고 유전자가 어떻게

발현되는가, 인간유전체 사업 이후 활발하게 진행되고 있는 질병유전체는 우리에게 어떤 교훈을

주고 있는가 등을 강의하고자 한다. 이들 주제를 통하여, 유전학적인 기초 지식을 가르치고 분석

결과에 대한 생물학적인 이해를 높여 적절한 실험디자인을 하도록 도와주고자 한다. 그 외에도

최신 지견으로 Personalized Medicine/Precision Medicine 에 대한 설명도 포함된다.

준비물: 없음

Page 4: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

교육 일정

일자 시간 강의 내용 담당 강사명 구분

Session 1

(09:20-10:50)

유전학의 태동: 멘델의 법칙, 가계도,

유전질환 오범석

전산실습

없음

Day 1

2017.07.17(월)

Session 2

(11:00-12:30) 염색체의 구조: Karyotype, 염색체 이상 오범석 상동

Session 3

(14:00-15:30)

유전의 결정인자: DNA, Gene, Genome

structure 오범석 상동

Session 4

(15:40-17:10) 유전형과 표현형: 유전자의 기능과 조절 오범석 상동

Session 5

(09:20-10:50)

유전자의 다양성: Human Genome Project,

Genetic variation, DNA sequencing,

Personal Genome

오범석 상동

Day 2

2017.07.18(화)

Session 6

(11:00-12:30)

복합형질의 유전학적 이해: 복합형질의

특성, 상관성 분석, Linkage disequilibrium,

Haplotype, GWAS, Molecular pathology

오범석 상동

Session 7

(14:00-15:30)

집단 유전학의 이해: Gene pool, Genotype,

DNA typing, Natural selection 오범석 상동

Session 8

(15:40-17:10) 유전 상담: 유전 상담과 위험도 평가 오범석 상동

Page 5: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

3. 빅데이터 분석 기법을 활용한 다중 오믹스 데이터 분석 (Multi-omics Data Analysis)

강사: 선호근, 김성환

소속: 부산대학교 통계학과, 계명대학교 통계학과

강의 개요: 본 강좌에서는 빅데이터 통계 분석 기법을 활용하여 다중 유전체 (multiple omics)

데이터를 분석하는 여러 가지 방법들을 학습한다. 주로 통계 패키지인 R 프로그램을 이용하여

실제 데이터 및 모의 분석을 병행 실습하고, 현재 많은 관심을 받고 있는 유전체 빅데이터 분석

및 이종 유전체 결합 분석에 대한 그 현황과 방법론을 다루고자 한다. 또한 실제 데이터 분석

실습을 통하여 의생명과학적 의미를 도출하는 방법도 함께 다룬다. 강의는 크게 두가지 파트로

나뉜다. 첫번째 파트는 주로 빅데이터 통계 분석에 사용하는 regularization technique 을 학습한다.

구체적으로는 penalized likelihood 에 기반을 둔 lasso (least absolute shrinkage and selection

operator), elastic-net, group lasso 등의 변수 선택 방법들을 다루며 또한 이를 고차원 유전체

빅데이터 연관 분석 (genetic association study with high-dimensional genomic data)에

적용시키는 방법을 R 실습을 통해 학습한다. 두번째 파트는 주로 다른 종류의 유전체 데이터를

결합하여 분석하는 이종 유전체 결합 분석에 대해 학습한다. 구체적으로는 메타품질관리

(MetaQC), 메타 유전자 탐색 (MetaDE), 메타 군집분석 (Meta clustering), 메타판별분석 (Meta

prediction) 및 메타시각화 (Meta visualization) 등의 방법론을 살펴볼 예정이다.

준비물: 노트북 지참 (통계 패키지 R 설치)

실습: 인터넷 접속 (웹서핑 및 CRAN/bioconductor 에서 통계 패키지 다운로드 및 설치)

수강생 수준: R 프로그램에 대한 경험 및 기초 지식을 가지고 있어야 한다.

Page 6: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

교육 일정

일자 시간 강의 내용 담당 강사명 구분

Session 1

(09:20-10:50)

통계 학습 및 교차검증

(Statistical learning and cross validation) 선호근

강의+실습

Day 1

2017.07.17(월)

Session 2

(11:00-12:30)

벌점우도함수 및 모수규제화

(Penalized likelihood and regularization) 선호근 강의+실습

Session 3

(14:00-15:30)

Omics 통합 분석 개관 및 MetaQC (Quality

control) 김성환 강의+실습

Session 4

(15:40-17:10) MetaDE (differential expressed genes) 분석 김성환 강의+실습

Session 5

(09:20-10:50)

Statistical analysis of high-dimensional

genomic data I 선호근 강의+실습

Day 2

2017.07.18(화)

Session 6

(11:00-12:30)

Statistical analysis of high-dimensional

genomic data II 선호근 강의+실습

Session 7

(14:00-15:30) Omics 데이터 통합 시각화 (Visualization) 김성환 강의+실습

Session 8

(15:40-17:10)

Omics 데이터 통합 군집 및 분류 (clustering

and classification) 분석 김성환 강의+실습

Page 7: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

4. 후성유전체 데이터 분석 및 연구 방법론 (Epigenome Analysis)

강사: 노태영, 김태수

소속: 포항공과대학교, 이화여자대학교

강의 개요: 후성유전학에 대한 기본 개념부터 후성유전체 분야 최신 연구 동향까지 DNA

염기서열의 변화없이 일어나는 유전자 발현조절의 주요 메커니즘에 대하여 소개하고 다양한

후성유전체 데이터의 생산 방법부터 데이터 분석 실습도 병행한다. 시퀀싱 기법에 대한 이해와

더불어 각종 히스톤 변형의 위치를 매핑하고 이를 활용한 인핸서의 위치 발굴과 모티프 분석,

히스톤 변형 벙보에 추가하여 DNA 메틸화 정보와 RNA 발현 정보의 통합 분석을 통한

바이오마커의 발굴 등 다양한 오믹스 데이터 분석 방법도 실습할 것이다. 이를 통하여

후성유전학에 대한 이해와 실제 연구에 어떻게 응용이 가능한지 소개하여 수강자 스스로

실험디자인을 하고 의미를 발굴할 수 있는 계기를 마련하고자 한다.

교육생 준비물: 노트북 지참

실습: 인터넷 접속

교육 일정

일자 시간 강의 내용 담당 강사명 구분

Session 1

(09:20-10:50)

후성유전체학 overview –

기초연구와 임상연구의 융합 노태영 강의

Day 1

2017.07.17(월)

Session 2

(11:00-12:30)

Histone modification, DNA methylation,

miRNA 실험 실무론 노태영 강의

Session 3

(14:00-15:30) NGS 시퀀싱 이론 및 데이터 분석론 노태영 강의

Session 4

(15:40-17:10)

NGS 데이터 – histone modification,

DNA methylation 분석 실습 노태영 강의+실습

Session 5

(09:20-10:50)

NGS 데이터 – enhancer 발굴, motif 분석

실습 노태영 강의+실습

Day 2

2017.07.18(화)

Session 6

(11:00-12:30)

NGS 데이터의 통합 – 네트워크 분석을

통한 바이오마커 발굴 실습 노태영 강의+실습

Session 7

(14:00-15:30)

후성유전체 데이터를 활용한 최신 연구

동향 I 김태수 강의

Session 8

(15:40-17:10)

후성유전체 데이터를 활용한 최신 연구

동향 II 김태수 강의

Page 8: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

5. 암유전체학 (Cancer Genomics)

강사: 이상혁

소속: 이화여자대학교 생명과학과

강의 개요: 본 강좌에서는 암유전체학의 최근 발전 동향 및 주요 주제를 데이터 분석의 측면에서

살펴보고자 한다. 차세대 시퀀싱(NGS) 방법의 도입에 따라 암유전체학은 비약적인 발전을

거듭하여 맞춤의료, 정밀의료의 첨단 분야로 확립되고 있다. 1일차 강의에서는 차세대 시퀀싱

기반의 암유전체학에 대한 소개와 NGS 데이터의 기본적인 분석 방법을 다룰 것이다. 모든

분석의 근간이 되는 whole exome sequencing 과 transcriptome sequencing 데이터 분석을 통하여

somatic variants 를 찾고 발현 데이터로부터 DEGs, signature genes, gene fusion 등을 구하는

방법을 실습과 함께 익힐 것이다. 2일차 강의는 임상적인 응용에 중점을 두고 환자의 상세분류,

PDX 마우스의 임상응용, 암의 이질성 및 진화, 정밀의료 구현을 위한 정보시스템 등의 다양한

주제를 다루고자 한다. 실습은 교육생들이 추후 필요하면 실제 연구에 활용할 수 있도록 분석

프로토콜을 제공하고 설명할 것이다.

교육생 준비물: 노트북 지참

실습: 인터넷 접속

교육 일정

일자 시간 강의 내용 담당 강사명 구분

Session 1

(09:20-10:50) 차세대 시퀀싱과 암유전체학 개요 이상혁 강의

Day 1

2017.07.19(수)

Session 2

(11:00-12:30)

Variant Discovery

(Mutations, Indels, CNAs) 이상혁 강의

Session 3

(14:00-15:30)

Transcriptome Analysis

(Expression, Signatures, Gene fusions) 이상혁 강의

Session 4

(15:40-17:10) NGS 데이터 분석 실습 김상옥, 장예은 강의+실습

Session 5

(09:20-10:50)

Patient Stratification Methods Based

on Multi-Omics Data

황소현

(차의과대학) 강의+실습

Day 2

2017.07.20(목)

Session 6

(11:00-12:30)

PDX Mouse Models for Clinical

Applications 이상혁 강의

Session 7

(14:00-15:30)

Tumor Heterogeneity & Clonal

Evolution 전유경 강의+실습

Session 8

(15:40-17:10)

Information System for Cancer

Precision Medicine 장영준 강의+실습

Page 9: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

6. 번역/비번역 전사체 분석 (Analyses of Coding and Noncoding Transcriptomes: Assembly,

Quantification, DEG, Isoform Analysis, RNA-seq-based ITH Analysis, miRNA Analysis, Single-

cell Analysis)

강사: 남진우, 정제균

소속: 한양대학교 생명과학과, 삼성유전체연구소

강의 개요: 본 강좌에서는 RNA-seq 기반의 전장전사체 분석에 대한 기본적인 개념과 이론을

학습하고, 다양한 전사체 데이터 분석 프로그램을 이용하여 실습을 병행하고자 한다.

Coding/Noncoding RNA 에 대한 분석을 분자 수준부터 전사체 수준에서 다루며, 특히 sRNA-seq

데이터를 이용하여 miRNA 데이터에 대한 분석 방법에 대해 다룬다. 본 강의에서 세부적으로

다룰 내용은 RNA-seq 기반의 전사체 assembly, Expression 분석, Differentially expressed gene

(DEG) 분석, Isoform-level 분석, 다양한 전사체 데이터 종류 및 분석법, 암전사체 데이터 분석,

miRNA 데이터 분석, Single-cell transcriptome 분석 등을 다룬다. 본 전사체 데이터 분석에서

다루는 프로그램은 STAR, StringTie, Cufflinks, HTSeq, RSEM, DESeq, MIRDEEP2, ESTIMATE 등이다.

교육생 준비물: 노트북 지참

실습: 인터넷 접속

교육 일정

일자 시간 강의 내용 담당 강사명 구분

Session 1

(09:20-10:50) 전사체 데이터의 종류와 분석 남진우 이론

Day 1

2017.07.19(수)

Session 2

(11:00-12:30) RNA-seq 전처리 및 발현, DEG 분석 남진우/최서원 이론/실습

Session 3

(14:00-15:30)

RNA-seq 을 이용한 새로운 transcript 발굴

(assembly) 남진우/유보현 이론/실습

Session 4

(15:40-17:10)

RNA-seq 을 이용한 웹 기반 암전사체 분석

(FIREHOSE, cBioPortal, GTEx) 남진우/윤상호 이론/실습

Session 5

(09:20-10:50) 전사체 수준의 ncRNA 분석 남진우 이론

Day 2

2017.07.20(목)

Session 6

(11:00-12:30)

miRNA-seq 을 이용한 miRNA 데이터 분석

실습 남진우/박석주 이론/실습

Session 7

(14:00-15:30) Single cell transcriptome 정제균 이론/실습

Session 8

(15:40-17:10) Single-cell analysis for cancer studies 정제균 이론/실습

Page 10: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

7. 한국인칩을 이용한 유전체 정보분석 (Genome Data Analysis using Korea Biobank Array)

강사: 김봉조, 김영진, 문상훈, 황미영, 한소희, 신동문

소속: 국립보건연구원

강의 개요: 본 강좌에서는 최근 국립보건연구원에서 제작한 Korea Biobank Array (이하

한국인칩)를 소개하고, 이를 이용한 유전체 정보 분석 방법을 설명한다. 한국인칩은 한국인 질병

유전체 연구를 위해 한국인 전유전체분석 정보 및 마이크로어레이 정보를 기반으로 제작된 SNP

칩으로써 한국인 유전체 대표성 확보 (genomic coverage)를 위한 tagging SNP 및 기능 유전 변이

등 약 83만개 프로브로 구성되어있다. 본 강좌에서는 유전체연구와 한국인칩 컨텐츠 특징 및

성능분석 결과 등을 소개하고, 한국인칩을 이용한 질환 연관성 분석방법 등 한국인칩을 이용한

전장유전체연관성 정보분석의 모든 과정을 습득할 수 있도록 실습을 병행하여 진행한다.

준비물: 노트북 지참

실습: 인터넷 접속

교육 일정

일자 시간 강의 내용 담당 강사명 구분

Session 1

(09:20-10:50) 유전체연구 소개 김봉조 강의

Day 1

2017.07.19(수)

Session 2

(11:00-12:30) 한국인칩 컨텐츠 특징 및 성능 소개 문상훈 강의

Session 3

(14:00-15:30) 전장유전체연관성 분석 김영진 강의+실습

Session 4

(15:40-17:10) 전장유전체연관성 분석 실습 황미영 강의+실습

Session 5

(09:20-10:50) Imputation 분석 소개 김영진 강의

Day 2

2017.07.20(목)

Session 6

(11:00-12:30) 유전변이 메타분석 한소희 강의+실습

Session 7

(14:00-15:30)

Functional annotation & Visualization

(1) 문상훈 강의+실습

Session 8

(15:40-17:10)

Functional annotation & Visualization

(2) 신동문 강의+실습

Page 11: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

8. NGS 를 통한 중개연구 (Applications of NGS toward Translational Genomics)

강사: 최무림, 유용진, 이영하, 이상문, 서지은, 이모제, 유태경

소속: 서울대학교 의과학과

강의 개요: NGS를 기반으로 하는 유전체학의 발전에 의하여 질병 원인의 유전적 이해도가 가파르

게 상승하고 있다. 이러한 경향에 힘입어 유전체학을 이용한 중개연구도 활발히 이루어지고 있으

며 이를통한 여러 기초적, 임상적 발전이 이루어지고 있다. 본 강좌에서는 질병의 유전학적 이해

를 통한 최근 동향을 알아본 후 중개연구를 위한 여러 종류의 질환 연구의 예시와 실습을 수행할

것이다. 또한 중개연구의 발전에 힘입은 정밀의학의 예시와 실습, 최근 연구 동향을 학습한다. 이

를 위하여 NGS 데이터의 해석과 이를 위한 공공 DB의 사용법, 다양한 유전성 질환(희귀질환, 복

합질환, 암을 비롯한 somatic 질환)의 연구 디자인, 분석법, 데이터 해석과 결과의 의생명적 의미

부여 과정을 다룰 것이다.

준비물: 노트북 지참

실습: 인터넷 접속

수강생 수준: 제한 없음

교육 일정

일자 시간 강의 내용 담당 강사명 구분

Session 1

(09:20-10:50) 질병의 유전학적 이해 및 정밀의학의 구현 최무림 강의

Day 1

2017.07.19(수)

Session 2

(11:00-12:30) NGS methodology 최무림 강의

Session 3

(14:00-15:30) NGS 기초 및 public DB 활용

이영하,

서지은 강의+실습

Session 4

(15:40-17:10)

Whole exome sequencing 데이터 분석을 통한

질환 유전 연구

이상문,

유용진 강의+실습

Session 5

(09:20-10:50)

Genome-wide 연관 분석

이상문,

유태경 강의+실습

Day 2

2017.07.20(목)

Session 6

(11:00-12:30) RNA Sequencing 데이터 분석

이영하,

유태경 강의+실습

Session 7

(14:00-15:30) Public data repository 활용

유용진,

서지은 강의+실습

Session 8

(15:40-17:10) Cancer genomics 최무림 강의+실습

Page 12: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

9. NGS 암유전자패널 분석 및 활용 (NGS Cancer Gene Panel Analysis and Applications)

강사: 정연준, 정승현, 한미령

소속: 가톨릭대학교 암진화연구센터, 가톨릭대학교 미생물학교실,

강의 개요:

차세대염기서열분석과 생명정보분석 기술의 발전으로 인해 개인의 유전체정보 생산이

보편화되었다. 이러한 유전체정보, 특히 개개인의 암유전체 정보는 정밀의료의 핵심 요소이며

암유전자패널 분석을 통하여 개인맞춤진단과 치료가 가능하다. 본 강좌에서는 암유전자패널

데이터 분석의 기본적인 지식 및 최신정보를 강의와 실습을 통해 익힐 계획이다. 암유전자

패널을 통해 돌연변이 분석 외에도 다양한 변이 분석이 가능하며 이 부분도 연구 및 환자진료에

중요하게 활용될 수 있다. 이를 반영하여 본 강좌에서는 암유전자패널 데이터에서 돌연변이

분석법, 염색체변이 분석법, 현미부수체불안정성 (microsatellite instability) 분석법, 돌연변이 패턴

분석법, 치료제 발굴을 위한 cancer knowledge database 등을 실습할 예정이다.

참여조교: 박현춘, 최수혜

교육생 준비물: 노트북 지참

실습: 인터넷 접속 필요

수강생 수준: NGS 유전자패널검사 분석을 처음 접하는 자

교육 일정

일자 시간 강의 내용 담당 강사명 구분

Session 1

(09:20-10:50) NGS 유전자패널기반 정밀의료 정연준 강의

Day 1

2017.07.21(금)

Session 2

(11:00-12:30) 암 유전자패널 설계 방법 정승현 강의

Session 3

(14:00-15:30) 암 유전자패널 돌연변이 분석 (1) 정승현 강의+실습

Session 4

(15:40-17:10) 암 유전자패널 돌연변이 분석 (2) 정승현 강의+실습

Session 5

(09:20-10:50) 암 유전자패널 염색체변이 분석 정승현 강의+실습

Day 2

2017.07.22(토)

Session 6

(11:00-12:30) 암 유전자패널 MSI 분석 정승현 강의+실습

Session 7

(14:00-15:30) Mutation signature 분석 한미령 강의+실습

Session 8

(15:40-17:10)

Cancer knowledge database 기반

항암제 발굴 정승현/정연준 강의+실습

Page 13: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

10. 통계유전학 – 오믹스 데이터 분석법 (Statistical Genomics – Methods and Data Analyses

for Omics Data)

Lecturer: Ingo Ruczinski

Affiliation: Professor of Biostatistics, Bloomberg School of Public Health, Johns Hopkins University,

USA.

Lecture Guide: We will discuss a selection of high-throughput technologies to obtain genomic

measurements, and the subsequent analyses. Emphasis will be on data processing to eliminate

technological biases and to address unwanted variability, and on simple principles for proper and

powerful Biostatistical inference. Discussion topics will include the role of genomic measurements

for individualized and public health, experimental design, data pre-processing, dimension

reduction, variance stabilization, statistical inference (including disease association), multiple

comparisons, and enrichment analyses. We emphasize the importance of data provenance and

reproducible research. Practical illustrations using data from DNA and RNA sequencing studies,

genomic arrays, methylation and proteomics are given throughout the lectures. Software

examples using freely available Bioconductor tools will be made available on the course web page.

Requirements: This course is intended for researchers who are actively engaged in genomics

research and interested beginners, including laboratory scientists and clinicians with a basic

quantitative background, and quantitatively trained researchers with basic knowledge in human

genetics. The lectures will be given in English. Participants are expected to have some basic

knowledge of core statistical principles (such as p-values). Basic knowledge of the open source

statistical environment R (http://cran.r-project.org) will be helpful to take full advantage of the

examples given in class, but is not required.

Page 14: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

Time Schedule

Day Time Daily Activity Lecturer Lab

Session 1

(09:20-10:50) Introduction to statistical genomics Ingo Ruczinski Lecture

Day 1

2017.07.21(FRI)

Session 2

(11:00-12:30)

Summarizing and presenting

genomic data Ingo Ruczinski Lecture

Session 3

(14:00-15:30) Multiple comparisons Ingo Ruczinski Lecture

Session 4

(15:40-17:10)

Statistical modeling for

genomic data ( 1 ) Ingo Ruczinski Lecture

Session 5

(09:20-10:50)

Statistical modeling for

genomic data (2) Ingo Ruczinski Lecture

Day 2

2017.07.22(SAT)

Session 6

(11:00-12:30)

Dimension reduction for

genomic data Ingo Ruczinski Lecture

Session 7

(14:00-15:30)

Pathway and gene-set enrichment

analyses Ingo Ruczinski Lecture

Session 8

(15:40-17:10)

Batch effects and data

pre-processing Ingo Ruczinski Lecture

Page 15: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

11. 유전체 정보학 기초 (Introduction to Genome Informatics)

강사: 김상수

소속: 숭실대학교

강의 개요:

유전체 연구의 발전으로 많은 종들의 게놈 서열을 시퀀싱하는 시대가 도래하였다. 과거에는

생거방법으로 게놈 서열 시퀀싱을 하였기에 시간과 비용이 많이 들었지만, 최근에는

차세대염기서열분석장치를 이용한 연구가 주종을 이루고 있다. 하지만, 게놈 조립에서부터 유전자

예측 및 기능 부여 등의 기본 개념은 바뀌지 않았다.

본 강좌는 게놈 분석의 대부분의 과정을 거칠 수 있으되, 비교적 짧은 시간 안에 계산 결과를

얻을 수 있는 예제를 가지고 이론과 실습을 병행하는 과정으로 구성되어 있다. 즉, 생거 방법으로

시퀀싱되어 공개되어 있는 미생물의 게놈 서열 데이터를 다운로드하여 이를 조립함으로써 게놈

컨티그 서열을 얻어내고, 그 게놈 컨티그 서열에 코딩되어 있는 유전자들을 예측하며, 각종 blast

프로그램을 이용하여 예측된 유전자들의 기능을 부여할 것이다. 공통의 functional cluster 에

속하며 동일한 방향으로 게놈 상에 코딩되어 있는 유전자들은 하나의 오페론을 이룰 가능성이

농후하기에 그와 같은 후보 유전자 세트를 체계적으로 찾는 방법을 실습해 볼 것이다. 또한, 대상

미생물 근연종의 표준 게놈 서열과 비교하여 삽입 혹은 결실된 유전자들을 체계적으로 탐색하는

방법을 실습할 것이다. 모든 과정은 리눅스 컴퓨터 환경에서 이뤄질 것이기에, 생명정보 분석에

필수적인 최소한의 리눅스 명령어를 습득하고 연마할 수 있는 좋은 기회이다. 별도의 프로그래밍

언어에 대한 지식은 필수가 아니며, 리눅스 쉘 스크립팅을 이용하여 구현하는 방법을 배우게

된다.

참여조교: 이태림, 김규희, 임수정, 조창우, 임경백, 안진모

인터넷 접속 필요 (O) : 게놈 분석 프로그램 실행 (KOBIC 서버 사용 예정)

교육생 자체 노트북 지참 (O) : Window 7 이상

강좌별 수강생 수준 및 준비사항 : 리눅스 환경에서 생물정보 분석을 실습하고자 하는 생물학 전

공자

Page 16: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

교육 일정

일자 시간 강의 내용 담당 강사명 구분

Session 1

(09:20-10:50)

Genomics Timeline 및 게놈 서열

조립의 개념 김상수

강의

Day 1

2017.07.21(금)

Session 2

(11:00-12:30)

Scaffolding 의 개념 및 CAP3를 이용한

게놈 조립 실습 김상수 실습

Session 3

(14:00-15:30) CAP3 조립 결과 통계 및 가시화 김상수 실습

Session 4

(15:40-17:10)

Nucmer 를 이용한 삽입/결실 유전자

찾기 김상수 실습

Session 5

(09:20-10:50)

유전자 예측의 원리 및 GeneMark 를

이용한 유전자 예측 김상수 강의

Day 2

2017.07.22(토)

Session 6

(11:00-12:30)

BlastP, RSP-Blast 등을 이용한 유전자

기능 탐색 실습 김상수 실습

Session 7

(14:00-15:30) COG db 를 이용한 기능 클러스터링 김상수 실습

Session 8

(15:40-17:10) 오페론 구조 예측 김상수 실습

Page 17: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

12. 유전체역학 (Genomic Epidemiology)

강사: 박지완, 지선하, 조윤신

소속: 한림대학교 의과대학, 연세대학교 보건대학원, 한림대학교 자연과학대학

강의 개요: 최근 연구경향을 보면 미국의 Precision Medicine Initiative Cohort Program과 같이 대

규모 코호트의 추적조사 자료를 기반으로 한 질병의 예방법과 치료법 개발에 있어서 유전적 변이

와 함께 환경과 생활습관적 요인의 중요성이 강조되고 있다. 유전체역학은 유전과 환경의 상호작

용이 질병의 발생과 분포에 미치는 영향을 밝히기 위한 학문이다. 본 강좌에서는 최신 유전체역

학연구에서 보편적으로 사용되는 연구방법론을 소개하고 대표적인 분석 tool을 이용하여 임상-역

학-유전변이 데이터를 분석하고 결론을 추론하는 방법을 습득한다. 질병위험요인을 밝히기 위한

Study design(가족, 환자-대조군, 코호트 연구)과 연구유형(유전적 연관성,멘델리안 무작위분석법,

시계열분석, 유전-환경 상호작용, 유전위험예측)에 적합한 분석 tool 사용법, 표본수 산정, 통계분

석방법을 중심으로 중급수준의 분석능력 습득을 목표로 한다.

준비물: 노트북 지참, 인터넷 접속

조교: 홍은표, 정민영 (한림대학교 의과대학)

Page 18: th Asian Institute in Statistical Genetics and Genomicskogo.or.kr/UploadData/Editor/Conference/201705/D... · 등 r 을 활용한 자료 처리 방법론 그리고 상관분석 및

제12회

교육 일정

일자 시간 강의 내용 담당 강사명 구분

Session 1

(09:20-10:50)

Overview: Genome Epidemiology

▪ Heritability, Genetic Models

▪ Gene Mapping (Linkage/Association

Analysis)

▪ Microarray vs. Whole Genome Sequencing

▪ Web Resources; Sample size Calculation

LD and TagSNP selection

박지완 강의

Day 1

2017.07.21(금)

Session 2

(11:00-12:30)

Study Designs & Causal Inference

▪ Family Study: Transmission Disequilibrium

Test

▪ Case-Control Study Linear/Logistic

Regression

▪ Cohort Study

지선하 강의

Session 3

(14:00-15:30) Mendelian Randomization 지선하 강의/실습

Session 4

(15:40-17:10)

Gene-Environment Interaction

▪ Regression-based method – R

▪ High-order interactions - MDR

박지완 강의/실습

Session 5

(09:20-10:50)

Genome-wide Association Study

▪ Microarray data – Plink

▪ Meta-analysis – Metal

▪ Functional analysis – Polyphen & SIFT

조윤신 강의/실습

Day 2

2017.07.22(토)

Session 6

(11:00-12:30)

NGS Data Analysis

▪ NGS workflows

▪ Whole genome association analysis

- SKAT, Plinkseq

박지완/홍은표 강의/실습

Session 7

(14:00-15:30)

Follow-up Data Analysis - R

▪ Longitudinal data analysis

▪ Survival analysis

박지완/홍은표 강의/실습

Session 8

(15:40-17:10)

Genetic Risk Prediction – R

▪ Genotype Risk Scoring

▪ Model accuracy test (AUC plot)

박지완 강의/실습