ヒトマイクロバイオームの 解析手法論...ヒトマイクロバイオームの...

Preview:

Citation preview

ヒトマイクロバイオームの解析手法論

須田 亙理化学研究所生命医科学研究センターマイクロバイオーム研究チーム副チームリーダー

2018年7月3日大阪医科大学研究ブランディング事業「健康寿命をのばすたかつきモデル」学内シンポジウム

�K3�'/�SD87GFMILCG<

/#�

6+ 103-104�+Q�1R 1010 >700�� 108-109 >600�( 1012�05 1011

� �%Q�1R 1014 >1000) 101-104�, 104-107

�,Q$R 1011-1012 >1000"-Q�1R 1012"-05 105 >150

�� ��%Q�1R 1012

. 109

POT�KPO'*�U&=?�POT�K��'/K�U���!�

POT�KNJ2���@&<9<�

POT�K��/Q,�'/RK�J2��@>:���

,�'/A;8:::/#�!�4HU�;EB

Human microbiomeヒト常在細菌叢

次世代シークエンサーとは・・・$1,000 Human Genome Projectをモチベーションとして開発された技術を使用した超並列処理型DNAシークエンサー

2005年に454 GS20が市場に投入され、現在進行形でバージョンアップや新機種が開発されている。

16SデータのOTU(Operational Taxonomic Unit)解析Database類似度検索によるOTU菌種帰属の例:ヒト腸内細菌叢 3000readを用いた場合

)&������������ ����

0%

20 %

40 %

60 %

80 %

10 0%

*�4-�.4$! � #'( $/� ( $2�%4$!

+2$�( $/� *"( $/� ���

0%#

10%#

20%#

30%#

40%#

50%#

60%#

70%#

80%#

90%#

100%#

1# 5# 9# 13# 17# 21# 25# 29# 33# 37# 41# 45# 49# 53# 57# 61# 65# 69# 73# 77# 81# 85# 89# 93# 97#101#105#109#113#117#121#125#129#133#137#141#145#149#153#157#161#165#169#173#177#181#185#189#193#197#201#205#209#213#217#221#225#229#233#237#241#245#249#253#257#UNDEFINED# Others# Lysobacter# Tetrasphaera# Nesterenkonia# Megasphaera# BlauIa# Acidovorax# Nocardioides# Facklamia#AggregaIbacter# Ideonella# Selenomonas# Dialister# AllochromaIum# Parvimonas# OQowia# Oribacterium# Dermabacter# Cardiobacterium#Bradyrhizobium# Stenotrophomonas# Turicella# Caulobacter# Collinsella# Brevibacterium# Paraprevotella# Massilia# Brachybacterium# Williamsia#Pseudoclavibacter# Brochothrix# Thauera# Faecalibacterium# Lactococcus# Enterococcus# Ruminococcus# Flavobacterium# Aquabacterium# Paracoccus#Aerococcus# Campylobacter# Abiotrophia# Rhodobacter# MethyloversaIlis# TM7# Hydrogenophaga# Gordonia# Thermus# Janthinobacterium#Bifidobacterium# Eubacterium# Haemophilus# Klebsiella# Burkholderia# Cupriavidus# Bacillus# Capnocytophaga# Sphingomonas# Dermacoccus#Lautropia# Peptoniphilus# Bacteroides# Kocuria# Xanthomonas# Atopobium# Gemella# Porphyromonas# Fusobacterium# Mycobacterium#Enhydrobacter# Brevundimonas# Gardnerella# Paenibacillus# Microbacterium# Rhodococcus# Methylobacterium# Arthrobacter# Janibacter# Roseateles#Veillonella# Chryseobacterium# Clostridium# Deinococcus# Granulicatella# Del_ia# Finegoldia# Micrococcus# Pseudomonas# Lactobacillus#Rothia# Leptotrichia# AcInomyces# Anaerococcus# Moraxella# Neisseria# Prevotella# Acinetobacter# Streptococcus# Corynebacterium#Staphylococcus# Propionibacterium#

)&�����Phylum1,0

)&����Genus1,0

~73�→ → 59

�5�6 � � � �

��/4���69783 !":��;3����5�-0���5��.,��/4<��3�����3�-5���"('�)#$ %'*+#($&�2.1��/4�

Lozupone C & Knight R. Appl Environ Microbiol. (2005)

各サンプル(■, ■, ■)で形成されたOTU(菌種)の代表配列でTreeを描く。■と■の間の距離の計算は以下Unifrac distance = (2サンプルで固有の枝長[赤+黄色]) / (共通な枝を含む枝長の和[赤+黄+オレンジ])

http://bmf2.colorado.edu/fastunifrac/help.psp

UniFrac 解析

• 唾液細菌叢は腸疾患である炎症性腸疾患(IBD)と関連する• IBD患者と健常者の唾液細菌叢が有意に異なる

解析例炎症性腸疾患と唾液細菌叢の関連

Said HS, Suda W, Nakagome S, Chinen H, Oshima K, Kim S, Kimura R, Iraha A, Ishida H, Fujita J, Mano S, Morita H, Dohi T, Oota H, Hattori M. DNA Res. (2014) 21:15-25.

• PSC=原発性硬化性胆管炎• UCとPSCを見分けられる(腸内細菌叢より有効)

解析例PSC患者の唾液細菌叢変化

(A) (B)

1 - Specificity

Sens

itivi

ty

0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.2 0.4 0.6 0.8 1.0

GenusSpecies

1 - Specificity

Sens

itivi

ty

0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.2 0.4 0.6 0.8 1.0

GenusSpecies

AUC 0.8056AUC 0.9497

AUC 0.8906AUC 0.9323

PSC versus HC PSC versus UC

Iwasawa K, Suda W, Tsunoda T, Oikawa-Kawamoto M, Umetsu S, Takayasu L, Inui A, Fujisawa T, Morita H, Sogo T, Hattori M. Sci Rep. 2018 8:5480.

Genus AUC 0.8056Species AUC 0.9497

Genus AUC 0.8906Species AUC 0.9323

解析例ヒト唾液細菌叢の時系列変動

Firmicutes Bacteroidetes

0 12 24 36

Aut

o-co

rrel

atio

n co

effic

ent 1.0

0.5

0.0

-0.5

-1.0 0 12 24 36

1.0 0.8 0.6 0.4 0.2 0.0-0.2-0.4-0.6-0.8

Subject 1 Subject 2 Subject 3 Subject 4 Subject 5 Subject 6

Time lag (hr)

Subject 1

0

20

40

60

80

100

12:0

0

Rel

ativ

e Abu

ndan

ce (%

)

16:0

020

:00

0:00

4:00

8:00

12:0

016

:00

20:0

00:

004:

008:

0012

:00

16:0

020

:00

0:00

4:00

8:00

Subject 2

0

20

40

60

80

100

12:0

016

:00

20:0

00:

004:

008:

0012

:00

16:0

020

:00

0:00

4:00

8:00

12:0

016

:00

20:0

00:

004:

008:

00

Subject 3

0

20

40

60

80

100

12:0

016

:00

20:0

00:

004:

008:

0012

:00

16:0

020

:00

0:00

4:00

8:00

12:0

016

:00

20:0

00:

004:

008:

00

Subject 4

0

20

40

60

80

100

12:0

016

:00

20:0

00:

004:

008:

0012

:00

16:0

020

:00

0:00

4:00

8:00

12:0

016

:00

20:0

00:

004:

008:

00

Subject 5

0

20

40

60

80

100

12:0

016

:00

20:0

00:

004:

008:

0012

:00

16:0

020

:00

0:00

4:00

8:00

12:0

016

:00

20:0

00:

004:

008:

00

Subject 6

0

20

40

60

80

100

12:0

016

:00

20:0

00:

004:

008:

0012

:00

16:0

020

:00

0:00

4:00

8:00

12:0

016

:00

20:0

00:

004:

008:

00

Firmicutes Bacteroidetes Spirochaetes SR1Proteobacteria TenericutesActinobacteria SynergistetesFusobacteria TM7 Others

Subject 1

12:0

016

:00

20:0

00:

004:

008:

0012

:00

16:0

020

:00

0:00

4:00

8:00

12:0

016

:00

20:0

00:

004:

008:

00

Subject 2

0

20

40

60

80

100

12:0

016

:00

20:0

00:

004:

008:

0012

:00

16:0

020

:00

0:00

4:00

8:00

12:0

016

:00

20:0

00:

004:

008:

00

Subject 3

0

20

40

60

80

100

12:0

016

:00

20:0

00:

004:

008:

0012

:00

16:0

020

:00

0:00

4:00

8:00

12:0

016

:00

20:0

00:

004:

008:

00

Subject 4

12:0

016

:00

20:0

00:

004:

008:

0012

:00

16:0

020

:00

0:00

4:00

8:00

12:0

016

:00

20:0

00:

004:

008:

00

Subject 5

0

20

40

60

80

100

0

20

40

60

80

10012

:00

16:0

020

:00

0:00

4:00

8:00

12:0

016

:00

20:0

00:

004:

008:

0012

:00

16:0

020

:00

0:00

4:00

8:00

Subject 6

0

20

40

60

80

100

12:0

016

:00

20:0

00:

004:

008:

0012

:00

16:0

020

:00

0:00

4:00

8:00

12:0

016

:00

20:0

00:

004:

008:

00

Streptococcus HaemophilusGemella AggregatibacterEubacterium PeptostreptococcusMegasphaera AbiotrophiaBergeyella Tannerella

Prevotella VeillonellaFusobacterium AlloprevotellaSolobacterium OribacteriumParaprevotella SelenomonasLachnoanaerobaculum Mycoplasma

Neisseria ActinomycesPorphyromonas LeptotrichiaCampylobacter LautropiaAtopobium CatonellaDialister Peptococcus

Rothia GranulicatellaCorynebacterium CapnocytophagaParvimonas TreponemaFilifactor KingellaCardiobacterium Synergistes

Others

0

20

40

60

80

100

a

b

Rel

ativ

e Abu

ndan

ce (%

)R

elat

ive A

bund

ance

(%)

Rel

ativ

e Abu

ndan

ce (%

)

0.1

0.2

0.3

0.4

Wei

ghte

d U

niFr

ac d

istan

ce

ST DT0.10

0.15

0.20

0.25

0.30

Subject 1

0.100.150.200.250.300.35

Subject 2

0.100.150.200.250.300.35

Subject 3ST DT ST DT

* *

a

b

唾液細菌叢は概日周期を持って変動している

0

2 00

4 00

6 00

8 00

1 00 0

1 20 0

1 40 0Read #

Errors/read0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

0

20 0

40 0

60 0

80 0

10 00

12 00

14 00

16 00

18 00Mock 3Read #

Errors/read0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

NGSによる16Sアンプリコンシークエンスのエラー率

N=3,000 reads

N=3,000 reads

Mock2

Mock1

エラー率は0.5%程度

Roche�454�������

Mock:���~10���� �����

0

50

100

150

200

250

300

350

400

450

0 1000 2000 3000 4000 5000 6000 7000 8000 9000

OTU

0

0.2

0.4

0.6

0.8

1

1.2

0 1000 2000 3000 4000 5000 6000 7000 8000 9000G

ood'

s cov

erag

e

0

100

200

300

400

500

600

700

800

900

0 1000 2000 3000 4000 5000 6000 7000 8000 9000

chao

10

0.5

1

1.5

2

2.5

3

3.5

4

4.5

0 1000 2000 3000 4000 5000 6000 7000 8000 9000

Shan

non

A B

C D0

50

100

150

200

250

300

350

400

450

0 1000 2000 3000 4000 5000 6000 7000 8000 9000

OTU

0

0.2

0.4

0.6

0.8

1

1.2

0 1000 2000 3000 4000 5000 6000 7000 8000 9000

Goo

d's c

over

age

0

100

200

300

400

500

600

700

800

900

0 1000 2000 3000 4000 5000 6000 7000 8000 9000

chao

1

0

0.5

1

1.5

2

2.5

3

3.5

4

4.5

0 1000 2000 3000 4000 5000 6000 7000 8000 9000

Shan

non

A B

C D

����OTU�

Good’s�coverage��

16S シークエンスエラーによる菌種(OTU)数のOverestimation

Good’s coverage index:1 - (F1 / N)F1 : the number of singleton OTUs N : sum of abundances for all OTUs

��104����� ��16S���

����

…ACGCGCAT……CGATTCAG……GATGCAGC……CCGTAACG……AATAGCAT……CGCGCTAG…

糞便検体 菌体の回収 ゲノムDNAの調整 メタゲノムデータ

Wet ����

Microbial profileSpecies A Species B Species C

Assembly・gene information Functional profileGene A Gene B Gene C

情報解析工程

NGS

Functional gene DB�KEGG/COG�Ref genome DB (6,200 genomes; 2,373 clusters )

Whole genome shotgun sequencingDNA��

0%10 %20 %30 %40 %50 %60 %70 %80 %90 %

10 0%

O the r gene ra @Er ys ip elo tr i chaceae_ge nus Pr evot el la Do re a Col li nsel laPar abact er oi des Cl ost ri di um Faecal ib acte ri um Eub acte ri um Bl aut iaRum i nococcu s Bi fi dob acte ri um Bact er oi des

0%10 %20 %30 %40 %50 %60 %70 %80 %90 %

10 0%

Cel l m ot il it y Secondar y m etabo lit es b iosynt hesi s , tr anspor t and cat abol ism Cel l cycl e cont ro l, cell di vis io n, ch rom osome par ti t ioni ngI ntr acell ular t r aff i cki ng, secr et ion, and ves icul ar tr anspor t Lipi d t r ansport and m et aboli sm Funct ion unknownNucl eoti de t r anspor t and m et aboli sm Post tr ans lat io nal m odi fi cati on, pr otei n t ur nover , chaperon es Coenzym e t ran spor t and m etabol ismSignal t r ansducti on m echanism s Ener gy pr oduct ion and conver s ion Def ense m echanism sCel l w all / mem br ane/ envelope biogenes i s Tr ans lat ion, r ib osom al s tr uct ur e and biogenes i s I norgani c i on t r ansp ort an d m etabol ismTr anscr i pti on Am ino acid tr anspor t and met aboli sm Repl icat ion, r ecom binat ion and r epai rGener al f uncti on pr edi cti on onl y Car bohydr ate t ranspor t and met abol ism

���� ����

����������

日本人腸内細菌叢メタゲノム解析例

20

種数

遺伝子機能数(KEGG)

0.9

0.92

0.94

0.96

0.98

1

100 1,00010,0

00100

,000

1,000,00

0

10,000,0

00

00.10.20.30.40.50.60.70.80.91

100 1,00010,0

00100

,000

1,000,00

0

10,000,0

00

相関係数(KEGG)

相関係数(種組成)

0200

400600800

1,0001,200

100 1,00010,0

00100

,000

1,000,00

0

10,000,0

00

0500

1,0001,5002,0002,5003,0003,5004,0004,5005,000

100 10,000

1,000,00

0

0.990.999

0.9990.99

a

b

c

d

メタゲノムデータ量と菌種/機能組成との関連

������!��" !��#

����� �/������� 10M !��������� (person)

KYIQYF;+$�

0

20

40

60

80

100

KYIQYF*�:��:NJL4>

TI

16SKYI;��[Z\

RBF NLPI RYUGJL

NL�� #8<2007�:�-DXHYEAS81>International Human Microbiome Consortium (IHMC)2�(37�,.��%�8VO@WXFCMS*�;��?)=6/5;!�.��8<.�;KYI2VO@WXFKYIQYF:hit4>

�09�;"� #�;TI16S&�!�

0%10%20%30%40%50%60%70%80%90%

100%

apr 01. 1 apr 02. 1 apr 03. 1 apr 09. 1 apr 12. 1 apr 16. 1 apr 17. 1 apr 39. 1 apr 40. 1

Bacteria Unknown Virus Fungi Human

���9 ;TICMSKYI;�'

Wet 8:4/9( �

• DNA����7=2���$���>�"Kit)$#����

• ���<�������(-80℃)$ �$����>��*?

*��(����'%&�+*)!�RNAlater$.,51;3-0,6=4$etc,,,

����-371�+462075��

8���#�� ������+ �,��8.'(!��)371�+�,������+ ���

IHMC Protocols(ビーズ法)

熱処理(Qiagen kit)

酵素法

Beads破砕 ●

酵素反応 ●

SDS ● ● ●フェノクロ処

理●

カラム精製 ● ●

PEG処理 ●

Gram − :���#�$�* �&/Gram + :���#�$ �%*$"

再現性 16Sリージョン(V12 vs V34)

16Sリージョン(V12 vs V68)

16Sリージョン(V34 vs V68)

シークエンサー(454 vs MiSeq)

抽出法(酵素法 vsBeeds法)

個人内 個人間(日本人健常者)

個人間(UC患者)

0.0

0.2

0.4

0.6

0.8

1.0

個人間(日本人健常者vs UC患者)

��8<4-?;�5:3+$���>���5:3+' �

�� 16S V12 vs V34

16S V12 vs V68

16S V34 vs V68

/?,*=.?454 vs MiSeq

��

! 6?0

��� ���

���

���

�� ! ��

���

���! ��

8<4-?;'�"(��� �&�#%"

7)1=�

��

92�����

����/�!.�� �>75:="�/�

• �*.��'• �B<A,/���• ��-/($• 10 M��/%��

Year Subject# Country NGS Reference2010 124 Denmark, Spain Illumina Qin J. et al., Nature2012 345 China Illumina Qin J. et al., Nature

201396 Russia SOLiD Tyakht AV. et al., Nature Com.145 Sweden Illumina Karlsson FH. et al., Nature

2014237 China Illumina Qin N. et al., Nature196 France, Germany Illumina Zeller G. et al., Mol. Sys. Biol.

2015156 Austria Illumina Feng Q. et al, Nature Com.212 China Illumina Zhang X. et al., Nature Med.900 Israel Illumina Zeevi D. et al., Cell

2016106 Japan 454, IonPGM, Illumina Nishijima S. et al., DNA Res.

1,179 Netherlands Illumina ZhernakovaA. et al., Science

Short-read NGS data with ≤150 bp read-length

�.;8��� �>75:="�� 06?C8@C9NGS (#12��&150base��)4�)+)3

FPacBio RS II (SMRT sequencing)→�AE8�~10 kb.F��AE8�(��&���)4D=B �����%���0D6*.��$'&F;7����" ������!2� #

Tota

l bas

es/r

un

100Mb

1Gb

10Gb

100Gb

1Tb

100bp 1,000bp 10,000bp0bp Read-length

HiSeq

IonPGM

PacBioIonProton

454

��NGS :<,E>D3��

MiSeq

CD.AE82E-+D1E(���@5/9?��

F�'$ ���!�AE8��~3kb

1. Leonard,M. T. et al. humangutmicrobiome in Front.Microbiol. 5, 361 (2014).2. Tsai, Y. C. et al. human skinmicrobiome inmBio7, e01948-01915 (2016).

Recommended