21
Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014)) Supplementary Figure 1. Depth profiles of cross-contigs. Depth profiles of the cross-contigs containing reads from five through twelve samples, showing the highly correlating occurrence of the most ubiquitous cross-contigs. For details see Supplementary Data 1.

Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

Embed Size (px)

Citation preview

Page 1: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

Supplementary Figure 1. Depth profiles of cross-contigs. Depth profiles of the cross-contigs containing reads from five through twelve samples, showing the highly correlating occurrence of the most ubiquitous cross-contigs. For details see Supplementary Data 1.

Danielle.McLean
Text Box
Page 2: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

Ladder:

Supplementary Figure 2.������������ �������������������� ����������������� ��������������� ����������������� ��� ���� ��������� ��!���������"���� ������������#����� ����������������������$�� �������������� �������������!���������"�� �����%��� ��&����'��������� ��%����&*��������������� �������� ����������������� ��������� ��+�/�����3������������ ��� ��������'��������� ��/�����&����������� ���������������������������� ����5���������'��� �����!�����������5������

F1R1 F1R2 F2R2 F3R3 F4R4 F4R6 F5R5 F6R6 F7R7 F8R8 F8R10 F9R9F9R8 F11R11 F12R11F10R10 F11R10 F12R12 F13R13 F14R14 F14R17 F15R15 F16R16 F17R17F17R16 F17R20 F18R18 F19R19 F20R20F20R19 F21R21F21R20 F21R22 F22R21 F23R23 F24R24

Feca

l vira

l sam

ple

TSD

C8.

2Fe

cal v

iral s

ampl

e TS

4.2

5,009 10,139 5,920 5,419 4,333 16,188 8,022 6,269 2,706 5,184 12,486 5,1671,040 5,295 7375,344 699 5,095 3,908 5,197 18,342 5,327 5,810 5,971498 17,356 5,728 5,468 4,499924 5,587840 9,615 1,495 5,794 4,838

10 kb8 kb6 kb5 kb4 kb3.5 kb3 kb2 kb1.5 kb1 kb750 bp500 bp250 bpBand

Page 3: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

(A) orf00068

(B) orf00077

(C) orf00079

(D) orf00019

Page 4: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

orf00019 (continued)

Page 5: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

orf00019 (continued)

Page 6: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

orf00019 (continued)

Page 7: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

(E) orf00021

(F) orf00028

(G) orf00032

(H) orf00034

(I) orf00036

Page 8: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

(J) orf00040

Page 9: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

(K) orf00097

Page 10: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

(L) orf00041

(M) orf00042

(N) orf00050

Supplementary Figure 3. Unrooted maximum likelihood phylogenetic trees of crAssphage ORFs orf00068 (A); orf00077 (B); orf00079 (C); orf00019 (D, this large tree is split over four pages, the inset on each page shows which part of the tree is displayed); orf00021 (E); orf00028 (F); orf00032 (G); orf00034 (H); orf00036 (I); orf00040 (J); orf00097 (K) orf00041 (L); orf00042 (M); and orf00050 (N) with Genbank homologs. In each tree, the crAssphage ORF is indicated with a dashed arrow. The Phylip files for these trees are available from the authors on request.

Page 11: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))
Page 12: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))
Page 13: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))
Page 14: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))
Page 15: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))
Page 16: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))
Page 17: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

Supplementary Figure 4. Phage proteomic tree of 1,193 complete viral genomes including crAssphage. CrAssphage and the two Bacteroides phages B124-14 and B40-8 are indicated with a dashed arrow in red. This large tree is split over four pages, the inset on each page shows which part of the tree is displayed.

Page 18: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

0 100 200 300 400 500 600 700 800 900 1,000 1,100 1,200

Supplementary Figure 5. Domain structure of orf00074, including eight BACON domains. The shading intensity ������������������ �+�� ����=��� ����>�*�??+�&@�?Q+�*Q�VV+�&?�WQ+�3*�@X+�&Q�&*+�3�X3+����&X�3?�

Page 19: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

orf0

0001

orf0

0003

orf0

0004

orf0

0007

orf0

0009

orf0

0010

orf0

0011

orf0

0012

orf0

0013

orf0

0014

orf0

0015 or

f000

16or

f000

17

orf00

018

orf00

020

orf00022

orf00023

orf00024

orf00025

orf00026orf00027

orf00029

orf00031orf00032

orf00033

orf00035

orf00036orf00037

orf00038orf00039orf00040orf00041orf00042orf00044

orf00045orf00046orf00047

orf00050

orf00081

orf00101 orf00102

orf00052

orf00053

orf0

0054

orf0

0055

orf0

0056

orf0

0057

orf00

059

orf00

060

orf00

062

orf00

063

orf00065orf0

0066orf00067orf00068orf00069orf00070orf00071orf00072

orf00073

orf00074

orf00075

orf00076

orf00077

orf00078

orf00079orf00080

orf00081

orf00082

orf00084

orf00086

orf00088

orf00091

orf00092

orf00094orf00095

orf00096 orf00097orf00098 orf00099orf00093

10 0

10 1

10 2

10 3

10 4

10 5

10 6

ORFs on forward strandORFs on reverse strand

Gut metagenomes (n = 446)F2T1 metagenome (ref. 8)

Other metagenomes (n = 2,440)PCR amplicons, and sequenced regions

0

5,000

10,000

15,000

20,000

25,000

30,000

35,000

40,000

45,00050,000

60,000

55,000

70,000

65,000

80,000

75,000

90,000

85,000

95,000

F1R1

F22R21

F21R21

F21R22

F20R20

F18R18

F19R19

F17R17 F17R16

F14R17

F15R15

F16R16

F14R14 F13R13

F12R12 F11R11

F10R10F11R10

F12R11

F9R9

F8R8F9R8 F8R10

F7R7

F6R6

F4R6

F5R5

F4R4

F3R3

F1R2

F2R2

F24R24

F23R23

F21R20

F17R20

F20R19

Supplementary Figure 6.�'�������� �� ��������������� ���� �� ���������������/��������������V?�Y�%��������� ��� �������������Z����� �� ������������ ������/����������� �������������������������%3/&���������+�����������������������������[Z���'/�������������\]QQ���������������3+]]?���� ����������+�������� ��������������������>�^WX����������������^@X_�������+�����[�����`��Z ����� ��������������*Q� ������������ ������������������ ��������\����/�����3����'��������� ��/�����&`��'�������� ����������� ���������������\������������������� ��� ������������ ����� �`��� ����5���������'��� �����!�����������5������������������������������������ ���������� ������ ������� ��������������\'��������� ��/�����&`�

Page 20: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

crAs

spha

ge

Bact

eroi

des

sp 3

2 5

Bact

eroi

des

sp 2

1 1

6

Bact

eroi

des

sp 2

1 5

6FAA

����

���

���

���

����

����

����

���

���

���

����

���

Bact

eroi

des

fragi

lis 3

1 1

2

����

�����

���

����

����

����

�1

Bacte

roide

s egg

erth

ii DSM

206

97

B����

���

�����

����

����

����

AA

Bacteroides xylanisolvens XB1A draft genome

Bacteroides xylanisolvens XB1A

������������������!����"#�����$

�����������!��%��"#������

Bacteroides s

p D1

Bacteroides sp 2 1 22

Bacteroides s

p D22

Bacteroides s

p 1 1 30

Bacteroides s

p D2

Bacteroides s

p 3 1 23

Bacteroides o

vatus 3�� 47FAA

�����������

!��%����������&

Bacteroides s

p 2 2 4

�����������

!��%��"

#��'��&*

Bacter

oides

sp 1

1 6

Bacteroides s

p 1 1 14

Bacter

oides

fineg

oldii D

SM 1756

5

������

���

������

�����

�����&��

&

Bacter

oides

claru

s YIT 12

056

������

���

�!%���

�%��+

���0

Bacter

oides

sp 4

3 47F

AA

Bacter

oides

sp 3

1 40A

Bacter

oides

sp 9

1 42F

AA

Bacter

oides

sp 3

1 33F

AA

������

���

����

�#"'��-

���

Bacter

oides

dorei

5 1 3

6 D4

�����

���

�� ��$

�%��#

"'��

-�&�

Bacte

roide

s cop

roco

la DSM

1713

6

Bacte

roide

s unif

orm

is AT

�����/

Bacte

roide

s sp

4 1

36

Bacte

roide

s sp

D20

+��!

����

����

����

����

�#"'

����

��

Bact

eroi

des

fluxu

s YI

T 12

057

����

���

���

�� �

� �

�%��

#"'

����

��

+���

$���

���

���

� �#

�&

Bact

eroi

des

sp 3

1 1

9Ba

cter

oide

s sp

2 1

33B

Bact

eroi

des

sp 2

1 7

Bact

eroi

des

sp 2

0 3

Bact

eroi

des

inte

stin

alis

DSM

173

93

����

���

���

����%

���

����

%��#

"'��

��&�

O�

�$��

�����

���%

��;I

T 12

061

Bact

eroi

des

cacc

ae A

T��

431

��

���

� ��

����

��<

�>��

&���

��*

�����

�?��

���

� ��

����

��<

�>�&

��Al

istip

es p

utre

dini

s D

SM 1

7216

Alis

tipes

indi

stin

ctus

YIT

120

60

Prev

otel

la s

aliv

ae D

SM 1

5606

+��!

����

����

� ��

#"'

����

��

+���

��!

����

����

����

���;

@���

����

+���

��!

����

����

����

�;@�

����

��#

����

��?

����

�?��

��#

"'��

��&�

+���

$���

���

���

?��

���

���

���

&���

Para

$act

eroi

des

john

soni

i DSM

1�3

15

Parasutterella excrementihom���;@������/

�%�E����������$�����%m 1 1 47

Bilophila wadsworthia 3 1 6

Bilophila sp 4 1 30

D��%�*�!$���� ����������A

#��%�*�!$���� �&������&

#��%�*�!$��� ����������/�/�

�����$�����%?�?��%�E��#"'����/-

G����$������ �?�������-������$���*������?e

H����$������ �?�������-���$�

�ollinsella stercoris DSM 13279

���������������������#"'��&���

�ollinsella aerofaciens AT�� 259�6

�*�$�����%?�� �������-����

�*�$�����%?�����%?��%$� �����%?�����*�$�����%?�����%?��%$� �����%?�����

Bifido$acterium longum su$sp infantis 157F

�*�$�����%?�����%?��%$� �����%?�J�'����-

�*�$�����%?�����%?��%$� ��*�������KH������

B*�$�����%?�$��!��#SM 20213

�*�$�����%?�����%?��%$� ��*�����J�'�����

�*�$�����%?�����%?��%$� �����%?������*������?���*�$�����%?�����%?�����%?���

Bifido$acterium longum su$sp longum AT�� 55�13

B*�$�����%m pseudocatenulatum DSM����&��J�M 1200 strain DSM����&�

�*�$�����%?� ��%������%���%?�#���

�*�$�����%? catenulatum DSM���//��J�' 1194 strain DSM 16992�*�$�����%?����%?�������-�-�

�*�$�����%?����%���%?�#"'����/�

�*�$�����%?������������>��&�

�*�$�����%?�$*%?�N�@'�����-�

�*�$�����%?������%?�#"'����/&

������%?�� ��*��?��#"'�����

Acidaminococcus sp D21

Yokenella reg���$%rgei AT�� 43003

�itro$������� �&��2

����$������*��%����-��-����

����$��������%��������� 29220

Q�����$����������������%���T���&�&��

Kle$siella sp MS 92 3

V��$������ ��%?������%$� � ��%?�����<H><

V��$������� �������

V��$������ ��%?������%$� � ��%?�����<H><

3

Q�����$���������������%$� ���������N����/&/����*������?��

Q�����$��������������N���/&/�Escherichia sp 4 1 40B

Escherichia coli 4 1 47FAA

Escherichia coli MS 79 10

Escherichia coli MS 107 1

Escherichia sp 1 1 43

Escherichia coli MS 145 7

Escherichia coli M"�����

Escherichia coli MS 124 1

Escherichia coli MS 119 7

Escherichia coli SE11

Escherichia sp 3 2 53FAA

Escherichia coli SE15

Escherichia coli M"����1

Q�������������'"������

Escherichia coli MS 196 1

Escherichia coli MS 117 3

Escherichia coli MS 175 1

Q�������������'"�-��1

Escherichia coli MS 116 1

Escherichia coli MS 146 1

Escherichia coli MS 115 1

Escherichia coli MS 1�- 1

Escherichia coli MS 69 1

Q�������������'"��/���

Escherichia coli MS 21 1

Escherichia coli MS 60 1

Q�������������'"������

Escherichia coli MS 16 3

Escherichia coli MS 110 3

Escherichia coli MS 45 1

Escherichia coli MS 153 1

Escherichia coli MS 57 2

Escherichia coli MS 200 1

Kle$siella sp 4 1 44FAA

+��!�������%�������������-

Z�*�����!����������-&

+����%�� �����������&��/�

Q[�������������������&���

Providencia alcalifaciens DSM 30120

Providencia rettgeri DSM 1131

Providencia rustigianii DSM 4541

+����%��?��$���<H><�

Q�����$�����������$�����%?�/��������

Turic$acter sp HGF1

�%��$����������%���+�/�/

#��������%����� ��%��;@�������

Veillonella sp 6 1 27Veillonella sp 3 1 44�%��$�����%?�� �����&��%��$�����%?�� ����������

��? ���$������� ��������

Sutterella wadsworthensis 3 1 45B

Sutterella wadsworthensis 2 1 59BFAA

"%��������� ��!�%$���;@�������

Ralstonia sp 5 7 47FAA

Ralstonia sp 5 2 56FAA

Acineto$��������dioresistens SH164

������$������^%��"Z���

Succinatimonas hippei YIT 12066

Neisseria macacae AT���&&/��

Oxalo$acter formigenes OX��13

Pseudomonas sp 2 1 26

Parvim�����?���������&&�-��%��$�����%m varium����� 27725

�%��$�����%?�%��������������/���

�%��$�����%?�� ������

�%��$�����%?�?���*��%?������/��7

�%��$�����%? sp D12

�%��$�����%? necrophorum��%$� �*%�%�*��?e 1 1 36SFu��$�����%? sp D11

�%��$�����%? sp 7 1

�%��$�����%?�� ������

�%��$�����%? sp 3 1 33

�%��$�����%?�� ����&��

�%��$�����%?��%�����%?��%$� ���?������������/�

�%��$�����%?�� ������&

�%��$�����%?�� �&����-

�%��$�����%?�� �&���&���

�%��$�����%?�� �&����R

F%��$�����%? gonidiaformans AT�������&

+�� ��$�����%?�� ���K������AM������$��!$�������mithii DSM 2375M������$��!$�������mithii DSM 2374

�oryn�$acterium ammoniagenes DSM 20306

>����$����%��� �-����-���

��������?�����������/&��

Anaerococcus hydrogenalis DSM 7454

Enterococcus faecalis TX4244Enterococcus faecalis TX1467Enterococcus faecalis TX1346

Enterococcus faecalis TX2134Enterococcus faecalis TX1322

������%?���������#"'��&�-�

Streptococcus sp 2 1 36FAA

"��� ������%��������%���������V

Streptococcus infan���%���%$� ��*�ntarius AT�� BAA 102

"��� ������%���_%�%�������/��2

>����$����%�����!���%��#"'����-�Enterococcus saccharolyticus 30 1

Enterococcus faecium TX1330>�%���������?������������%$� ����?����������/���

>����$����%�� ���������%$� � ���������������&��

>����$����%�� ���������%$� � ���������-����

Weis

sella

param

esen

teroid

es A

T�� 33

313

Pedioc

occu

s acid

ilacti

ci DSM���

���

Pedioc

occu

s acid

ilacti

ci 7 4

Synergistes sp 3 1 syn1

A�����$��%�um hydrogeniformans AT�� BAA 1�50

Z����$������[����?���������������&�

Z����$������ %����%?�'@��/�����/

H����$������ ������3 complete genome

Z����$������ �����&�����? ���������?��Z����$�������������KH������

�ampylo$acter upsaliensis�JV21

��m ���$����������JV20Arco$acte��$utzle��JV22

Z����$���������������'@��/����/�

Z����$������$���������&�-/

������� ������$������&

Enterococcus faecalis TX1342

Enterococcus faecalis TX1341

+���$����%��� �ZGF7

>����$����%�������#"'�����1

�����%��� �-������������2+���$����%��� �ZH��

Mitsuokella multacida DSM 20544

Megamonas hypermegale ART12 1 draft genome

M���?�����*%�*��?��;@�������

Megamonas hypermegale ART121

#��%�*��$�����%?���*������#+-

Listeria innocua AT�� 33091

Listeria grayi DSM 20601

Q���������%��*�

������+���1

>����$����

%��%��%�����

�#"' 16047

>����$����

%����

� ��%������ 4796

>����$����

%���?���

����%��#

"'������

������%?��

�����������������-/

������%? sp

7 2 43FAA

�lostridium perfri

ngens WAL 14572

>����

$����

%����

%����'

M2 3

Lacto

$acill

us fe

rmen

tum AT�� 14

931

Lacto

$acill

u��$u

chne

ri AT�� 11

577

>����$����

%��$��!�

��%$�

����!���

����������-&��

>����

$����

%���

����

��������

/�

Bacillu

s smith

ii 7 3

47FAA

Lacto

$acil

lus rh

amno

sus L

MS2 1

>����

$���

�%����

�?��

�%���

������

���

>����

$���

�%����

�?��

�%���

�����

&��3

>����

$���

�%����

%����"

#����

���? ��

�����

��?�

>����

$���

�%����

%����'

'���A

>����

$���

�%����

%����J

�'�����

>����

$���

�%��*�

�?en

tum

IFO 3

956

>����

$���

�%��

�����

�%?

��%$�

� ��

����

%? A

T���

��/�

-

>����

$���

�%��

��$�%

��E

��%$�

����

���#

"' 2

0072

O��

��$�

����

�*��?

igen

es H

OxB

LS

>���

�$��

��%��

��%�

����

����

&�En

tero

cocc

us s

p 7L

76 d

raft

geno

me

Ente

roco

ccus

sp

7L76

Q���

����

��%�

�*���

%?

�+��

�1

Ente

roco

ccus

faec

alis T

X213

7

Ente

roco

ccus

faec

alis T

X130

2

����

��%

?�

**��

��N�

+�-

����

��

%?�

**�

���N

�+��

Ente

roco

ccus

faec

alis

TX01

04

Brac

hysp

ira p

ilosic

oli W

esB

Anae

rofu

stis

ster

corih

omin

is DS

M 1

7244

"%$

���

���%

�%?

�� �

��&�

����

���

�����

�����

�����

E��

�;@�

����

�&

+�����������$�����%?��%�����%�����;@������-Phascolarcto$acterium sp YIT 12067

Erysipelotrichaceae�$acterium 3 1 53

Q��� �������������$�����%?��������

Ruminococcus torques AT�� 27756

>������ �������$�����%?�&��������

Lachnospira�����$�����%m������7FAA

>������ �������$�����%?������-���

>������ �������$�����%?�-��������

���!��*������� ��%��������/��&

Eggerthella sp HGA1

Eggerthella sp 1 3 56FAA������%?�$������������������&

E%$�����%? sp 3 1 31

Q��� �������������$�����%?����&

������%?�**����-����������

Rum������%�����!%������ 29149

>������ �������$�����%?��������AA

Lachnospiraceae $acterium 9 1 43BFAA

>������ �������$�����%?�����&-���

�� ��$����%��� �#-

������%?���?��%?�#"'�����

Anaerostipes sp 3 2 56FAA

>������ �������$�����%?����������

�� ��$����%��� �&�&������

>������ �������$�����%m 6 1 63FAA

>������ �������$�����%? 1 4 56FAA

�lostridium nexile DSM��-�-

���%����������#"'�����&

������%?������[���<�>�������opro$�cillus sp���� 54BFAA

Anaerostipes caccae DSM 14662>������ �������$�����%?������&���

������������ �""������*������?��

������������ �""��

�lostridium sp SS2 1������%?�����?�����#"'�����&

�lostridium�$artlettii DSM 16795

�� ��$����%��� �#�

�� ��$����%��� ��/�1�lostridium leptum DSM 753������%?�� �ZH��

Lachnospiraceae�$acterium 5 1 57FAA

�lostridium clostridioforme 2 1 49FAA

������%?�������������&�-��

Q%$�����%?�����%?�#"' 3991

������%?�� �#�

>������ �������$�����%?�&����-������1

������%?���?$��%?�<�>����-&

������%?������[���#"'��&�-/

������%?���������W�>��-���

�����������$�����%?���-��-����

�����������$�����%?���-��-������������-��-����

Holdemania filiformis DSM 12042

�lostridium sp 7 3 54FAA

Rum

inococcus torques L2 14 draft genome

Rum

inococcus torques L214{

%?������%�����������

���

��/�-� #��

�����

���

����

��#

"'

��&�

��

Rum

inoc

occu

s sp

SR

1 5

draf

t gen

ome

Rum

inoc

occu

s sp

SR

15R

umin

ococ

cus

sp 5

1 3

9B F

AAR

umin

ococ

cus

sp 5

1 3

9BFA

A st

rain

5 1

39B

FAA

E%$�

����

%m

hal

lii D

SM 3

353

#��

���*�

�?�

���

����

���

���

��--

��D

orea

form

icig

ener

ans

4 6

53A

FAA

Q%$�����%?�!������%?

�����

��-���Eu$�cterium

�$*��?e D

SM 3/�9

�� ������%����?

���">-��

� ������%����?����

���

��--��

�� ������%�����%��H

#�-���*������?

���

� ������%�����%��H#

-

R��

�$%�

��n

ulin

ivor

ans

DSM

����

��

{��

�$%�

���

����

���

��|

����

���

*����

��?

��

Ros

�$%�

���

����

���

��|

B6B4

{��

�$%�

���

����

���

��'

����

���

*����

��?

��

{��

�$%�

���

����

���

��'

���

Ros

e$ur

ia in

test

inal

is L

1��2

�%��

�!$

����

����

��%�

�#"'

���-

Bact

eroi

des

pect

inop

hilu

s AT

��

432

43

>���

�$��

��%��

�%?

��

����

���

����

�%��

�!$

���*

$��

��!�

����

��

Q%$�

����

%?

�����

����

'��

����

��*

�����

�?e

Q%$�

����

%?

�����

����

'��

��

E%$a

cter

ium

rect

ale

DSM

176

29 d

raft

geno

me

Q%$�

����

%?

�����

����

����

�%��

�!$

���*

$��

��!�

����

����

��*

�����

�?��

�lo

strid

ium

sp

L2 5

0

���

���

���

���

�""&

���

��*��

����

?�

���

���

���

���

�""&

{%?

������%���$�%?����

���/�-�

Rum

inococcus o$eum A2 162 draft genom

e {

%?������%���$�%?

������

Q%$�����%?��������������-���*������?

��Q%$�����%?

�������������-

�lostridium

asparagiforme D

SM 15/�1

Su$doligranulum va��$ile DSM 15176

Q��� �������������$�����%?�������

{%?������������$�����%?�#��

+��%�*��!��*��������� ����%��������/-//

Q��� �������������$�����%?����������

�lostridium saccharolyticum

like K10 draft genome

������%m saccharolyticum

like K10

�lostridiales sp SM4 1 draft genome

�lostridiales sp SM41

Rum

inococcu��$��mii L2 63 draft genom

e

{%?

������%��$��?�>��&

Blautia hydrogenotrophica DSM

10507

������%?

�?����� �����%?

�#"'

���-�

Anaerotruncus colihominis D

SM 17241

Marvin$ryantia form

atexigens DSM

14469

Q%$�����%? siraeum

V10S������*������?e

Q%$�����%?�����%?

�}��"���

Q%$�����%?�����%?

�#"'

���-��

Q%$�����%? siraeum

70 3 draft genome

Q%$�����%? siraeum

703

�lostridium sym

$��%? W

AL 14163

������%?�� �'

���1

Ruminococcus sp 1�+13

{%?������%�����?

������������ ����������+�&����*������?�

�� ������%��� ��{��������*������?��

�� ������%��� ��{����

�� ������%���%����%��������--�/������$�����%?

� ��%���~�">&�&���*������?��

������$�����%? prausnitzii SL33

������$�����%?� ��%���~�'

����

������$�����%? prausnitzii A2 165

������$�����%m cf prausnitzii KLE1255

������$�����%?� ��%���~�>������*������?

��

������$�����%?� ��%���~�>��

������$�����������������������FirmicutesProteobacteriaBacteroidetesActinobacteriaOther

Supplementary Figure 7.������������ ������������������ ������ ��������������j ��������� ��������� ������ �������������� z������ ���&X&�{[������������������������� ��������+����$��#���� ������ ��������������������+����]?]���������������� ��������������� �����������/����������� ���������������������������������

Page 21: Metagenomic analysis reveals a novel bacteriophage ... · Metagenomic analysis reveals a novel bacteriophage abundant in human feces (B.E. Dutilh et al., Nature Communications (2014))

Supplementary Table 1. Regions sequenced by Sanger dideoxynucleotide sequencing and their origin. Sample: sample of fecal virus-like particle (VLP) derived DNA used for amplification, see Methods for details. Primers: primer pair used for amplification by long-range PCR; see Table 2 for sequences; see Supplementary Figure 6 for region; see Supplementary Figure 2 for band. Amplified: start and end positions of the amplicon. Sequenced: start and end positions of the region sequenced by Sanger sequencing. Identity: percent identity of the region sequenced by Sanger sequencing.

Identifier Sample Genbank ID Primers Amplified Sequenced Identity TS4.2-F1R1-1 TS4.2 KM000086 F1-R1 1,784-6,793 6,010-6,732 97.79 TS4.2-F2R2-2 TS4.2 KM000087 F2-R2 6,003-11,923 6,040-7,068 99.90 TS4.2-F2R2-3 TS4.2 KM000088 F2-R2 6,003-11,923 10,855-11,882 99.61 TSDC8.2-F3R3-4 TSDC8.2 KM000089 F3-R3 9,511-14,930 14,214-14,651 91.55 TS4.2-F4R6-5 TS4.2 KM000090 F4-R6 13,525-29,713 24,740-25,760 99.71 TS4.2-F4R6-6 TS4.2 KM000091 F4-R6 13,525-29,713 24,748-25,785 100.00 TS4.2-F5R5-7 TS4.2 KM000092 F5-R5 17,800-25,822 17,855-18,859 99.80 TS4.2-F5R5-8 TS4.2 KM000093 F5-R5 17,800-25,822 24,779-25,785 99.80 TS4.2-F6R6-9 TS4.2 KM000094 F6-R6 23,444-29,713 23,487-24,478 99.80 TS4.2-F6R6-10 TS4.2 KM000095 F6-R6 23,444-29,713 28,632-29,679 99.24 TS4.2-F7R7-11 TS4.2 KM000096 F7-R7 28,191-30,897 28,223-29,125 99.78 TSDC8.2-F7R7-12 TS4.2 KM000097 F7-R7 28,191-30,897 28,223-29,040 94.01 TS4.2-F7R7-13 TSDC8.2 KM000098 F7-R7 28,191-30,897 30,024-30,831 99.75 TSDC8.2-F7R7-14 TSDC8.2 KM000099 F7-R7 28,191-30,897 30,009-30,838 97.47 TS4.2-F8R8-15 TS4.2 KM000100 F8-R8 30,874-36,058 30,913-31,880 99.69 TS4.2-F8R8-16 TS4.2 KM000101 F8-R8 30,874-36,058 35,064-36,006 100.00 TS4.2-F9R9-17 TS4.2 KM000102 F9-R9 35,018-40,185 35,064-36,060 99.80 TS4.2-F9R9-18 TS4.2 KM000103 F9-R9 35,018-40,185 39,256-40,134 98.75 TS4.2-F10R10-19 TS4.2 KM000104 F10-R10 38,016-43,360 38,067-39,023 100.00 TS4.2-F10R10-20 TS4.2 KM000105 F10-R10 38,016-43,360 42,451-43,309 99.77 TSDC8.2-F12R12-22 TSDC8.2 KM000106 F12-R12 47,319-52,314 47,289-47,646 93.58 TSDC8.2-F13R13-23 TSDC8.2 KM000107 F13-R13 50,677-54,585 50,746-51,290 92.46 TSDC8.2-F13R13-24 TSDC8.2 KM000108 F13-R13 50,677-54,585 53,703-54,518 97.92 TSDC8.2-F14R17-25 TSDC8.2 KM000109 F14-R17 53,476-71,818 71,512-71,805 97.28 TSDC8.2-F17R20-26 TSDC8.2 KM000110 F17-R20 65,847-83,203 69,229-70,168 95.43 TSDC8.2-F17R20-27 TSDC8.2 KM000111 F17-R20 65,847-83,203 78,679-79,572 98.77 TS4.2-F20R20-28 TS4.2 KM000112 F20-R20 78,704-83,203 78,761-79,782 99.80 TS4.2-F20R20-29 TS4.2 KM000113 F20-R20 78,704-83,203 82,218-83,152 99.89 TSDC8.2-F21R22-30 TSDC8.2 KM000114 F21-R22 82,363-91,978 82,470-83,000 91.34 TSDC8.2-F21R22-31 TSDC8.2 KM000115 F21-R22 82,363-91,978 83,756-84,563 97.28 TS4.2-F23R23-32 TS4.2 KM000116 F23-R23 91,909-628 91,940-92,951 99.51 TS4.2-F23R23-33 TS4.2 KM000117 F23-R23 91,909-628 96,503-97,064 96.80 TS4.2-F23R23-34 TS4.2 KM000118 F23-R23 91,909-628 4-601 99.50 TS4.2-F23R23-35 TS4.2 KM000119 F23-R23 91,909-628 96,513-96,998 97.12 TSDC8.2-F23R23-36 TSDC8.2 KM000120 F23-R23 91,909-628 91,957-92,893 97.24 TS4.2-F24R24-37 TS4.2 KM000121 F24-R24 95,394-3,167 2,420-3,109 99.28