15
10 DNA Sequencing In 1975, the first complete DNA genome was sequenced ± that of the small bacteriophage ùX174 (5 kb). Other complete sequences followed gradually, including the SV40 virus (5 kb, 1977), human mitochondrial DNA (16 kb, 1981), bacteriophage lambda (49 kb, 1982) and the Epstein±Barr virus, contain- ing 170 kb of DNA (1984). A new dimension was opened up in 1995 by the first sequence of the genome of an independently living organism, that of the bacterium Haemophilus influenzae, which is ten times larger (1800 kb). Only six years later, in February 2001, two competing entities, the publicly funded Human Genome Project and the private company Celera, published the human genome sequence of no less than three billion base pairs. On the way, we have seen the complete genomic sequences of important model organisms such as E. coli, the nematode Caenorhabditis elegans, the fruit fly Drosophila, and the plant Arabidopsis. All of these have been received with great excitement and interest in the media, especially of course the human genome sequence ± not least because of the rivalry and acrimony between the two consortia involved, and the failed attempts at co-operation. From a scientific point of view, these projects are obviously revolutionary. They are also themselves the result of a technical revolution ± the development of sophisticated high-throughput sequencing technology. Sequencing is the primary way of characterizing a macromolecule, whether it be determining the order of amino acids in a protein or of bases in a nucleic acid. Protein sequencing was a very important tool before genes could be cloned and sequenced. With the advent of recombinant DNA technology, however, it was superseded by the much more efficient method of DNA sequencing, with the sequence of the encoded protein being deduced from the sequence of the gene. Although direct protein sequencing is currently experi- encing a renaissance, this chapter is dedicated to the sequencing of DNA. 10.1 Principles of DNA Sequencing The most fundamental way of analysing the structure of DNA, whether it is a recombinant plasmid, a natural gene, or a whole genome, is to determine the From Genes to Genomes: Concepts and Applications of DNA Technology. Jeremy W Dale and Malcom von Schantz Copyright 2002 John Wiley & Sons, Ltd. ISBNs: 0-471-49782-7 (HB); 0-471-49783-5 (PB)

From Genes to Genomes || DNA Sequencing

  • Upload
    malcolm

  • View
    217

  • Download
    0

Embed Size (px)

Citation preview

Page 1: From Genes to Genomes || DNA Sequencing

�� ��� ������

�� ����� � �� �� ������ ��� ���� ��� ������ � ��� �� � �����

���� ����� � ��! "� #�$% &� ������ ������ ������� � ������'�

��������� � ()!* +� �� "� #�� ����$� ���� �������� ��� ��� "�, #��

��-�$� ���� ����� ������ "!� #�� ��-.$ ��� � /������0� +� ��� �������1

��� ��* #� �� ��� "��-!$% � �� �������� ��� ���� �� �� ���� �' � �� ��

����� �� � ���� �� �� ���������' ��+��� � ������� ��� �� �

���� ��� ��������� �� ������ ��� �� �� ���� �� � "�-** #�$% &��'

��2 '� � ��� � �� 3� �� ' .**�� ��� �������� ������� � �������' �����

4����5��� 6 �7�� ��� � � �+�� ������' 8� �� ������� � ����

���� ����� �� �� ��� ��� � ������� ��� ��� �% &� � ��'� � �+

�� � ������ ������ ������ �� ���� ���� ���� � ������� ��� �� ��

���� � �������������������� ������� � � ��� ��'���������� ��� � �����

�����������% ��� �� �� �+ �� ��+���� � �� 2������ ��� ��� �� ��

� ����� �������' �� ��� � � ���� ���� ����� � ��� ���� �����

�� � �+�� ' ��� �� ����' ���� � ��� ����� ��� ��+��+�� ��� � �����

������� �� ��1�� �����% 3 �� � ��������� ����� �� +��� �� � �7��� �

��+�����' +�������� '% 9' � ���� ����+� � ���� �� � �������

+������� � � �+������ �� ����������� ��1� ������ ��������

�������'%

(������� �� � � ��� ' ��' �� �� ��� �:��� � ��� �������� �� ��

� �� ������ � � � �� ����� ����� �� � � ���� � �� ���� �� � ������

����% 6 ���� �������� ��� � + ' ���� ���� ���� ��� ��� ����� �

����� ��� ������% ;�� � ��+�� �� ��������� ��� �������'�

��+ � �� ��� ��� ��� �' � ��� �� ������� ���� �� ���

��������� ��� � ����� �� � ����� � ���� ���� ����� � �� �

����� �� � ��% ������ �� �� � ���� �������� �� �� ���' 2� �1

����� � ��������� ��� ���� �� ������� �� � �������� �� ���%

���� �������� � ��� ����������

9 ���� ���������� ��' �� ����'���� � �� ���� �� ���� �� �� �� �

��������� �������� � ���� �� ��� � � ��� ����� �� �� �� ��� �

From Genes to Genomes: Concepts and Applications of DNA Technology.Jeremy W Dale and Malcom von Schantz

Copyright 2002 John Wiley & Sons, Ltd.ISBNs: 0-471-49782-7 (HB); 0-471-49783-5 (PB)

Page 2: From Genes to Genomes || DNA Sequencing

����� �� ���� �� ��� �� �� �������% 9 ��+�� �� �������� ���

�������� ������ �� ��� � �� �������� �� � ����� �� ����+�����

� ������ + ' ��� ���� ��� �� ������ ��� � � ������ ��� �� �� �

�+������ ������ ��� �� ����� � ������' �� + ' �� � ���� � ��

� ������ "�� ��� �� � ����'��� �� + ' �� � ������$ � ��� �� � ��� ���

� ��� �'��� � ������ �� � �������� ���� ����� � ���%

9 � ������ �� ��� � ���� � #���� �� ����2' �������� � � (���

����� �� ������ ��� �� 3��� �*%�% "�� ����� � ���� ��� � �� ��

��� ����+ � ���� � #���� �� � <�2���5��� � ����� ��� �� #�

�' �����+ ������ �� �������% 9�� �� �� ���� �� ������ �� �� �����

��������� ��� ���� ��� � ��� ��� %$ 9� ��� ����� � ����2' � �1

��� �� �� ����� ' �� ��� ��� ���������� ����� ����� ��� �'��1

���= �� ��� �'����� �� � ��� �� ��� ��� ��� ��� � � �� �� ���% �� ��� � �

Similar reactions are carried out with ddGTP, ddCTP and ddTTP;the fragments from the four reactions are separated on an acrylamide geland detected by autoradiography

5'

5'

5'

5'

5'

CCTAGCTAAGCTAGCCTAG

GGATCGATTCGATCGGATC5' 3'

Primer

Normal DNA synthesis

AG

AGCCTAG

AGCTAGCCTAG

AAGCTAGCCTAG

AGCTAAGCTAGCCTAG 5'

DNA synthesis, in the presence of dATP and ddATP

Template

CCTAGCTAAGCTAGCCTAG

Gel runsin this direction

A G C T

Read in thisdirection(5' to 3')

Smallerfragments

Largerfragments

������ ���� �� �������� �� ��� �����

��� ��� ��������

Page 3: From Genes to Genomes || DNA Sequencing

� �� ������ �� � ������ �� ���% ('����� �� � �� �� ��� �� #� �'

������ ���� �� � � �� ��� � ��������� ' �� � ������% (� �' �����

� � �� ��� ���� ���� �� � ������� �������� �� � ������ � ��� ��� ���

��� � �� ��� ��� �� ��� ��� �� � �� � ��� �����% (����� � ��������

�� ���� �� � � ����� �� ��� ���� � �' �� ������ �� � ��+���� ���������

���� ���� � ��1������ �� � �������� �� � ���� ��� � >�1&4� ��� �� � 2������ ������% 9 ����� �� �� ��� ������ �� � ��1��96� �%%� ��2'�������� ��� � ������� �� � ��1�������� �� � ��2' �������� ? ��� �� �� ������� � �������� �� � ������%

9 ���� �� � �� � ���� �� ����� �� �� �� ����������' � .�1��2' ������%% �� ��� ��� �+ � '� �2'� � ��� �� � .�1�������� "��� ����������� ��� �� � ���� ���� � ��� ���� �� @��$% 4��+ � �� ��� �+ � >�1&4� ���� ��� �� ����� ' �� � �� ������ �� � �2� ��������� ����

�� � �2� ��� �� ���� �� ���% ;�� ����� �� � ��� ������ �� �

���� �� ����� ��� �� �� ��� � �� �� >�1&4 � ���� �%% � .��>�1����2'� �+���+� � ���96 "� 3��� �*%.$A 9�� ��� � ���� �� ��� ���� � ����

�' �� ������ �� � ��������� ���� ���� ��� ��1������ ��� � >�1&4�� � � +���� ����% 4��+ � ��� ������ � ����� � �� ��� ��� ���

��� �+ � >�1&4 �� � ��� ��� �� �� �� � ���� ��� � ����% ���

�'����� ���� � �� � ����� �� ��� �����%

(� �� � ���� �� �� � ��96� ��� � ����2' � �+���+ � �� 2���� �

�� � ��2�� �� �596� �896 ��� �596 "� �� ��� ����� ���$ ��� ����

��96 ��� � .��>�1����2' � �+���+ ��� � ���� ���� ���96 � �� ����'����� ���� � ��� ���' �� �� �� � �� �� � ���� ��� ���� �� ����

"3��� �*%>$% �� � �� ' ��� � �� �� ��� ��� �������� �� �� ��� �������

�� �� � ��96� ��� ��� �� �������� ���96� � ����� � ���� ���

������� �� ���� �� ������ �� � ������ 7��� �� �� �� � �� �� ���� ��

�� � �+��� �������� �� � �����%

B��� �� ������ � �� �� ���� �� �� �� ��� ����� ��� � ��� ��%

4��+ � ������ �� �������' �������� ��'� ��96 ��� ���96� � ��� ��

OCH2

OH

1'

2'3'

5' OH

2',3' dideoxyribose

O5'CH2

OH

1'

2'3'

OH

OH

2' deoxyribose

������ ���� .� ��2' ���� ��� .�� >� ����2' ����

�� � �������� �� ��� �������� ���

Page 4: From Genes to Genomes || DNA Sequencing

3' end

5' end

dNTP

Termination

Normal additionto 3' end

No 3' OH forfurther addition

PPi

PPi

OCH2

O

3'

5' O base

OH

P

5' end

OO

3'

5'CH2 O base

OH

P

OO

3'

5'CH2 O base

P

OO

3'

5'CH2 O base

O

P

OCH2

O

3'

5' O base

OH

P

P

P

5' end

ddNTP

OO

3'

5'CH2 O base

OH

P

OO

3'

5'CH2 O base

P

P

P

OO

3'

5'CH2 O base

OH

P

������ ���� 8��� � �������� �' ���96

� ��2�� �� � ��� ����� ���% (� �� � �� �� 9 ���� �� � ������� � ��

������� �� � �� �� ��� ���� �+ ��� ���� "��� ���� � �� � �����$

��� ���� ���� �+ � �� ��� � ����� ��� � ������ ���� � ��� ��

� ���% �� � �2� 9 �� � ������� ��� �� ������� ���� � ������

��� �� ��% ; ���� ��� �+ � � �� �� ������� �� ���� �� ���� ������

�� ����� ��� ��� "� 3��� �*%�$% 9� ��� � ��� ��� �' ��� �1

�� ��� �� � ���'�� '����� ��� ����� ����� ��� ���������� �� � +�� �

��� �� ���� � �� ������� ��% ; ���� �� � �� ��� �� ��� ���� ���

���� ��� �� ��� �� '����� ���% 9�� ��� ��� � ���+��� ��� �� �

�� �� ��� �� ��� ���+ ���� ��� �� ���� �� ����� �� � ����� ���% 9

������� � ��� ��� �� � ����� �� �� ��:� ��� � ����� �������

������ ���� � ��� � ��% ; � �� �� � � �� �� ������ �� �����1

��� �� � ��������� �� � ����� �� � �� �� ��� "� 9 ����� �� �

������$% ;�� � �� �� ��� �������� �� ����� � ���� �� ���96� � ��

� �� �� ��� ����� � �� ��� � ����� ��� � �� �� ���� �� � ���� %

3� ������ ��� ��������� � ����� �� ����' �� ' ��� � ������

��� �� �� � ��96� ��������+�' ������� �� ��� 2���� �� � �� ��

��� ��� ��������

Page 5: From Genes to Genomes || DNA Sequencing

�� 1 �' ���� ����� ���� �� � ���� � �� ����# ����� �� � ����% 0����

� ������� � ������ "��� � ������ �� � � �� $ ���� ��� �� ���� �

�' ���� � �� � ������ �� � ��? � �� �� � �� �� � �� ������ ��

���%

���� ��� ����� ����������

9���'� +� �����' ��� ��� �������� ��� �������� ����� �% ������ �

� ������ �� � ���� � ���� �� ������� �� ���� ��% 3� ��������

��������� �� � � �� � � ���96� � ������ �' ���� �� ����� ��

� ���� ���� �'% 9��� �� ��� ������ � �� �� � ����� ��� ���

����� � ����� � ����� ��� � ��� �� �� � ���� ���� �� �

�' �� � ����� ���� � ��2� �����% <�� ���� ������ ��� � �� � ��

�� � ��# �� ��� ��'% � �� � ��+����� �� ��� � ����� �� �' �

����� �� �� ������������' ���� � ������ % 9�� �� ��� ���' ��� ����#

��� ����� � �� �������' ��� �'���� � ������� ����� ���� � ������ �

��� ���� �+���� � � � ��� � +� �����' ��������� ��� ������ ���� �� '%

3� �� � ���� ���� �������� � �7���� � � ����� �� ����� � �� 1

������ ������ �� � �������� �������� ��� ������� � � ������ ���� �

����� � � ���� ��������� ����� ������ �����%

�� � � �� �� ������� ��� � � ������ �� ' � ��� �'� ��� �� '�� �����

�+ �� �� ��� ����% 4��+ � �� � ��� ���96� � �� ������ ���

���� �� �'�� � �������� ������� ��� � � �� �� �� � ����� ��� ���

��� ��� �� � ����� ���� ��� ��� ����� � �������' �� � �����% � �� �

�+������ �� ��� �� �� ���� � ���'�� '����� ��� ��� ��� �� � ����

��� �� �� ��� ��� � ����� ��� �21����� ������� '% ��� � � �� �

�+������ �� ��� +��� � ��� ����� � ������� �� + ' �� � ���

� ������ "� 8��� ,$ ��� � �� ���� ��� �� �� ������ ��� � �� ��

��� �+������ �� ��������� ��������� ����� �� � ����� � �� 1

������ ��� ����� ������� � � �� �� �' ������ ��� �+ ��� �������

� �������� �� �#� '���� ����� ��� �� � ���� ��% 9 �� �����

�� �� �1���� ���� �������� � ������ � ��� �� ��� ���� %

0�� ������ ��� �������� ��� �������� ����� ���� � �� � ��1

��� ��� ��� ��+ �� �� � � �� � �����% 9� � ���� ��������� ���

� � ��� �� � ���� ������������ �� ���� �� � ��� � �� 2���� ��� ��

�������� ���������� �� �� ��� � ��������� �� �� ��� 2����' �� ���'

���� � � �� � ��� ��� � � ��� �� ������ ' �� ���� � �� � ���

��� �� �� ��� ������ ��� ��� ��� � �� ��� ��� �'����� "�������

� ���� � ��������$ � ��� � ������ �� � � ����� �� � ��% (�� ��

�� �������� � � ��� � �������� ��� ������:� �' ��� ��� � ������

����������� �' �������� � ���� �� �+ ������� � ����� ��+ ��� � � ��1

�� ����� ��� �' �� ������ � ����� �� � ��������� ' �� ���%

�� � ��������� �������� ���

Page 6: From Genes to Genomes || DNA Sequencing

� ���� ������ ����� ���� � �� � � �+� �' ����� ��� ���������

�+ �� �+ ������� ������ �� �� �� �����%

���� !������� �"� ��������

������ �������� ��� ����� � ����� ��� ���� ��� ��� ������

������ � ���� �� ����� ��� ��� � ������� � �� � ����� �� �� �����

������% �� � � ������ �� �� � � �� �� ��� ����� ���� � �����

�� ���� ��� � ������ �� � ����� �� �� ���� �� ����� ��#��� � ������

��# % "�� �������� �� � ��� � � �������� �� �� ���� �� ����� ��

����2'���������� �'����� ��' ���� � +� ���� �� �� ������ ���

�� ������ ' �� ���� �� � ���%$ 9 ����� ��� ����� � �� ���+�'

��� �����% (������ ��� �� ��� � � ����= �� � � ����� �������� ��

+ ��' � �� ���� �� � ��������� ������� ��� � �+ ���� � �� � �

���#��� �� � +� ������ �� � ������� ���� ���� ���� �� �� ����� �� �

����� �� � �� ��� � ���� ��' � ���� ���������% 4��+ � �� � ����

�� ����� � ��� ��� � �������' � ��� ����� �� � ���� ������'

��� ���� ����� ����%

&� �� ���' �� 2������ � ���� �� ����� �� ���� �� � � �� ��

������ "3��� �*%!$% @��� ��� � ����� ����� �� ��� �'�����

��� ���� � �� � ������� � �� % C�����'� ��� �� ��#���� ����� ������ �

����� ��� � ��� � � �� �� ��� �� � ������� +��� ���� �� � ����� ��

��� ����% (��� ���� �������� � �7��� �� � ��� ������� +��� "�� �

�C8 ������� � �� <�> +��� � ��� �+ � ��� ����� ����#��� �

������� ���$� � ��� �� � ��� � �� � �� ��' ����% 9� � � ��

#���� �� ������� �������%

Initial sequenceusing universal primer

Use sequence todesign a new primer

Use sequence todesign a new primer

������ ���� /2������ � ����� �' � �� ���#���

��� ��� ��������

Page 7: From Genes to Genomes || DNA Sequencing

9 "�� �� �$ � �� � �� �� ��� �� � ��� � ���� �� � ����� �� ��

�� ������ ��� � ����� �� � ��������� ' �� ��� ���� � �������

����� � " + �$ � �� � �� � �� ��� �� � ��� �% 9 ����� �

������ ����� ��� ��� � ��� � ����� ������ �� +��� ����� "��� �� ��

� ��+� � �� �� ����'��� � �� ��������� �� � �������#� � ����$ ���

����� �� �� � ��� ���� � ��#���� ��� �% ; ��� 2��� � ����

�� ����� �� ���� �' ����� � �� �� ��� �� ���� �� ����� � ��

� �� ��� ����� ��� � �'����� �� � ����� � ��� �% 9�� ���� � ����

� �� � ���� �� ������ ��� ��� �� � ��� �� ����� � �� � � �� �

��� �� ��% 9�� � ���� �� ���� �����+ �� ����+�' �� � ������

��� ����� 2����+�' ������ �� ���� �� ��� �� ��� � �� � ������%

�� ���� ��+ � � � ����� �� ���' �� �������� �� � ������ "��� ��

��� ���� ������$ �� �� ��� ���� �+ ��� �� � ���� "�

����$%

���� �" ���� ����������# $ ���� �����%&

3� �������� � ���� � ����� � ��' � ����� � ����� �� �* #� � �

��� � ���� �� �� ����� �� �� ���� ����� � ������� �� �� ��� �� �

������� ��: �� ��������% 9�� �� ��# � ������� � �� ��� � '% 9 ��� �

� �� '�� ��������� +��� �� � ������ ��� ����� ����� � �������

+��� % 9 ���� ����� +��� <�> "� 8��� ,$ �� ����� �� ���

�� ���� ���� �� ���� � ���� �����1�� ���� + ����� �� '�� � ������

��� ���� ��+ ���� �����% 4��+ � ��� �+���� �� � �������'

��� ��� ���� ����� ��� ���� � ������� ��� �����1�� ���� �������

�������%

��� ��� �� �� �������� �� �+ �+ ������� � ������ �� ��� ��� � '� ��

�������� � ���������� �� � ��� � ���� "� 8��� �$% D�� �� ���#

��������� ����� �� ����� � �� ��� ����1��� � ' ��� ����� �� ��

�� � �� ��� ��� #���� �� ������ �������� "� 3��� �*%�$% �� �

��� �� '�� ���� �+ �� ��� � �� ��� �� ����� ���� � �� �� �

� ������ � ����� � �� +� ��� �� ��� �� � � ������ �� �� � �+� � ��%

4��+ � ��� '�� �+ � ���� �� ��� � ������ ������� '�� ��� ��� �

�� �� ������ ���#��� �� ����� �� ��� �� ����� �� ��� � �� �% 9

������ ���� ���� ��' �+ ���� ���� � � ������� ��������� ����� ���

� ��������� ' �� ��� �� ��� '�� �+ ��� � ������ ��� �+ ��� ��� �

� �+� � �� ���� �� �� ����% ; � �� �� �+ ���� ��� � ������ ����

� 7���� ���� �� �� � � ������% �� � � �7�� � �� ���� �� ������ ����

� �� ���� � ��� ���� �� ��� � �� �+ ��� �� �������% (� � �������

����+� � 7���� ���� ����� +������' '�� �+ �� ����� ������

��+ ��� � ��� �� � � ������ ��� �� ���� ��� ��� � ������

� ������ ��� ���� ��� ����� ������ "� 3��� �*%,$%

�� � ������ ��������� ���� �������� ��'

Page 8: From Genes to Genomes || DNA Sequencing

Library ofrandom clones

Pick and sequence random clones

DNA fragment to be sequenced

Random fragmentscloned with appropriatevector

������ ���� (����� ������� ��� ��������

&� ��� �� ��� ��������' �� ��� �� ����� �� �� ���� ������� �� '��

� ��� � �������� ����� ��� ��� ��� � ������+% 9��� �� � ���

�� �' ��� � ����� ������ ���� � �������' �������� ����� �� �� �

2������ �������% �+ ����� � �+��� ��� �� �� �� � � ����� � �����'

� ���� �� � ��� � '� �� �� ����# �� ������� ��� � ������ ��� ���

�� ��� � ' �� �� � � ��� � ' �� � ������� ����% (������� ��+ �

�� �� �� � � ������ � ����� � ��� 1 � ���� �� � ��� � '? �' ��' �

��������� �� ���� �� ��� ����% �� ��� �� � ���� '�� ���� �+ � ��� �� '��

����� ��� ��� � ��������� �� ���� ��� � ������ ��� ���% �� '�� �+

���� �� ���+ ��� � ��� �� ���� ����� �� '�� ��� �� � �� ���#���? ��

��� ��� ���+� �� � ��� � ���% ��� ����+�' '�� ��� �� � ������ '��

�+ �� ���� �� ����� 68@ � �� � ��� ���� ���� '�� �� ������' � ���

� ����� ��� ����� � ���� ��� ��� �� � ������% &� ��� ���� ��

� ������ ���� �� ���� ������� ��� �� ���� ������� � ������ �

����%

3� ��' �������� � �7��� ���+ � ��: �� � ��� �� � �������

��� ���+ �� ���' �� ���� � ���������� �� �� ���� �� + ' �� #�% D��

��' �� �* � ��� �� � ����� ���� ���' �� ���� ���� ����#�'? �

�2� � � ��� ��' ��# �� ���� �����? ��� �� � �2� *%� � ��� � ������

���� �� ���% �� �� ������' ����� ' �� �� ��� ������ �� ���= �� ������

��� �� ���� �� �� '�� �� � ����� �� �A ;��� �* � ��� ��� � ����

'�� �+ �� � ��� � ��%� � ���A ;����� ��� �� � �� ���� ���� '��

��� � � ��� ���� � �����' 2 ��� � '��� �� �� ��� �� �� ���������

��� �� � ����� �� � ������� ���� �� 5 � 8%

��( ��� ��������

Page 9: From Genes to Genomes || DNA Sequencing

Set ofrandomsequences

Computer detection ofoverlapping sequences

Contig 2Further

sequences

Contig 1

New sequenceoverlaps two contigs

Contigs 1 and 2 joined

������ ���� 8����� �� ������ ��� 7������

���� )�� �� ����������

������ ������

�� ����� � �� �� ������ �� ������ ����� "2������� +� ���$ �

�������? �� � �� ��� ���� ������������ �� ����� ������������

��������% ������ �� � ��� �' ����� "�%-><� ��� *%�-<�� �����+�'$

�� ����� ���� ��� �� ���� ��� �� ���� ��������� � ����� ������

�' � ��� �� � ��� � 2����� � �+ �� ������ ��� �� �� % 9�

�+ �� ������� �' ������ �� � ����� �� � ���� �� �� ���� ���

�� ��� �� ��� �#� '���� ��������� '��� "������������� ����������$ ��� ��

��� � � ���� ���� ������% (�� 2����� � ���� �� 0�2�*%�%

�� � ����� �������� ��*

Page 10: From Genes to Genomes || DNA Sequencing

�� ���� � �������� �� ��������� �������

�� ���� ���� ����

� ���

������������ ��������� �%,,

����������� ���� .%�-

0��� �� "� �#� '���$

��������� �������� *%�-

������������ � �� �%,!

��������� �� ����� !� �%->

������������ ����� >%.,

������������ ��������� !%!�

"��������� ��������� ,%>*

������������ �������� -%,�

/�#� '���

������������� ���������� "'���$ �>

�������������� ������ "������$ ��%�

����������� ������� "�����$ ��-

��������� ����������� "� ��� ��'$ �>�%,

���� "����� �* � ��� E������F? ����� ��

� ��� �� �$

>.** "�� ������� �������$

9 ���� ����� ���' � ����� ������� �� ������ ���� ������% 3� ���� �

��1��1���� ����� "��������� � �7��� �� � �� ��$ � � ��������� �� ����%

/� ���� 0������ ������ ������������#$$������������$�������$���$����%����

5��� <����� ��� 9���% ����' ������ �� � �� �� �� ���� ��������

9 �������� �� 5����� @�� �

����#$$������������$���$���$��������������

����#$$������������$���$���$�����������������

G���� ��� ����� ���� ������� ������ ��� �� � �� ��� �����+�'

5��� (������� 8�� � ;�������� C��+ ���' (���� �� <�����

����#$$�������������$���$

4���� ���� �������� � �� ��=

����#$$�������������������$������$��&$

����#$$�����������$���$ "4���� ���� � ����:�����$

�'� ��� ��������

Page 11: From Genes to Genomes || DNA Sequencing

9 ��� �� � �� �� �� ���� �������� �� ��� ��� �� �� �� ���� ������

�� � ���� � �������+ ����? �� ����� � ���� ��� �� ��� ��� ��� ���# ��

�������% 4��+ � '�� ��� � ����� �� ������ � ������� "��� ����� � ���

�� ���� ������ ����� � ������$ �� � ;� ���� �����% D�� ���� ����

���� ������ ��� ���' ����� ������� � �7��� ��� ���� � �7��� ��� � �����

�� � �� ��% (�� �� � ���� � �7��� "��������� � (��� 8�� $ �+ �

�����' �� ������ ��� ����� ���� �� �� ����� �+������� �� � ����' �����%

9�� �� �� ����� ��� �� ���������� "�%% ������ �� ��� '�� ��� �� ����

�� � ��' �� ���� ������$� ��� �� ��� � �� �� �� � ���� �� ��

������� ������� ��� �� + ' ����� �� � �� � �� # %

&�� � ������� �+ �� ������� ��� � ���� �� ��� �� �

�������' �������� ������� ��� � ��� �� �� � ��� � ���� ��� �� ��

��� � ������ �� � ��� � ��&����% ��� ��� �� ��� ���� � � ��#�' �� �

���� �� � ������ ������ ���� �� � �������� ��� � ��� �� �� �

�������� ��� ��: �� ��� ����% 9 ���� ���� � ��� ��� ������� ��� � �

�� � �����% 9 �2� ���� �� � �������� � ����� ��� ��+��+� ������� ��

� ���� ��� �� ����� � �� ��+���� � � ��� ��� �������% � �������

����� ���� ������� �� #���� ����� ��� ���� � ���� �� �� � ����� �+�%

9 ����� ���� �� ����������� �� � ����1������ ������ � �������� ���

� �������� ��� �� �� � ���� �� � � ������% � ��� +� ��' �� ��

���� � � ���� �������� �� ��� ����% "���������� ��� �� � ����'�� �

������ � �� 8��� ��%$

9�� ��� ������ �� � ���� �������� � �7�� ��#� �� ����� ��# �

� �������� ���� ��� ���� � ������' �� ��� ����� �� ���% �� � �� � � �7���

� +� ���� ����� � �������� ��������� ������'� ��������� ���������� � �

�� �� ��� �' ��� �� ����� ��� � � ����� � �� �� ��� "����� �

����� ����$ �� ����� �� �� � �2� ����% 4��+ � '�� ����� ��� ��#

� ������' ��� ��� ���' � ���� ������ ����� ��� ��'�� ��� �� ���� ��� ���

�+ �� � ������� ��� � �2� ���� ��� ��� %�% ������' ��#� ����

����� ���' ��� � �� ����� �� ����� ����%

�� � �� �� � � ���� � �+ � ������ "��� ��������$ ������ ���

� ����� ��' ��� � �+ �� ���� � ������ ���� ����� �� �

�� �� � ������ ; �� �� ������ ��� � ��� �� � ��' ���% 3� �

���� ��� ����� ��� �+ �� ������� ��� �� ��� ���' � � � � #���

"����� � ���� ������ �� ���� ��'$ ��� ��� �� � ��� �� + ' �����

�������� �� � ����% 4��+ � �� �#� '���� ���� �� �� �������'

������ �� ��� �+�% 3� �� �#� '���� ������ � ��������� �� E���1

���F �� �� ��� � �� 2���� �� ��� �� ��� �� � ��� �� � �� �1

����� ����� "��� ������� ���� �� � ���$ ������ "�� � �� ������ �

�� ���� ��'$% ��� �� ��� �� ��� ��* #�% "9�� ��������� ���� +� ' � �� ��

� �7�� �� ���� %$ 9 ������� ���� ���� ������ �� ��� �� +�

��� ���������% &+ ���� �� � ��� �� � ���� � � �� � �� �������1

����� � ��+ �� ��� ����� -� � ��� "� ����� �* � ��� �� �� ������$�

�� � ����� �������� �'�

Page 12: From Genes to Genomes || DNA Sequencing

��� ��� + ����� �� � �� � ���� �� ���� �� ��% 9 ������� �1

����� � � �� ������ �� ��� � ����% 9 ��+ �� �� ��� ���

���� � � ������ ����������� �� � ���� ���� ����� ����� ��� �� �

��� �� � ����� ����� �* � ��� �� � �� ������ �� ������ � �������

��� � ����� ���� �� � ��� �� �% "( � �� ���� ����� �� 0�2 �*%� ��

�� ����� �� �� ���� �%$ 3� � �� � �� � ��� ����� ������ ��

����� ����+������� ��� � � �������� �� ������ � �� �+ �� ��� �� �

����# � ���� ��� ������ ��� � � �+� � �� � ����� �� ��� �� ���

�����% 9� � � �����' ��� � ���� �����������% 3� 2����� ���' �� �

���� � �� �� � ���� �� �� �����+ ��� "��� ��� � ��������� ��

�����$? ��� �� ������ �� � E7��#F ���% <���� �� ��� ���� �� � �����������

������ ������ ���� � � ��� �� � ����� ��� �� �� �� ���� �

��� � �� �� � ������� �� ���� � E#���F � ����� �� � ����

����%

������ ���������

)� ���� �� ������ � ������������ �� �� ������ ��� � ��� �� �� ������

������ �� ��� �� ���� �� � ������ ���� "� � ������ � ������$%

&� �� �� 2��� � ������ �� ������ �������� �� ��� ��� ���+� ��� ��

�����' �� ��# � ��� � ' �� ����� ����� � ������ �� � ��� ���� ���

����� �� "3��� �*%�$% 9�� ��� � � ��������� ��� �������� �� �

Orderedlibrary

Sequence and contig assemblyRepeat for other clones

Assemble complete genome sequence

Sequence and contig assembly

Assemble complete genome sequence

Random small-insertlibrary of oneclone

Random small-insertlibrary of wholegenome

Genome

������ ���' 5��� �������� �� �����

�'� ��� ��������

Page 13: From Genes to Genomes || DNA Sequencing

+��� ���� �� ������ ��� �� ��� ������� �' � �� �� ������ ����� ��

��� ����� �� � � ���� � ���#��� � ������ 2� ������ � ���� ������ �� �

�������� �������% 3� � �� � � ������ ������' �� ��� � �� � ����

�� ����+����� ����� ������ ��� � � + ' ����������� ������ �� ���1

��� ��� % 9�� �� ��� �� ��������� �� ���'? ���' ���� ��� ����� �+

�� ������ �� 7��� ��� ��'� ��� ��� �� �� ���7� �� � �� � �� ���' ��

�� �� � ���� ���� �������� � �7���% 4��+ � �� �� ��� � ���' ��'

�� ����� ��%

9 ���� ��� ����+ �� �� ����� � � ���� �� ���� ����� ����� �� ��% 3� �

�#� '���� � ������� '�� ���� ���� �� ��� �� � � ������� �� ��� �

���� ��� � �� �� � ������ �� � ��� �� � �7��% 9� "� ������$� '��

��� ��# � ��� � ' � ������ � ��� ���� � � ������� ����� �

+��� ��� ��� �� ' ��� �� ��� ��:� �� ��� � "%�% � ������$% D�� �����

�� �� ��� � ����� �� � ��� � �� ����+����� �������� ��� ����1

�����' ������ � ������ ������ ���� � ������ ������ �����%

(�� �� � �������� � �7��� �+ ��� �� ��� ����� �������� ���

�� � �+ ������� �� � ��� � ������� ���� �� � � � ��� � ' �� ��

"�%% �� �� ��� � ����+ �������� �� ��� �� � ������� �� �� ����� �

� 8��� �$%

&� ��+����� �� ��� �� ���' �� ��� + ' ���' ���� ��� �� � ������ ��

�� ������ � ����� �� � ��: �� �� ����+����� ������ ��� �� �� �� ��

������� �� ���� ���� � ������� �� ���� �� ���� ��� �� �� ��������% &�

� �� ���� � ����� ������ ��� ��� �� ���' ��� ���:� ��� ���'

������� �� � + ' �� ��� �% � �� � ��+����� �� � E���� �' ����F

��� ��� �� ��� ����� ���� ������ �� �� ��� �� ��� ����� ����� �� �

� �7�� � � ����� �� �� ����+����� ������ �� � �� �� ��� �� ���� 1

������ � ��� � ������ ��� ��� �������� �� �� � ���� � �� ��������'

��������� ������ �� ����� � ������ ����� ����������' �� � ������� �+

�� �������% &� � �� ���� � ������ ���� ��� ��� � �� �����

����� ���� ������ � �� � ��������� ������ �+��� �� � ���� ������

��� � ��%

������ �������� �������� ��� ����

9�� � ����� ������ � �� ���� �������� � �� � ������ ���=

�����+ ����� ��� ����% <��� ����� ������� ���������� �������= �����1

��� ������ ��� ���� �� ��� ��� "���� ���' ����$ �� � ����%

9 ������ �� �����+ ��� +� �� ������������' ���� � ��������

������ � �� � �� � ��� �� �� ���� �* � ��� �� � ���� ����%

9 � +� ���� ������ �� ��� ������� ��������� ��������� "� �����'

�������( �������� �����' ����� ����� ��� �� ��� ���� ������ ���

�� � ����� �������� �'�

Page 14: From Genes to Genomes || DNA Sequencing

� ���������� ��� ���� �� ���� �� ���� ���� ����� � ���� � ����� ���

������ ������� �� �� � ������ "+� �� �� � �� ��> ���������$ ���

���� ���' ���� �� ��������� �� �� �����% 9 ��' ���� � �������

������������� � � ����# �� � ��� �+ �� ��� � #������� �� ��� ��

�� ����� �� � ���� �� ���� �� � ����% ��' �����+ ���� �� ��#�'

�� ���� � ����� �� ������ ������'% 9�� � ������ �� ����� ��� �� ���

�� � �� � �����+ ���� ��' � �������� �' � ������ �� �+ ��������

�� �� ���� �' � � �+� � �� ���� ���� �� �� �� �� � ����% 9�� ��

�� �� � � ���� ��� � ����� ������ ��� ��� ��� �� ��������

����+����� �������� ����� � ��� �� ������� � ��� ��� ��#�' �� �� '

�� ��� �� ���' �� �� ��� ���� �����% 9���� ���� ���� � ��

���� �� � ����= � �+ ������� � ������ � ������' ��7����� ��� �

���� �� ����� �� � ����� ��� ��' � ���������%

�� ���������� ����� �� ���� �� � �� � �� ����= ���' �� �� �����+

����� � �� ���' '� +� ����? ����� ����� ��� � ������ �� ���� 1

�� ����� ��� ����� ���� ��� +� ' �� �� ���' ���� % 8� �� �� �

��#� ��� � ��� ���� ��� ��� �� ��������� ��� � ����������' �� ��� 1

������ �� ��� � +� ���� ������� ���� �� �� � ������ �%

�� � ���������� �� ����� 1���� �������� � �7���� � ������ � �

� ���� �� ���� ������� ��� ������ ������'% 9�� �� +� �� ���� ����

�� ���� ��������� ��� �� ���' � ��� ����� �� ����������� �� �������

� ���� � ������ �� ���% 6 �� ���#��� �� ��� ��� ���+ �� ��� ��#�' ��

� ����� �� ��� ����2� ����� ���' �� � ���� ���� � ��� ���% 68@ ��� �

��� �� ������' � � ����� �� � ��� � ���� ��� ���' �� � ������ ��

��� ��� � ������ ��� �� � ��� �� ����+�' �� �% �� � � � ���� ��

���� �� � ������ �� �� ��#�' �� � ��������� �� ���� � � � �� �

������ � ������%

0�� �� �� � ����� ��� � ��� ���� �� ���� �� �� �� �' � �� ��

���� �� �'�� �� ������ ��� �� �� ������ �' � �� �� ��� +��� � "�������'

���� ��� � �������� � �������� 0�8�$ ��� ��� �� 8��� ,� ��� �

������ �� ������������� ��� �� �� ��� �� � +� �������� �� #�������%

9� �� � ��� �� ��� � ��� ����������� ���� �� � ������� ����%

4'� ���:����� ��� � ��� �� ������' � ��������� �� '��� ������ �+ 1

������� ��� �� ��� �� � ���% 5��� ��' � �� � �� � ���� ���� ��

� ���� ������ �� �����1���' ��������% 9 �� ������' ���� ���� ��� ���'

���� �� +��� � ��� �� 0�8� ���� �� ��� ��� � ����% �� � ��� � ���

� �� � ����� ��� �� ��� ���� +� �� � ��� ���' ���� �������� ��

������ +��� � ��� � ���� ������ � ��� � ��: �� �� ������ �� �����

.> #�% ��� ����+�'� �� �� ��� ���� �+ �������� ���� �� � ����� �

������� ���� ��� � � ���� �' ����� 68@ ������������� �� � �+���

���� �� � ����� ��� �+������ � �� �� ��' ������� ���%

&�� � ���� ����� �� �� ������� �� �� � � �� �� �� ���� ��'

��� ��������� ���� ���� �� � � �7�� �������������� � ������ ���� �����

�'� ��� ��������

Page 15: From Genes to Genomes || DNA Sequencing

��� �� ���������� � ������'��� � ������ ������ � � ����� � �������

��� �� ���� � �� � �����% 9�� �� ������ � �� � �2� ���� %

4��+ � ����� ��� � 2������ ��� �� �� ��� �' � ����������� �� �

���� ������ #������ � ����� �� ���' � ���� �� �� ��� ��� �� ��

�� �����% 9 ���� ���� ����� �� ��� '�� ��� �� ��� ��� +��� ������ ��

���� ������%

�� � ����� �������� �'�