IMPRESO-Analysis of Gene Diversity-Nei 1973

Embed Size (px)

Citation preview

  • 8/2/2019 IMPRESO-Analysis of Gene Diversity-Nei 1973

    1/3

    P r o c . N a t . A c a d . S c i . USAV o l . 7 0 , N o . 1 2 , P a r t I , p p . 3 3 2 1 - 3 3 2 3 , D e c e m b e r 1 9 7 3

    A n a l y s i s o f Gene D i v e r s i t y i n S u b d i v i d e d P o p u l a t i o n s( p o p u l a t i o n s t r u c t u r e / g e n e t i c v a r i a b i l i t y / h e t e r o z y g o s i t y / g e n e d i f f e r e n t i a t i o n )

    MASATOSHI NEIC e n t e r f o r D e m o g r a p h i c a n d P o p u l a t i o n G en et i c s, U n i v e rs i t y o f T e x a s a t H o u s t o n , T e x . 7 7 0 2 5C o m m u n i c a t e d b y S e w a l l W r i g h t , A u g u s t 6 , 1 9 7 3

    ABSTRACT A method i s p r e s e n t e d b y w hi ch t h e gened i v e r s i t y ( h e t e r o z y g o s i t y ) o f a s u b d i v i d e d p o p u l a t i o n can bea n a l y z e d i n t o i t s components, i . e . , t h e gene d i v e r s i t i e sw i t h i n an d between s u b p o p u l a t i o n s . T h i s method i s a p -p l i c a b l e t o any p o p u l a t i o n without r e g a r d t o t h e n u m b ero f a l l e l e s p e r l o c u s , t h e p a t t e r n o f e v o l u t i o n a r y f o r c es sucha s mutation, s e l e c t i o n , a n d m i g r a t i o n , a nd t h e r e p r o d u c -t i v e method o f t h e organism u s e d . Measures o f t h e a b s o -l u t e and r e l a t i v e magnitudes o f gene d i f f e r e n t i a t i o n a m o n gs u b p o p u l a t i o n s a r e a l s o p r o p o s e d .I n a g e n e t i c s t u d y o f s u b s t r u c t u r e d p o p u l a t i o n s , W r i g h t( 1 - 3 ) s h o w e d t h a t t h e v a r i a t i o n i n g e n e f r e q u e n c ya m o n g s u b p o p u l a t i o n s may b e a n a l y z ed b y t h e f i x a t i o ni n d i c e s o r F - s t a t i s t i c s . He d e r i v e d t h e f o r m u l a

    1 - FIT= ( 1 - F I s ) (l-FT), [ 1 ]w h e r e F I T a n d F 1 s a r e t h e c o r r e l a t i o n s b e t w e e n t w ou n i t i n g g a m e t e s t o p r o d u c e t h e i n d i v i d u a l s r e l a t i v e t ot h e t o t a l p o p u l a t i o n a n d r e l a t i v e t o t h e s u b p o p u l a t i o n s ,r e s p e c t i v e l y , w h i l e F S T i s t h e c o r r e l a t i o n b e t w e e n t w og a m e t e s d r a w n a t r a n d o m f r o m e a c h s u b p o p u l a t i o n .F I T a n d F 1 s may b e c o m e n e g a t i v e , b u t F S T i s non-n e g a t i v e . T h e d e g r e e o f g e n e d i f f e r e n t i a t i o n amongs u b p o p u l a t i o n s may b e m ea s u r e d b y F S T .T h e F - s t a t i s t i c s a r e a p p l i c a b l e t o a n y p o p u l a t i o n i ft h e r e a r e o n l y t w o a l l e l e s a t a l o c u s . I n t h e p r e s e n c e o fm u l t i p l e a l l e l e s , h o w ev er , E q . 1 n o l o n g e r h o l d s e x c e p tf o r t h e s p e c i a l c a s e o f r a n d o m d i f f e r e n t i a t i o n w i t h n os e l e c t i o n ( 4 ) . R e c e n t l y , I ( 5 , 6 ) p r o p o s e d a n e w m e t h o do f m e a s u r i n g t h e d e g r e e o f g e n e d i f f e r e n t i a t i o n b e t w e e na p a i r o f p o p u l a t i o n s . T h i s m e t h o d i s b a s e d o n t h ei d e n t i t i e s o f t w o r a n d o m l y c h o s e n g e n e s w i t h i n a n db e t w e e n p o p u l a t i o n s a n d i n d e p e n d e n t o f t h e n u m b e r o fa l l e l e s . I n t h e f o l l o w i n g , I s h a l l e x t e n d t h i s m e t h o d t ot h e c a s e o f h i e r a r c h i c a l s t r u c t u r e o f p o p u l a t i o n s a n ds h o w t h a t t h e g e n e - f r e q u e n c y v a r i a t i o n i n a s u b s t r u c -t u r e d p o p u l a t i o n c a n b e a n a l y z e d d i r e c t l y i n t e r m s o fh e t e r o z y g o s i t y o r o f g e n e d i v e r s i t y , w h i c h w i l l b e d e -f i n e d l a t e r . T h i s m e t h o d c a n b e a p p l i e d t o a n y p o p u l a -t i o n w i t h o u t r e g a r d t o t h e n u m b e r o f a l l e l e s a t a l o c u so r t o t h e p a t t e r n o f e v o l u t i o n a r y f o r c e s s u c h a s m u t a -t i o n , s e l e c t i o n , a n d m i g r a t i o n . I t i s a l s o a p p l i c a b l e t oa n y o r g a n i s m , w h e t h e r t h i s i s s e x u a l l y o r a s e x u a l l y r e -p r o d u c i n g o r w h e t h e r t h i s i s d i p l o i d o r n o n d i p l o i d , a sf a r a s g e n e f r e q u e n c i e s c a n b e d e t e r m i n e d . S u c h a

    m e t h o d s e e m s t o b e n e c e s s a r y t o a n a l y z e r a p i d l y i n -c r e a s i n g d a t a o n g e n e f r e q u e n c i e s f o r p r o t e i n l o c i .S u p p o s e t h a t t h e r e a re n a l l e l e s a t a l o c u s a n d t h e

    f r e q u e n c y o f t h e k t h a l l e l e i s x k i n a p o p u l a t i o n . T h ep r o b a b i l i t i e s o f i d e n t i t y a n d n o n i d e n t i t y o f t w o r a n -d o m l y c h o s e n g e n e s a r e t h e n g i v e n b y J = E k X 2 k a n dH = 1 - J , r e s p e c t i v e l y . T h e p r o b a b i l i t y o f n o n i d e n -t i t y , H , i s a m e a s u r e o f g e n i c v a r i a t i o n o f a p o p u l a t i o na n d u s u a l l y c a l l e d h e t e r o z y g o s i t y . T h i s w o r d , h o w e v e r ,i s n o t a p p r op r i a t e f o r a n o n r a n d o m m a t i n g p o p u l a t i o n .T h e r e f o r e , I u s e t h e w o r d g e n e d i v e r s i t y f o r t h i s q u a n t i t y .I a l s o u s e t h e a b b r e v i a t e d w o r d g e n e i d e n t i t y f o r J . O fc o u r s e , i f o n e i s i n t e r e s t e d o n l y i n r a n d o m m a t i n gp o p u l a t i o n s , t h e w o r d s g e n e d i v e r s i t y a n d g e n e i d e n t i t yi n t h e f o l l o w i n g may b e r e p l a c e d b y h e t e r o z y g o s i t y a n dh o m o z y g o s i t y , r e s p e c t i v e l y .

    L e t u s now c o n s i d e r a p o p u l a t i o n t h a t i s s u b d i v i d e di n t o s s u b p o p u l a t i o n s . L e t X I k b e t h e f r e q u e n c y o f t h ek t h a l l e l e i n t h e i t h s u b p o p u l a t i o n . T h e g e n e i d e n t i t yi n t h i s s u b p o p u l a t i o n i s g i v e n b y

    [ 2 ]i = E Xi=kw h i l e t h e g e n e i d e n t i t y i n t h e t o t a l p o p u l a t i o n i s

    J T - E X 2kw h e r e X . k = E i ~ i X i k , i n w h i c h w i i s t h e w e i g h t f o r t h ei t h s u b p o p u l a t i o n ( k I w i = 1 ) . The q u a n t i t y J T may b ew r i t t e n as

    J T = E ( E w V i X i k ) 2k i=E ( E W 2 i X 2 i k + E W i W j X i k X j k ) .k i i t j

    I f wi =1 / s , t h e nJT = (EX2 i t k +E E X i k x i k ) / s 2i k i ~ j k= ( F I J 1 + E J i j ) I S 2 2i ij [ 4 ]

    w h e r eJ i ; = E Z X i k X j kk [ 5 ]

    3 3 2 1

    [ 3 ]

  • 8/2/2019 IMPRESO-Analysis of Gene Diversity-Nei 1973

    2/3

    P r o c . N a t . A c a d . S c i . USA 7 0 ( 1 9 7 3 )i s t h e g en e i d e n t i t y b e t w e e n t h e i t h a n d j t h s u b p o p u l a -t i o n s .

    L e t u s now d e f i n e t h e g e n e d i v e r s i t y b e t w e e n t h ei t h a n d j t h p o p u l a t i o n s a sD i j = H i j - ( H i + H j ) / 2

    = ( J i + J j ) /2- J i j [ 6 ]w h e r e H i = 1 - J i a n d H i j = 1 - J i j . I ( 6 , 7 ) h a v ec a l l e d t h i s p a r a m e t e r t h e minimum n u m b e r o f n e tc o d o n d i f f e r e n c e s p e r l o c u s , b u t i n t h e p r e s e n t c o n t e x tt h e w o r d g e n e d i v e r s i t y s e e m s t o b e b e t t e r . N o t e t h a tD i j i s Zk ( X k -X j k ) 2 / 2 , s o t h a t i t i s n o n n e g a t i v e . I fwe u s e E q . 6 , E q . 4 r e d u c e s t o

    JT= I Z E J +E ( J i + J j ) / 2 -E D i j / S 2i i s i i ~ i= { s E Z J - D i j } / S 2 )i i i

    s i n c e D i i = 0 . T h e r e f o r e ,JT= ( Z J i ) / s -( E E D i j ) / s 2i i j

    = J s -DST [ 7 ]w h e r e J s i s t h e a v e r a g e g e n e i d e n t i t y w i t h i n s u b p o p -u l a t i o n s , a n d D S T i s t h e a v e r a g e g e n e d i v e r s i t y b e t w e e ns u b p o p u l a t i o n s , i n c l u d i n g t h e c o m p a r i s o n s o f s u b p o p -u l a t i o n s w i t h t h e m s e l v e s . T h e g e n e d i v e r s i t y i n t h et o t a l p o p u l a t i o n ( H T = 1 - J T ) i s

    H T = H s + D S T , [ 8 ]w h e r e H s = 1 - J s . T h u s , t h e g e n e d i v e r s i t y i n t h et o t a l p o p u l a t i o n c a n b e a n a l y z e d i n t o t h e g e n e d i v e r s i -t i e s w i t h i n a n d b e t w e e n s u b p o p u l a t i o n s .T h e a b s o l u t e m a g n i t u d e o f g e n e d i f f e r e n t i a t i o namong s u b p o p u l a t i o n s may b e m e a s u r e d b y D S T o rDm g i v e n l a t e r , w h i l e t h e g e n e d i f f e r e n t i a t i o n r e l a t i v e t ot h e t o t a l p o p i i l a t i o n i s g i v e n b y

    GST= D S T / H T . [ 9 ]T h e l a t t e r m e a s u r e d e p e n d s o n t h e p o p u l a t i o n u s e d ,a n d t h e e s t i m a t e o b t a i n e d i n o n e p o p u l a t i o n c a n n o t b ec o m p a r e d w i t h t h a t o f a n o t h e r , u n l e s s t h e b r e e d i n gs y s t e m i s s i m i l a r f o r t h e t w o p o p u l a t i o n s . I f Hs i ss m a l l , G S T may b e v er y l a r g e e v e n i f t h e a b s o l u t e g e n ed i f f e r e n t i a t i o n i s s m a l l . G S T i s e q u i v a l e n t t o W r i g h t ' sF S T , a n d we c a l l i t t h e c o e f f i c i e n t o f g e n e d i f f e r e n t i a t i o n .I f t h e r e a r e o n l y t w o a l l e l e s a t a l o c u s , i t c a n b e s h o w nt h a t HT = 2 X ( 1 - X ) a n d D S T = 2 2 o , w h e r e x a n dO a d a r e t h e mean a n d v a r i a n c e o f t h e f r e q u e n c y o f a na l l e l e among s u b p o p u l a t i o n s , r e s p e c t i v e l y . T h e r e f o r e ,G S T b e c o m e s i d e n t i c a l t o F S T , w h i c h i s d e f i n e d a s - 2 /--) } . T h i s p r o p e r t y w a s n o t e d b y H . H a r p e n d i n g( p e r s o n a l c o m m u n i c a t i o n ) i n a n u m e r i c a l c o m p u t a t i o n .S . W r i g h t ( p e r s o n a l c o m m u n i c a t i o n ) a l s o p o i n t e d o u tt h a t i n t h e c a s e o f m u l t i p l e a l l e l e s , G S T i s e q u a l t o t h ew e i g h t e d a v e r a g e o f F S T f o r a l l a l l e l e s , i . e . , F S T =E k Z 2 ( k ) l / E - t k ( l - k ) , w h e r e k r e f e r s t o t h e k t h a l l e l e .

    From E q s . 8 a n d 9 we o b t a i n t h e e q u a t i o n ( 1 - G S T )( 1 - J T ) = 1 - J s . T h e d i f f e r e n c e b e t w e e n t h i s e q u a -t i o n a n d E q . 1 o c c u r s b e c a u s e F 1 s a n d F I T i n E q . 1m e a s u r e t h e d e v i a t i o n s o f g e n o t y p e f r e q u e n c i e s f r o mH a r d y - W e i n b e r g p r o p o r t i o n s , w h i l e J s a n d J T a r e g e n ei d e n t i t i e s . N o t e t h a t G s 7 , J T , a n d J s a r e a l l n o n n e g a t i v e .A s m e n t i o n e d e a r l i e r , D s y i n c l u d e s t h e c o m p a r i s o n so f s u b p o p u l a t i o n s w i t h t h e m s e l v e s . I f we e x c l u d e t h e s ec o m p a r i s o n s , we h a v e t h e i n t e r p o p u l a t i o n a l g e n e d i v e r -s i t y d e f i n e d a s

    Dm~ZE D i j / 1 s(s -1)i j 9 6= s D S T / ( s - 1 ) [ 1 0 ]

    T h i s a b s o l u t e m e a s u r e o f g e n e d i f f e r e n t i a t i o n i s i n -d e p e n d e n t o f t h e g e n e d i v e r s i t y w i t h i n s u b p o p u l a t i o n s ,a n d t h u s i t c a n b e u s e d f o r c o m p a r i n g t h e d e g r e e s o fg e n e d i f f e r e n t i a t i o n i n d i f f e r e n t o r g a n i s m s . Dm maya l s o b e u s e d t o c o m p u t e t h e i n t e r p o p u l a t i o n a l g e n ed i v e r s i t y r e l a t i v e t o t h e i n t r a p o p u l a t i o n a l g e n e d i v e r -s i t y ( 7 ) . T h a t i s ,

    RST= D n / H s . [ 1 1 ]F o r m u l a 8 c a n e a s i l y b e e x t e n d e d t o t h e c a s e w h e r e

    e a c h s u b p o p u l a t i o n i s f u r t h e r s u b d i v i d e d i n t o a n u m b e ro f c o l o n i e s . I n t h i s c a s e , Hs ma y b e a n a l y z e d i n t o t h eg e n e d i v e r s i t i e s w i t h i n a n d b e t w e e n c o l o n i e s ( H c a n dD c s , r e s p e c t i v e l y ) . T h e r e f o r e ,

    HT =HC+ DCS + D S T . [ 1 2 ]T h i s s o r t o f a n a l y s i s c a n b e c o n t i n u e d t o a n y d e g r e e o fh i e r a r c h i c a l s u b d i v i s i o n . T h e r e l a t i v e d e g r e e o f g e n ed i f f e r e n t i a t i o n a t t r i b u t a b l e t o c o l o n i e s w i t h i n s u b -p o p u l a t i o n s c a n b e m e a s u r e d b y G c s ( T ) = D c s / H T . I tc a n a l s o b e s h o w n t h a t ( 1 - G c s ) ( 1 - G S T ) H T = H C ,w h e r e G c s = D c s / H s . E x p r e s s i o n 1 2 was d e r i v e d ont h e b a s i s o f t w o l e v e l s o f h i e r a r c h i e s . I f we d i s r e g a r d t h el e v e l o f s u b p o p u l a t i o n s , we h a v e HT = Hc + D C T iw h e r e D C T i s t h e g e n e d i v e r s i t y b e t w e e n c o l o n i e s w i t h i nt h e t o t a l p o p u l a t i o n . T h e r e f o r e ,

    D C T =D c s + D S T . [ 1 3 ]I n h i s s t u d y o f human d i v e r s i t y , L e w o n t i n ( 8 ) m a d e

    a n a n a l y s i s o f g e n e - f r e q u e n c y v a r i a t i o n . a n a l o g o u s t oE q . 1 2 , b y u s i n g t h e S h a n n o n i n f o r m a t i o n m e a s u r e .H o w e v e r , t h i s m e a s u r e i s n o t d i r e c t l y r e l a t e d t o a n yg e n e t i c e n t i t y , a n d i t i s d i f f i c u l t t o make a g e n e t i ci n t e r p r e t a t i o n o f t h e c o m p o n e n t s c o r r e s p o n d i n g t ot h o s e i n E q . 1 2 .

    L e t u s n ow c o n s i d e r t h e c o m p o n e n t s o f t h e g e n ed i v e r s i t y ( D S 1 2 ) b e t w e e n tw o s u b p o p u l a t i o n s t h a t a r ec o m p o s e d o f r a n d s c o l o n i e s . L e t x i k a n d Y j k b e t h e f r e -q u e n c i e s o f t h e k t h a l l e l e i n t h e i t h c o l o n y o f t h e f i r s ts u b p o p u l a t i o n a n d t h e j t h c o l o n y o f t h e s e c o n d , r e -s p e c t i v e l y . By d e f i n i t i o n ,D S 1 2 = ( J S 1 + J S 2 ) / 2 - J S 1 2

    w h e r e s u b s c r i p t s 1 a n d 2 r e f e r t o t h e f i r s t a n d s e c o n d

    3 3 2 2 G e n e t i c s : N e i

  • 8/2/2019 IMPRESO-Analysis of Gene Diversity-Nei 1973

    3/3

    P r o c . N a t . A c a d . S c i . USA 7 0 ( 1 9 7 3 )p o p u l a t i o n s , r e s p e c t i v e l y . From E q . 7 , J s j = Jc-D c s i ( i = 1 , 2 ) . On t h e o t h e r h a n d ,

    J S 1 2 = E X - k y - kkr 8= EE E x i y j k / ( r s ) .i i k

    L e t D i j = ( J i + J j ) / 2 - J j , , w h e r e J f = E k X 2 g k J j =E k y j k , a n d J e w = k i k Y j k . T h e n ,r eJ S 1 2 = E { ( J i + J j ) / 2 - D i j } / ( r s )i j

    = ( J c i + J c 2 ) / 2 - D C 1 2w h e r e D C 1 2 = , j D 1 / ( r s ) . T h e r e f o r e , we h a v e

    D S 1 2 = DC2- ( D c s , + D c s 3 2 ) / 2 . [ 1 4 ]N a m e l y , t h e g e n e d i v e r s i t y b e t w e e n t w o s u b p o p u l a -t i o n s i s e q u a l t o t he a v e r a g e g en e d i v e r s i t y b e t w e e n ap a i r o f c o l o n i e s , o n e f r o m e a c h o f t h e t w o s u b p o p u l a -t i o n s , m i n u s t h e a v er a g e g en e d i v e r s i t y b e t w e e n t h ec o l o n i e s w i t h i n s u b p o p u l a t i o n s . F o r m u l a 1 4 may b eu s e d f o r e s t i m a t i n g D C 1 2 f r o m D S 1 2 a n d ( D c 1 + D C 2 ) / 2 .I t i s n o t e d t h a t i f we t a k e t h e a v er a g e o f D S 1 2 o v e r a l lc o m b i n a t i o n s o f s u b p o p u l a t i o n s , i t r e d u c e s t o D S T i nE q . 1 3 , a s e x p e c t e d .S o f a r we h a v e c o n s i d e r e d o n l y a s i n g l e l o c u s , b u tt h e p r e s e n t m e t h o d i s a p p l i c a b l e t o a n y n u m b e r o f

    l o c i , i f we r e p l a c e t h e g e n e d i v e r s i t y f o r a l o c u s b y t h ea v e r a g e g e n e d i v e r s i t y f o r a l l l o c i s t u d i e d . I n f a c t , i no r d e r t o know a g e n e r a l p i c t u r e o f g e n e d i f f e r e n t i a t i o namong s u b p o p u l a t i o n s , a l a r g e n u m b e r o f l o c i t h a t i s ar a n d o m s a m p l e o f t h e g e n o m e s h o u l d b e u s e d , i n c l u d i n gb o t h p o l y m o r p h i c a n d m o n o m o r p h i c l o c i ( 7 ) .

    I n t h e p r es e n t p a p e r , we w e r e m a i n l y c o n c er n ed w i t ht h e g e n e d i f f e r e n t i a t i o n among c l o s e l y r e l a t e d g e o g r a p h -i c a l p o p u l a t i o n s . I f t h e d e g r e e o f g e n e d i f f e r e n t i a t i o n i sl a r g e , a s i s t h e c a s e w i t h a g r o u p o f s u b s p e c i e s , a n d J Ti s much s m a l l e r t h a n J s , D S T i n E q . 7 ( o r .m i n E q . 1 0 )i s n o t a g o o d m e a s u r e o f d i f f e r e n t i a t i o n . I n t h i s c a s e ab e t t e r e s t i m a t e may b e o b t a i n e d b y D s T = - l o g e( J T / J s ) , i n a n a l o g y w i t h t h e g e n e t i c d i s t a n c e d i s c u s s e di n my e a r l i e r p a p e r ( 6 ) . S i m i l a r l y , a b e t t e r e s t i m a t e o fG S T ma y b e o b t a i n e d b y - l o g e ( J T / J S ) / [ - l o g e J T J .

    I t h a n k D r . S e w a l l W r i g h t f o r h i s v a l u a b l e c o m m e n t s o n t h em a n u s c r i p t o f t h i s p a p e r . T h i s w o r k w a s s u p p o r t e d b y U . S .P u b l i c H e a l t h S e r v i c e G r a n t GM 2 0 2 9 3 .1 . W r i g h t , S . ( 1 9 4 3 ) G e n e t i c s 2 8 , 1 1 4 - 1 3 8 .2 . W r i g h t , S . ( 1 9 5 1 ) A n n . E u g e n i c s , 1 - 5 , 3 2 3 - 3 5 4 .3 . W r i g h t , S . ( 1 9 6 5 ) E v o l u t i o n 1 9 , 3 9 5 - 4 2 0 .4 . N e i , M . ( 1 9 6 5 ) E v o l u t i o n 1 9 , 2 5 6 - 2 5 8 .5 . N e i , M. ( 1 9 7 2 ) A m e r . N a t u r a l i s t 1 0 6 , 2 8 3 - 2 9 2 .6 . N e i , M. ( 1 9 7 3 ) i n G e n e t i c s o f P o p u l a t i o n S t r u c t u r e , e d . M o r t o n ,N . E . ( U n i v . o f H a w a i i , H o n o l u l u ) , i n p r e s s .7 . N e i , M. & R o y c h o u d h u r y , A . K . ( 1 9 7 2 ) S c i e n c e 1 7 7 , 4 3 4 -4 3 6 .8 . L e w o n t i n , 1 H . C . ( 1 9 7 3 ) E v o l . B i o l . 6 , 3 8 1 - 3 9 8 .

    G e n e D i v e r s i t y 3 3 2 3