Upload
casta
View
124
Download
4
Embed Size (px)
DESCRIPTION
基因组时代的 动物遗传评估技术. 张 勤 刘剑锋 中国农业大学 2009.8.25 哈尔滨. 遗传评估. 评估和比较动物个体在遗传上的优劣 为选择优秀种用个体提供依据 动物育种的中心工作. 表现型=基因型+环境. 选择. 常规遗传评估技术. 基因 (黑箱). 表型. 遗传评估. BLUP. 亲属的表型. 环境. 特点:利用表型进行遗传评估. 常规遗传评估技术. BLUP 方法是常规遗传评估技术的核心. y :表型信息 A :系谱信息. 美国荷斯坦奶牛产奶量表型及遗传进展. 常规遗传评估技术. 加拿大猪 100kg 体重日龄遗传进展. - PowerPoint PPT Presentation
Citation preview
基因组时代的动物遗传评估技术张 勤 刘剑锋中国农业大学2009.8.25哈尔滨
遗传评估• 评估和比较动物个体在遗传上的优劣• 为选择优秀种用个体提供依据• 动物育种的中心工作
表现型=基因型+环境
常规遗传评估技术基因基因(黑箱)(黑箱) 表型表型
环境环境
选择选择
遗传评估遗传评估
亲属的表型亲属的表型
BLUPBLUP
特点:利用表型进行遗传评估
常规遗传评估技术• BLUP 方法是常规遗传评估技术的核心
yZyX
AZZXZZXXX
e ''
u
ˆ''
''12
a2
y :表型信息A :系谱信息
eZuXy
常规遗传评估技术• 对很多重要经济性状十分有效
Milk yield in US Holsteins
6
7
8
9
10
11
12
1960 1970 1980 1990 2000Birth year
Firs
t lac
tatio
n yi
eld
(100
0 kg
)
Genetic
Phenotypic
美国荷斯坦奶牛产奶量表型及遗传进展加拿大猪 100kg体重日龄遗传进展
常规遗传评估技术• 局限性
– 当性状表型难以获取或遗传力低时,遗传评估可靠性不高– 不能进行早期遗传评估
标记辅助选择(MAS)基因基因(黑箱)(黑箱) 表型数据表型数据
基因信息基因信息遗传评估遗传评估分子遗传学分子遗传学
主效基因主效基因 //QTLQTL
选择选择
特点:利用表型和部分基因的信息进行遗传评估
标记辅助选择( MAS )
eMgZuXy y :表型信息A :系谱信息M : 标记信息
遗传评估技术 - MA-BLUP :
标记辅助选择( MAS )• 应用现状
– 实际应用不多– 应用效果不显著– 主要原因:
• 已被证实具有显著效应的基因或标记有限– (发现并证实一个有效的基因需要很长的时间和很高的成本)
• 这些基因或标记仅能解释有限的遗传变异– ( 10 QTL ~ 50% 遗传变异)
基因组选择• 利用覆盖全基因组的高密度标记( SNP )进行个体遗传评估
– 可以捕获所有的遗传变异– 无需表型信息即可进行遗传评估– 利用 SNP 芯片技术进行标记测定
基因基因(黑箱)(黑箱) 标记信息标记信息 遗传评估遗传评估
全基因组 SNP芯片
Year No. SNP ChipsHuman 2008 3,000,000 1000k
Poultry 2005 2,800,000 60K
Bovine 2007 ~2,000,000 54k
Pig 2008 ~2,000,000 60k
Sheep 2007 - 50k
用于遗传评估的数据10001112200200121110111121111011110011211000201220022201111202101200211122110021112001111001011011010220011002201101120020110102022212112210201001110001122022122211202112012020100202202000021100011202011221112111022011110000212202000221012020002211220111012100111211102112110020102100022000220100020110000220221102211210112111012222001211212220020002002020201222110022222220022121111210021111200110111011200202220001112011010211121211102022100211201211001111102111211021112200010110111020220022111010201112111101120210210212110110221220012110112110120220110022200210021100011100211021101110002220020221212110002220102002222121221121112002011020200122222211221202121121011001211011020022000200100200011110110012110212121112010101212022101010111110211021122111111212111210110120011111021111011111220121012121101022202021211222120222002121210121210201100111222121101
基因组选择• 基本步骤1. 利用一个参考群体估计每个 SNP的效应
–参考群体:每个个体都有性状表型记录和所有 SNP基因型2. 利用 SNP效应估计值计算候选群体的个体基因组育种值
–候选群体:每个个体都有所有 SNP基因型
基因组选择估计所有
SNP 的遗传效应SNP 基因型性状表型
SNP 基因型 估计基因组育种值
SNP 基因型
候选群体
估计基因组育种值
参考群体
在参考群中估计标记效应 gi
1n i iy X g e
设计矩阵 染色体片断遗传效应
估计标记效应
在候选群体中计算个体 gEBV
p
i iigXEBV1
g
全部基因组染色体片断
设计矩阵 染色体片断效应
4×
计算基因组育种值 (gEBV)
基因组育种值
1 + 1 - 1 - 1 + 1 + 25 - 1 + 1 - 1 - 1 - 1 + 42 + 1 - 1 - 1 - 1 - 1 - 22 - 1 + 1 - 1 - 1 = +38
- 40
SNPeffect
- 00
+ 20
+ 40
- 20
Chr 1 Chr 2 Chr 3 ...... Chr n
Known SNPs
n
iiigEBV
1
gXNumber of SNPs
SNP allele effect
标记效应的估计方法最小二乘法岭回归和 BLUP贝叶斯方法
BayesA, B, C 和压缩其他方法
半参数、非参数机器学习、主成份分析
最小二乘法对标记效应分布无任何假设1: 对每个标记作单点回归分析
2: 选择效应值最大的 m 个点放入模型中,同时对其进行估计
1ny Xg e
1n i iy X g e 不足:
1. 难以确定模型选择的阈值 2. 容易高估标记效应
最佳线性无偏预测和岭回归
假定全部标记有相同的方差
2)( gVar Ig
1ˆ ( ' ) 'X X X y g Iλ
1n i iy X g e
22ge BLUP:
岭回归 : 人为选定
2
2
2
2
0 0 0 0 00 0 0 0... ... ... ...
0 0... ...
g
g
g
g
sym.
贝叶斯方法 -A允许不同标记有不同的方差且服从一定分布
)()|()|( 222iii ggiig PgPP g
( , | ) ( | , ) ( , )i i iP y P y g P g g数据模型
方差模型
),(~ 22 svgi
使用 Gibbs sampling!u , gi , Ve , Vgi
图片来自 Hayes,2001
允许标记方差为 0
概率为 q
概率为 1-q
02 gi
),(~ 22 svgi
2
0
122
01
2
10
122
01
2 // gj
n
iij
n
i
p
jkkikiijgj
n
iij xbxbyxxN ,
Bayesian shrinkage
标记效应越大 , 压缩越弱 标记效应越小,压缩越强
贝叶斯方法 -B,压缩
准确性:估计育种值和真实育种值间的相关0. 848
0. 7980. 732
0. 318
00. 10. 20. 30. 40. 50. 60. 70. 80. 9
1
LS BLUP BayesA BayesB
Accu
racy
r2
数据来自 Meuwissen al et., 2001
不同方法的准确性
SNP Add.
Polygenic
SNP Dom.
y 1 Xa Zu e
y 1 Xa Yd Zu e
y 1 Xa e
a: additive SNP d: dominance SNPu: polygenic e: residue
y :表型信息X: 遗传标记信息A :系谱信息
模型的扩展
基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)• 后裔测验 ( 数据来自加拿大 )
– 每年参加后测的公牛数量 : 500 头– 每头后测公牛的育种成本 : 5 万美元– 后测的总成本 : 2500 万美元– 中选公牛数目 : 20 头– 每头中选公牛的育种成本 : 125 万美元– 年遗传进展 : 0.215 遗传标准差– 单位遗传标准差遗传进展的育种成本 : 1.16亿美元
• 基因组选择– 每个个体基因组标记信息测定成本: 500 美元– 基因组单倍型效应估计
• 孙女试验设计 : 50 个公牛家系 , 每头公牛 50 个儿子 ,每个儿子 100 个女儿• 效应估计成本: 125 万美元
– 公牛母亲选择• 进行 2000 头母牛的预选择• 全部个体进行基因组标记信息测定,根据 GEBV 选
择 1000母牛• 评估成本 :100 万美元
基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)
• 基因组选择(续)– 公牛选择
• 从 1000 头公牛母亲中获得 500 头预选公牛• 对所有公牛进行基因组标记测定,根据 GEBV 选择 20 头公牛• 评估成本 : 25 万美元
– 20 头公牛的购买成本 :10 万美元– 每头公牛连续3 年的维持费用 : 3 万美元– 每年的总育种成本 :195 万美元– 每年的遗传进展 : 0.467 遗传标准差– 单位遗传标准差遗传进展的育种成本: 417 万美元
基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)
基因组选择的另一策略• 利用参考群体估计 SNP效应• 选择效应显著的 SNP• 利用选择 SNP的信息构建的参考群体和候选群体个体间的加性遗传相关矩阵(具有性状特异性)• 用 BLUP方法估计候选群体(无表型信息)的个体育种值
yZ
yXGZZXZ
ZXXX''
u
ˆ
''''
原理:
参考群体及候选群体的个体育种值利用 SNP 的信息构建的加性遗传相关矩阵
基因型系谱121101011110
111211120200
101121101111
122221121111
101101111102
011111012011
1211200110100 = homozygous for first allele (alphabetically)1 = heterozygous2 = homozygous for second allele (alphabetically)
G的构建
min
min
1 ssS
g ijij
m
kkijkij gS
mS
1
1
AIS0,0AIS1,5.0AIS2,1
alleleifalleleifallelsif
Sijk
准确性
标记效应估计方法
两种基因组选择策略的比较
基因组选择在奶牛中的应用开始应用基因组选择的年份 国家 应用范围
2009 Canada, Germany, USA, New Zealand, Israel, France, Ireland, Spain ( 8 个国家)
For the selection of: young unproven bulls,active proven bulls,Bull dams
2010 Austria, Australia, Poland ( 3 个国家)未来 /尚未决定 UK, Netherlands, Norway,
Denmark, Italian, Japan, Belgium, Czech Republic, Estonia, Finland, Hungary, Latvia, Slovak Republic, Slovenia, South Africa, Sweden, Switzerland, China ( 17个国家)
Questions
• 如何估计和分析基因间的互作效应 ?• 基因组 SNP 标记测定数目的确定 ?• SNP 效应的估计周期 ?• 长期选择优化的方案问题 ?• 多性状选择问题 ? • 畜禽育种中基因定位的必要性 ?
Thanks for your attentions!