第一章::绪绪绪论论 - dtrends.com · 第一章::绪绪绪论论 第一节 引言...

Preview:

Citation preview

第一章第一章第一章第一章::::绪绪绪绪 论论论论

第一节第一节第一节第一节 引言引言引言引言————————从人类基因组计划说起从人类基因组计划说起从人类基因组计划说起从人类基因组计划说起

第二节第二节第二节第二节 生物信息学及其发展历史生物信息学及其发展历史生物信息学及其发展历史生物信息学及其发展历史第三节第三节第三节第三节 生物信息学主要研究内容生物信息学主要研究内容生物信息学主要研究内容生物信息学主要研究内容第四节第四节第四节第四节 生物信息学当前的主要任务生物信息学当前的主要任务生物信息学当前的主要任务生物信息学当前的主要任务第五节第五节第五节第五节 生物信息学所用的方法和技术生物信息学所用的方法和技术生物信息学所用的方法和技术生物信息学所用的方法和技术

第三节第三节第三节第三节第三节第三节第三节第三节

生物信息学主要研究内容生物信息学主要研究内容生物信息学主要研究内容生物信息学主要研究内容生物信息学主要研究内容生物信息学主要研究内容生物信息学主要研究内容生物信息学主要研究内容

生物信息学主要研究内容生物信息学主要研究内容生物信息学主要研究内容生物信息学主要研究内容

1、、、、 生物分子数据的收集与管理生物分子数据的收集与管理生物分子数据的收集与管理生物分子数据的收集与管理

2、、、、 数据库搜索及序列比较数据库搜索及序列比较数据库搜索及序列比较数据库搜索及序列比较

3、、、、 基因组序列分析基因组序列分析基因组序列分析基因组序列分析

4、、、、基因表达数据的分析与处理基因表达数据的分析与处理基因表达数据的分析与处理基因表达数据的分析与处理

5、、、、蛋白质结构预测蛋白质结构预测蛋白质结构预测蛋白质结构预测

基因组基因组基因组基因组数据库数据库数据库数据库

蛋白质蛋白质蛋白质蛋白质序列序列序列序列数据库数据库数据库数据库

蛋白质蛋白质蛋白质蛋白质结构结构结构结构数据库数据库数据库数据库

DDBJ

EMBL

GenBank

SWISS-PROT

PDB

PIR

11、、生物分子数据的收集与管理生物分子数据的收集与管理

2、、、、数据库搜索及序列比较数据库搜索及序列比较数据库搜索及序列比较数据库搜索及序列比较

� 搜索同源序列在一定程度上就是通过序列比较搜索同源序列在一定程度上就是通过序列比较搜索同源序列在一定程度上就是通过序列比较搜索同源序列在一定程度上就是通过序列比较寻找相似序列寻找相似序列寻找相似序列寻找相似序列

� 序列比较的一个基本操作就是序列比较的一个基本操作就是序列比较的一个基本操作就是序列比较的一个基本操作就是比对比对比对比对((((Alignment),),),),即将两个序列的各个字符即将两个序列的各个字符即将两个序列的各个字符即将两个序列的各个字符((((代表核苷酸或者氨基酸残基代表核苷酸或者氨基酸残基代表核苷酸或者氨基酸残基代表核苷酸或者氨基酸残基))))按照对应等同按照对应等同按照对应等同按照对应等同或者置换关系进行对比排列或者置换关系进行对比排列或者置换关系进行对比排列或者置换关系进行对比排列,,,,其结果是两个序其结果是两个序其结果是两个序其结果是两个序列共有的排列顺序列共有的排列顺序列共有的排列顺序列共有的排列顺序,,,,这是序列相似程度的一种这是序列相似程度的一种这是序列相似程度的一种这是序列相似程度的一种定性描述定性描述定性描述定性描述

� 多重序列比对多重序列比对多重序列比对多重序列比对研究的是多个序列的共性研究的是多个序列的共性研究的是多个序列的共性研究的是多个序列的共性。。。。序列序列序列序列的多重比对可用来搜索基因组序列的功能区域的多重比对可用来搜索基因组序列的功能区域的多重比对可用来搜索基因组序列的功能区域的多重比对可用来搜索基因组序列的功能区域,,,,也可用于研究一组蛋白质之间的进化关系也可用于研究一组蛋白质之间的进化关系也可用于研究一组蛋白质之间的进化关系也可用于研究一组蛋白质之间的进化关系。。。。

发现同源分子

3、、、、基因组序列分析基因组序列分析基因组序列分析基因组序列分析

� 遗传语言分析遗传语言分析遗传语言分析遗传语言分析——天书天书天书天书

� 基因组结构分析基因组结构分析基因组结构分析基因组结构分析

� 基因识别基因识别基因识别基因识别

� 基因功能注释基因功能注释基因功能注释基因功能注释

� 基因调控信息分析基因调控信息分析基因调控信息分析基因调控信息分析

� 基因组比较基因组比较基因组比较基因组比较

4、、、、基因表达数据的分析与处理基因表达数据的分析与处理基因表达数据的分析与处理基因表达数据的分析与处理

� 基因表达数据分析是目前生物信息学研究的热基因表达数据分析是目前生物信息学研究的热基因表达数据分析是目前生物信息学研究的热基因表达数据分析是目前生物信息学研究的热

点和重点点和重点点和重点点和重点

� 目前对基因表达数据的处理主要是进行聚类分目前对基因表达数据的处理主要是进行聚类分目前对基因表达数据的处理主要是进行聚类分目前对基因表达数据的处理主要是进行聚类分

析析析析,,,,将表达模式相似的基因聚为一类将表达模式相似的基因聚为一类将表达模式相似的基因聚为一类将表达模式相似的基因聚为一类,,,,在此基在此基在此基在此基

础上寻找相关基因础上寻找相关基因础上寻找相关基因础上寻找相关基因,,,,分析基因的功能分析基因的功能分析基因的功能分析基因的功能

� 所用方法主要有所用方法主要有所用方法主要有所用方法主要有::::� 相关分析方法相关分析方法相关分析方法相关分析方法

� 模式识别技术中的层次式聚类方法模式识别技术中的层次式聚类方法模式识别技术中的层次式聚类方法模式识别技术中的层次式聚类方法

� 人工智能中的自组织映射神经网络人工智能中的自组织映射神经网络人工智能中的自组织映射神经网络人工智能中的自组织映射神经网络

� 主元分析方法主元分析方法主元分析方法主元分析方法

基因芯片基因芯片基因芯片基因芯片

层次式聚类层次式聚类层次式聚类层次式聚类

二二二二二二二二维维维维维维维维电电电电电电电电泳泳泳泳泳泳泳泳图图图图图图图图

5、、、、蛋白质结构预测蛋白质结构预测蛋白质结构预测蛋白质结构预测

� 蛋白质的生物功能由蛋白质的结构所决定蛋白质的生物功能由蛋白质的结构所决定蛋白质的生物功能由蛋白质的结构所决定蛋白质的生物功能由蛋白质的结构所决定 ,,,,蛋蛋蛋蛋白质结构预测成为了解蛋白质功能的重要途径白质结构预测成为了解蛋白质功能的重要途径白质结构预测成为了解蛋白质功能的重要途径白质结构预测成为了解蛋白质功能的重要途径

� 蛋白质结构预测分为蛋白质结构预测分为蛋白质结构预测分为蛋白质结构预测分为:

� 二级结构预测二级结构预测二级结构预测二级结构预测

� 空间结构预测空间结构预测空间结构预测空间结构预测

蛋白质折叠蛋白质折叠蛋白质折叠蛋白质折叠

二级结构预测二级结构预测二级结构预测二级结构预测� 在一定程度上二级结构的预测可以归结为模式识别问题在一定程度上二级结构的预测可以归结为模式识别问题在一定程度上二级结构的预测可以归结为模式识别问题在一定程度上二级结构的预测可以归结为模式识别问题

� 在二级结构预测方面主要方法有在二级结构预测方面主要方法有在二级结构预测方面主要方法有在二级结构预测方面主要方法有::::� 立体化学方法立体化学方法立体化学方法立体化学方法� 图论方法图论方法图论方法图论方法� 统计方法统计方法统计方法统计方法� 最邻近决策方法最邻近决策方法最邻近决策方法最邻近决策方法� 基于规则的专家系统方法基于规则的专家系统方法基于规则的专家系统方法基于规则的专家系统方法� 分子动力学方法分子动力学方法分子动力学方法分子动力学方法� 人工神经网络方法人工神经网络方法人工神经网络方法人工神经网络方法

� 预测准确率超过预测准确率超过预测准确率超过预测准确率超过70%的第一个软件是基于神经网络的的第一个软件是基于神经网络的的第一个软件是基于神经网络的的第一个软件是基于神经网络的PHD系统系统系统系统

空间结构预测空间结构预测空间结构预测空间结构预测

� 在空间结构预测方面在空间结构预测方面在空间结构预测方面在空间结构预测方面,,,,比较成功的理论比较成功的理论比较成功的理论比较成功的理论方法是方法是方法是方法是同源模型法同源模型法同源模型法同源模型法

� 该方法的依据是该方法的依据是该方法的依据是该方法的依据是::::相似序列的蛋白质倾相似序列的蛋白质倾相似序列的蛋白质倾相似序列的蛋白质倾向于折叠成相似的三维空间结构向于折叠成相似的三维空间结构向于折叠成相似的三维空间结构向于折叠成相似的三维空间结构

� 运用同源模型方法可以完成所有蛋白质运用同源模型方法可以完成所有蛋白质运用同源模型方法可以完成所有蛋白质运用同源模型方法可以完成所有蛋白质10-30%的空间结构预测工作的空间结构预测工作的空间结构预测工作的空间结构预测工作