[发明专利]一种基于抽象凸估计的k-近邻蛋白质结构预测方法有效
申请号: | 201811000827.7 | 申请日: | 2018-08-30 |
公开(公告)号: | CN109326321B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 周晓根;张贵军;彭春祥;刘俊;胡俊 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B40/30;G06N3/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于群体阶段性样本训练的k‑近邻预测全局优化方法,首先,对初始种群建立能量函数的下界估计模型;然后,选择当前种群中能量最低的构象和局部较优构象来指导每个构象的变异过程;其次,将初始种群的所有测试构象个体进行能量函数评价,并看作样本构象,基于样本构象中的k个近邻个体来计算测试构象的k‑近邻能量预测值,同时计算测试构象的能量下界估计值,选择两者中较低者为测试构象的能量估计值,从而指导构象选择;最后,根据被接收的构象来更新样本库和下界估计模型。本发明提供一种计算代价较低、预测效率和预测精度均较高的基于抽象凸估计的k‑近邻蛋白质结构预测方法。 | ||
搜索关键词: | 一种 基于 抽象 估计 近邻 蛋白质 结构 预测 方法 | ||
【主权项】:
1.一种基于抽象凸估计的k‑近邻蛋白质结构预测方法,其特征在于,所述方法包括以下步骤:1)输入待测蛋白质的序列信息,并从ROBETTA服务器上得到片段库;2)参数设置:设置种群规模NP,交叉概率CR,温度因子KT,斜率控制因子M,片段长度为l,近邻个体数量k,最大迭代次数Gmax,并初始化迭代次数g=0;3)根据输入序列,从每个残基位对应的片段库中随机选择片段进行组装生成初始构象种群P={C1,C2,...,CNP},其中,Ci,i={1,2,…,NP}为种群P中的第i个构象个体;4)根据Rosetta socre3能量函数计算当前种群中每个构象的能量值;5)根据当前种群中每个构象Ci,i∈{1,2,…,NP}的碳α原子坐标表示其空间位置坐标
并计算每个构象Ci的抽象凸下界估计支撑向量li:
其中,E(Ci)为构象Ci的能量,
t∈{1,2,...,3L}为构象Ci位置坐标的第t维元素,
为构象Ci的空间位置坐标的松弛变量;6)将当前种群中所有构象按照能量从低到高进行排序;7)对种群中的每个构象Ci,i∈{1,2,...,NP}执行如下操作:7.1)将构象Ci看作目标构象,选出当前种群中能量最低的构象Cbest,然后从排名靠前的NP/2构象中随机选取一个与Ci和Cbest均不相同的构象Cpbest;7.2)分别从Cbest和Cpbest中随机选择一个残基位不同的长度为l的片段替换构象Ci中对应位置的片段,生成变异构象
7.3)随机生成一个0和1之间的小数R,如果R<CR,则从构象Ci中随机选取一个长度为l的片段替换变异构象
中对应位置的片段,并进行一次随机片段组装,从而生成测试构象
否则直接将变异构象进行一次随机片段组装生成测试构象
8)如果g=0,则对每个测试构象
i∈{1,2,...,NP}进行如下操作:8.1)根据Rosetta score3能量函数计算
的能量值
并将其加入到样本库中;8.2)如果
则测试构象
替换对应的目标构象Ci,否则根据玻尔兹曼概率
用
替换Ci,其中
9)如果g>0,则对每个测试构象
i∈{1,2,...,NP}进行如下操作:9.1)计算测试构象
的能量下界估计值
其中
t∈{1,2,...,3L}为构象
空间位置坐标的第t维元素,
为第i个构象的支撑向量的第t维元素;9.2)根据构象的空间位置坐标计算测试构象
与样本库中每个样本构象
之间的欧氏距离,其中s=1,2,...,NP;9.3)选取与
距离最近的k个样本构象,计算测试构象的k‑近邻能量预测值![]()
其中,
为所选中的k个样本构象中第n个样本构象的能量值;9.4)计算构象
的能量估计值
9.5)如果
则目标构象Ci保持不变,其中E(Ci)为目标构象的能量值;9.6)如果
则根据Rosetta score3能量函数计算测试构象
的能量值
9.7)如果
根据公式(1)计算构象
的支撑向量
并用
替换当前种群中能量最高的构象的支撑向量,同时用
替换样本库能量最高的构象;9.8)如果
则根据玻尔兹曼概率
用
替换Ci,其中
10)g=g+1,如果g>Gmax,则输出能量最低的构象作为最终预测结构,否则返回步骤6)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811000827.7/,转载请声明来源钻瓜专利网。