[发明专利]一种基于阶段性多策略副本交换的蛋白质结构预测方法有效
申请号: | 201610390366.3 | 申请日: | 2016-06-02 |
公开(公告)号: | CN106055920B | 公开(公告)日: | 2018-09-18 |
发明(设计)人: | 张贵军;俞旭锋;周晓根;郝小虎;王柳静 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于阶段性多策略副本交换的蛋白质结构预测方法,在差分进化算法(DE)的框架下,首先,在每个温度层中生成具有多样化折叠类型的初始构象种群;然后,对每个温度层,根据迭代次数将构象搜索分为两个阶段,第一个阶段从种群中随机选取一个构象作为目标个体,第二个阶段根据能量将种群分为两个部分,从能量低的前50%的种群中随机选取一个个体作为目标个体;之后,随机选取与目标个体不一样的三个构象个体经过变异、交叉和片段组装策略生成测试个体,并根据构象的能量判断是否接受测试个体,进而将相邻的温度层的对应个体进行副本交换;在阶段性策略的指导下,辅以副本交换策略,通过不断更新种群获得一系列亚稳态构象。 | ||
搜索关键词: | 一种 基于 阶段性 策略 副本 交换 蛋白质 结构 预测 方法 | ||
【主权项】:
1.一种基于阶段性多策略副本交换的蛋白质结构预测方法,其特征在于:所述预测方法包括以下步骤:1)给定查询序列信息;2)初始化:设置群体规模NP,变异因子F,交叉概率CR,n个温度层T,迭代次数iteration,片段长度为L,能量函数选用Rosetta Score3,首先通过对查询序列随机的折叠和变换,在每个温度层生成一个规模为NP的初始构象种群,初始群体为P={xi|i∈I},计算初始种群构象个体的能量值f(xi),i∈I,并设
其中i为种群个体编号,I为种群个体编号集合,I={1,2,...,NP},
为对应温度层能量函数值中的最小值,T为温度层;3)开始迭代,依次对每个温度层种群中的每个个体进行以下操作:3.1)令g=1,g为迭代计数器;3.2)随机选取种群中的一个构象个体xi,i∈{1,2,3,… ,NP},令Ptarget=xi,Ptarget表示目标构象个体,执行以下操作得到变异构象Pmutant;3.3)随机生成正整数rand1,rand2,rand3,rand1,rand2和rand3均∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i,令Prand1=xrand1,Prand2=xrand2,Prand3=xrand3;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4,randrange1,randrange2,randrange3和randrange4均∈{1,2,… ,Length}, Length为序列长度;3.4)令a=min(randrange1,randrange2),b=max(randrange1,randrange2);令c=min(randrange3,randrange4),d=max(randrange3,randrange4);其中min表示取两个数的最小值,max表示取两个数的最大值;3.5)如果g≤iteration/2,用Prand2上位置a到位置b的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1的相同位置所对应的二面角phi、psi、omega;再使用Prand3上位置c到位置d的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1上相同位置所对应的二面角phi、psi、omega,再将所得Prand1进行片段组装得到变异个体Pmutant,跳转至3.7);3.6)如果iteration/2 执行交叉过程:若随机数rand4≤CR,个体Pmutant的片段rand5替换为个体Ptarget中对应的片段,否则直接继承变异个体得到测试个体Ptrail;3.8)针对每个温度层中的目标个体Ptarget和测试个体Ptrail进行选择操作:3.8.1)计算Ptarget和Ptrail的能量:E(Ptarget)和E(Ptrail);3.8.2)若E(Ptarget)>E(Ptrail)则用Ptrail替换Ptarget,进入3.8);4)在每个温度层都进行变异、交叉和选择更新完种群后,将相邻温度层中对应的个体进行副本交换:4.1)首先选择种群中第i个个体,i∈I(i=1,2,… ,NP);4.2)选择两个相邻的温度层Tj和Tj+1,j=1,2,… ,n;4.3)产生一个随机数randx∈(0,1)和判别数:
其中,
表示在Tj个温度层中第i个个体,其中i=1,2,···,NP,
为种群个体
的能量值,K为玻尔兹曼常数,Tj(j=1,2,…,n)为第j个温度层的开尔文温度,j为索引编号,e为自然常数;4.4)若randx<judge,将相邻温度层中的
和
个体进行交换;5)判断是否满足终止条件,如不满足则转至3);若满足则输出结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610390366.3/,转载请声明来源钻瓜专利网。
- 上一篇:复合多铁性材料
- 下一篇:交通运输设备中的群聚仪表板
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用