[发明专利]一种微卫星不稳定性的测序数据分析方法、装置及计算机可读介质有效
申请号: | 201710795439.1 | 申请日: | 2017-09-06 |
公开(公告)号: | CN107526944B | 公开(公告)日: | 2018-08-24 |
发明(设计)人: | 邵阳;朱明赴;常志力;汪笑男;闫重光;吴舒雨;包华;童晓玲 | 申请(专利权)人: | 南京世和基因生物技术有限公司 |
主分类号: | G06F19/22 | 分类号: | G06F19/22 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 邓唯 |
地址: | 210061 江苏省南京市高新开发区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种微卫星不稳定性的测序数据分析方法、装置及计算机可读介质。能够利用NGS测序结果判定出是否存在微卫星不稳定的情况,该分析计算方法在不降低特异性的情况下能够明显提高检测敏感性,可以快速、自动化、高通量、高灵敏度、高特异性地评估每个MSI位点的稳定或不稳定状态,进而结合每个样本中所有MSI位点的状态,综合评估样本为MSS,MSI‑L,或MSI‑H。 | ||
搜索关键词: | 一种 卫星 不稳定性 序数 分析 方法 装置 计算机 可读 介质 | ||
【主权项】:
1.一种微卫星不稳定性的测序数据分析方法,其特征在于,包括如下步骤:S1:对待测样本以及正常样本采用NGS测序,获取待测样本和正常样本中覆盖需要测定的MSI位点的测序数据;S2:对于步骤S1中获得的测序数据,同时采用以下三种判定方法进行判定,至少其中一个判定方法满足时,即认为该样本的微卫星位点为不稳定;S2‑1:根据步骤S1的测序数据,计算出每个待测样本和正常样本在该MSI位点上的主要重复单元类型,统计出在每个正常样本中主要重复单元类型的种类数Ni,并计算出种类数Ni的平均值mean(Ni)及标准偏差sd(Ni);若对于待测样本的主要重复单元类型的种类数>mean(Ni)+x×sd(Ni),则判定该样本中MSI位点为不稳定微卫星位点;其中x为标准差系数;S2‑2:根据步骤S1的测序数据,计算出每个待测样本和正常样本在该MSI位点上的主要重复单元类型,若在待测样本中找到了在正常样本中未出现过的主要重复单元类型,则判定该样本中MSI位点为不稳定微卫星位点;S2‑3:根据步骤S1的测序数据,将所有的正常样本作为整体,计算出所有的正常样本上的人群主导重复单元类型,再分别计算出所述的人群主导重复单元类型在每个正常样本上所占比例,根据所占的比例进行统计,得到分布参考集合,计算出所占比例的中位数Q2(Ri),第一四分位数Q1(Ri)和第三四分位数Q3(Ri);计算出所述的人群主导重复单元类型在每个待测样本上所占比例RTi,当RTi满足以下条件时,则判定该样本中MSI位点为不稳定微卫星位点:RTi>Q2(Ri)+1.5×(Q3(Ri)‑Q1(Ri))或RTi 。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京世和基因生物技术有限公司,未经南京世和基因生物技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710795439.1/,转载请声明来源钻瓜专利网。
- 上一篇:散热器半成品除油除锈清洗设备
- 下一篇:一种医疗器械清洗装置
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用