[发明专利]三代测序数据纠错的方法、装置和计算机可读存储介质有效
申请号: | 201710170899.5 | 申请日: | 2017-03-21 |
公开(公告)号: | CN108629156B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 徐煜;李治鑫;林哲;高强;霍守江;肖黎 | 申请(专利权)人: | 深圳华大基因科技服务有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B30/20;G16B40/00 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 孙银行;彭家恩 |
地址: | 518083 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种三代测序数据纠错的方法,包括:利用二代测序数据和/或三代测序数据,组装出参考基因组;将二代测序数据和三代测序数据比对到参考基因组上;对于三代测序数据比对结果中每个比对片段上的每个碱基位置,推断并赋予该碱基位置一个最大可能性的碱基型和质量值;对于读长中有多个比对片段和/或未比对上的片段,将多个比对片段和/或未比对上的片段整合为一条读长。本发明对三代测序数据深度没有限制,能够实现对低深度的三代测序数据的纠错,不引入额外的数据损失和读长长度损失,并且引入纠错结果的质量值体系,使得纠错结果的单碱基质量可以评价。 | ||
搜索关键词: | 三代测 序数 纠错 方法 装置 计算机 可读 存储 介质 | ||
【主权项】:
1.一种三代测序数据纠错的方法,其特征在于,包括:利用二代测序数据和/或三代测序数据,组装出一个初步的参考基因组;将所述二代测序数据和所述三代测序数据比对到所述参考基因组上;对于所述三代测序数据比对结果中每个比对片段上的每个碱基位置,推断并赋予该碱基位置一个最大可能性的碱基型和质量值;对于所述三代测序数据的读长中有多个比对片段和/或未比对上的片段,根据所述最大可能性的碱基型和质量值,将所述多个比对片段和/或未比对上的片段整合为一条读长。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因科技服务有限公司,未经深圳华大基因科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710170899.5/,转载请声明来源钻瓜专利网。