[发明专利]基于文本相似度模型的文本匹配方法及系统在审
申请号: | 201811344782.5 | 申请日: | 2018-11-13 |
公开(公告)号: | CN109460461A | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 朱钦佩 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F17/27;G10L15/26 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 方挺;黄谦 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种基于文本相似度模型的文本匹配方法。该方法包括:接收文本信息,确定文本信息的特征向量,其中,特征向量至少包括:文本字符串、文本拼音、词向量;将特征向量输入至的文本相似度模型中;获取文本相似度模型输出的特征相似度;根据特征相似度确定至少一个达到预设特征阈值的预设语句以作为文本信息的匹配文本。本发明实施例还提供一种基于文本相似度模型的文本匹配系统和文本相似度模型的训练方法及系统。本发明实施例通过使用考虑多种维度特征向量的文本相似度模型确定出用户输入语句与文本相似度模型中各预设语句的特征相似度,进而确定出相对精准较高的匹配文本。 | ||
搜索关键词: | 文本相似度 特征向量 特征相似度 文本匹配 文本信息 预设 匹配文本 语句 用户输入语句 文本字符串 模型确定 词向量 拼音 维度 文本 输出 | ||
【主权项】:
1.一种文本相似度模型的训练方法,包括:接收词库训练集,对所述词库训练集中各预设语句分词处理,确定所述预设语句的文本字符串;根据各预设语句的文本字符串,确定与所述文本字符串相对应的词向量以及与所述文本字符串相对应的文本拼音;根据所述各预设语句对应的文本字符串、文本拼音以及词向量,确定所述各预设语句对应的特征向量,训练文本相似度模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811344782.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种面向智能应用的领域本体构建方法
- 下一篇:一种中文相似问题生成系统与方法