[发明专利]一种使用LDA主题模型对法律判决文书进行相似度匹配的方法有效
申请号: | 201710940104.4 | 申请日: | 2017-10-11 |
公开(公告)号: | CN107807962B | 公开(公告)日: | 2018-11-30 |
发明(设计)人: | 汪洋;王佳梁 | 申请(专利权)人: | 中国软件与技术服务股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06Q50/18 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 司立彬 |
地址: | 100081 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种使用LDA主题模型对法律判决文书进行相似度匹配的方法。本方法为:对判决文书库中每一待处理的法律判决文书,抽取对该法律判决文书中法律事实部分的段落中每一句子,使用LDA方法抽象事实提取,得到句子对应的一个抽象事实类,将各句子的抽象事实类构成的抽象事实类集作为法律判决文书的抽象事实类集;将各法律判决文书的抽象事实类集去重合并,构成一抽象事实类总集;从输入的查询请求中的法律事实段落的每个句子中抽取关键词;根据查询请求中各句子的抽象事实类得到该查询请求对应的一抽象事实类集;将得到的抽象事实类集与每一法律裁判文书的抽象事实类集中的各抽象事实类进行对比,得到该查询请求匹配的法律判决文书。 | ||
搜索关键词: | 一种 使用 lda 主题 模型 法律 判决 文书 进行 相似 匹配 方法 | ||
【主权项】:
1.一种使用LDA主题模型对法律判决文书进行相似度匹配的方法,其步骤包括:1)对判决文书库中每一待处理的法律判决文书进行抽象事实建模;即对每一法律判决文书,抽取该法律判决文书中法律事实部分的段落,并将抽取的段落切分为若干句子,然后对每一句子,使用LDA方法进行抽象事实提取,得到该句子对应的一个抽象事实类,将各句子的抽象事实类构成的抽象事实类集作为该法律判决文书的抽象事实类集,其中,每个抽象事实类对应一个唯一的词概率分布;将该法律判决文书与该抽象事实类总集进行映射,完成该法律判决文书的抽象事实建模;2)将各法律判决文书的抽象事实类集进行去重合并,构成一抽象事实类总集;3)从输入的查询请求中的法律事实段落的每个句子中抽取关键词;对于该查询请求中的任一句子s,根据公式
计算该句子s在所述抽象事实类总集里的每个抽象事实类上的概率评分,取概率评分最高对应的抽象事实类作为句子s的抽象事实类,根据该查询请求中各句子的抽象事实类得到该查询请求对应的一抽象事实类集;Nw是句子s中的关键词w在当前句子中出现的次数,ρw是在抽象事实类θ中的关键词w的概率分布,
是句子s对抽象事实类θ的概率评分,ρw∈θ;4)将步骤3)得到的抽象事实类集与步骤1)中每一法律裁判文书的抽象事实类集中的各抽象事实类进行对比,然后找到相似度最高的抽象事实类集对应的法律判决文书作为该查询请求匹配的法律判决文书。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国软件与技术服务股份有限公司,未经中国软件与技术服务股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710940104.4/,转载请声明来源钻瓜专利网。
- 上一篇:钢衬PTFE弯头
- 下一篇:一种基于分治策略的输电网线路汇集区快速搜索的方法