[发明专利]一种表情解析的方法和系统有效
申请号: | 201210227200.1 | 申请日: | 2012-06-30 |
公开(公告)号: | CN102779189A | 公开(公告)日: | 2012-11-14 |
发明(设计)人: | 鞠训卓 | 申请(专利权)人: | 北京神州泰岳软件股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝 |
地址: | 100089 北京市海淀区万*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 表情 解析 方法 系统 | ||
技术领域
本发明涉及计算机领域,特别涉及一种表情解析的方法和系统。
背景技术
IM(Instant Message,即时消息)工具已经成为人们日常生活和工作中不可或缺的通信工具。随着智能手机的用户的增多,运行在智能手机上的IM工具也越来越丰富等。能够发送和接收表情是IM应用一个重要的组成部分,缺少表情的IM应用会带来用户体验的下降。在智能手机平台上,处理器速度有限,内存也较为紧张,在这种情况下,如何提高表情解析的速度,占用较少的内存,就显得尤为重要。
现有技术中进行表情解析时,使用多叉树进行遍历。在针对给定的表情代码集合,创建用于存储表情代码的多叉树时,在程序中需要对每个表情代码使用硬编码,不利于表情的扩展。在使用该多叉树进行表情解析的时候,遍历速度慢导致表情解析速度慢。
发明内容
本发明提供了一种表情解析的方法和系统,以解决表情解析速度慢的问题。
本发明公开了一种表情解析的方法,所述方法包括:
根据表情代码构建表情平衡二叉树和前缀平衡二叉树,表情平衡二叉树中节点为表情代码;前缀平衡二叉树中节点为表情代码中前缀子字符串;
利用表情平衡二叉树和前缀平衡二叉树从目标文本对目标文本进行检索,从目标文本中解析出表情代码。
其中,所述利用表情平衡二叉树和前缀平衡二叉树从目标文本对目标文本进行检索,从目标文本中解析出表情代码具体包括:
从目标文本中取字符作为当前解析字符串的初始字符,按如下步骤解析当前解析字符串,
步骤1,在表情平衡二叉树中检索当前解析字符串,如果检索到,则执行步骤2,如果没有检索到,则执行步骤3;
步骤2,确定当前解析字符串为表情代码;
步骤3,在前缀平衡二叉树中检索当前解析字符串,如果检索到,则从目标文本中取下一个字符添加到当前解析字符串中,执行步骤1,如果没有检索到,则执行步骤4;
步骤4,确定当前解析字符串不为表情代码。
其中,所述根据表情代码构建前缀平衡二叉树具体包括:
从各个表情代码中提取前缀子字符串,组成前缀集合;
对于前缀集合中多个相同前缀子字符串,保留一个在前缀集合中;
依据前缀集合构建前缀平衡二叉树。
其中,所述从目标文本中取字符作为当前解析字符串的初始字符具体包括:
如果上次解析的当前解析字符串为表情代码,则从目标文本中取上次解析的当前解析字符串中最后一个字符的下一个字符,作为本次解析的当前解析字符串的初始字符。
其中,所述从目标文本中取字符作为当前解析字符串的初始字符具体包括:
如果上次解析的当前解析字符串不为表情代码,则从目标文本中取上次解析的当前解析字符串的初始字符的下一个字符,作为本次解析的当前解析字符串的初始字符。
其中,所述步骤2还包括:
依据检索到的表情代码确定当前解析字符串代表的表情。
本发明还公开了一种表情解析的系统,所述系统包括:
平衡二叉树构建模块,用于根据表情代码构建表情平衡二叉树和前缀平衡二叉树,表情平衡二叉树中节点为表情代码;前缀平衡二叉树中节点为表情代码中前缀子字符串;
文本解析模块,用于利用表情平衡二叉树和前缀平衡二叉树从目标文本对目标文本进行检索,从目标文本中解析出表情代码。
其中,所述文本解析模块具体包括:
字符提取单元,用于从目标文本中取字符作为当前解析字符串的初始字符,调用表情判断单元开始解析当前解析字符串,
表情判断单元,用于在表情平衡二叉树中检索当前解析字符串,如果检索到,则确定当前解析字符串为表情代码,并调用字符提取单元,如果没有检索到,则调用前缀判断单元;
前缀判断单元,用于在前缀平衡二叉树中检索当前解析字符串,如果检索到,则从目标文本中取下一个字符添加到当前解析字符串中,调用表情判断单元,如果没有检索到,则确定当前解析字符串不为表情代码,并调用字符提取单元。
其中,所述平衡二叉树构建模块具体用于:从各个表情代码中提取前缀子字符串,组成前缀集合;对于前缀集合中多个相同前缀子字符串,保留一个在前缀集合中;依据前缀集合构建前缀平衡二叉树。
其中,所述字符提取单元具体用于:
如果上次解析的当前解析字符串为表情代码,则从目标文本中取上次解析的当前解析字符串中最后一个字符的下一个字符,作为本次解析的当前解析字符串的初始字符;
和/或,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州泰岳软件股份有限公司,未经北京神州泰岳软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210227200.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种散热性能优良的PCB板
- 下一篇:单火线取电装置