[发明专利]一种互联网行为标注引擎及对应该引擎的行为标注方法有效
申请号: | 201310072271.3 | 申请日: | 2013-03-07 |
公开(公告)号: | CN103136360A | 公开(公告)日: | 2013-06-05 |
发明(设计)人: | 唐波;李骄阳;张祺;薛忠军;高福强;褚秀良;庞岩 | 申请(专利权)人: | 北京宽连十方数字技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 100061 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种互联网行为标注引擎及对应该引擎的行为标注方法,属于用户互联网行为数据的收集和分析技术领域。所述的标注引擎包括分类体系、分词库、语义分析、爬取程序、规则库、知识库、规则解析器、自学习程序8个模块。所述的互联网行为标注方法提出:用户行为=行为主体+行为标识+行为状态,的基本逻辑结构。本发明提高了分类的效率和准确度,细化了互联网用户行为数据的描述粒度,完整识别一次用户行为的动作、对象和环境条件,完整还原了互联网用户行为。按照IUBML规则输出的用户行为数据直接提供基于用户行为和需求理解的精确广告服务,满足企业客户的市场营销需求。 | ||
搜索关键词: | 一种 互联网 行为 标注 引擎 应该 方法 | ||
【主权项】:
一种互联网行为标注引擎,包括分类体系模块、语义分析模块、爬取程序模块、规则库模块、知识库模块、规则解析器模块、自学习程序模块,其中:所述分类体系模块依据HTTP日志标记规则对规则库模块和知识库模块中的数据进行分类,其中所述HTTP日志标记规则定义的基本逻辑结构为:用户行为=行为主体+行为标识+行为状态;所述语义分析模块用于根据分类体系模块中定义好的分类项,识别出待处理文本隶属的分类类别;所述爬取程序模块用于获取用户访问过的、待分类的互联网URL资源数据,并将这些数据保存到知识库模块中;所述规则库模块含有互联网URL资源分类规则数据,用于分词库模块中文本分类之外的识别;所述知识库模块用于存储互联网URL资源的内容对象集合;所述规则解析器模块用于将规则库模块里的模式数据和用户访问的URL进行匹配,提取相应的产品对象、内容对象、用户动作信息;所述自学习程序模块用于当识别出的URL内容对象在知识库模块里没有被检索到时,利用爬取程序模块从网络上将该条URL内容对象相关信息爬取下来,并保存到知识库模块中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京宽连十方数字技术有限公司,未经北京宽连十方数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310072271.3/,转载请声明来源钻瓜专利网。
- 上一篇:旋转式压缩机和用于其的导管
- 下一篇:一种船舶上使用的便捷式可变径管型馈线卡