-
公开(公告)号:CN106844403B
公开(公告)日:2020-04-14
申请号:CN201510892230.8
申请日:2015-12-07
申请人: 北京国双科技有限公司
IPC分类号: G06F16/35 , G06F16/28 , G06F16/951
摘要: 本发明实施例公开了一种信息处理方法和装置,其中,方法包括:基于预先设置的爬取规则,从互联网爬取指定产品的用户评述信息;根据预先获得的信息判断模型,分别针对爬取到的各用户评述信息,获取用户评述信息对应的评价等级并对用户评论信息标注获取到的评价等级;在信息系统中存储所述指定产品及其标注评价等级的用户评价信息。本发明实施例可以使用户可以全面了解汽车的评价信息。
-
公开(公告)号:CN104484357B
公开(公告)日:2018-05-15
申请号:CN201410719753.8
申请日:2014-12-01
申请人: 北京国双科技有限公司
IPC分类号: G06F17/30
摘要: 本发明公开了一种数据处理方法及装置和访问频次信息处理方法及装置。其中,数据处理方法包括:在检测到用户访问行为的情况下,获取用户访问行为对应的用户信息,并记录用户访问行为的访问时间;基于用户信息查询用户访问行为的上一次访问行为;判断用户访问行为与上一次访问行为是否在同一个会话中;如果判断出用户访问行为与上一次访问行为不在同一个会话中,则从上一次访问行为的记录中查询上一次访问行为的访问时间;以及计算用户访问行为的访问时间与上一次访问行为的访问时间的间隔时间。通过本发明,解决了无法准确地得到用户访问网站的间隔时间的问题,达到了提高用户访问网站的间隔时间计算的准确性的效果。
-
公开(公告)号:CN104199939B
公开(公告)日:2018-02-02
申请号:CN201410455958.X
申请日:2014-09-09
申请人: 北京国双科技有限公司
IPC分类号: G06F17/30
摘要: 本发明公开了一种网页热力图生成方法及装置。该网页热力图生成方法包括:检测网页上多个网页区域的网页点击量;获取预设的参考网页点击量;分别将多个网页区域的网页点击量与参考网页点击量进行比较;获取基准区域,其中,基准区域为多个网页区域中网页点击量大于参考网页点击量的区域;确定基准区域的单位点击量的着色色差;基于确定的单位点击量的着色色差对基准区域进行着色处理,获得网页热力图。通过本发明,实现了增大网页热力图不同点击量的网页区域间颜色的对比度,从而达到了增强用户的视觉体验度的效果。
-
公开(公告)号:CN106844326A
公开(公告)日:2017-06-13
申请号:CN201510886318.9
申请日:2015-12-04
申请人: 北京国双科技有限公司
IPC分类号: G06F17/27
CPC分类号: G06F17/277
摘要: 本发明公开了一种获取词语的方法及装置,涉及计算机技术领域,主要目的在于通过词语标注领域信息来提高语料词语间整体与部分关系的提取准确率。本发明主要的技术方案为:对获取的文本数据进行预处理,得到带有分词信息的独立语句;在所述独立语句中,利用结构模板筛选出具有并列结构的候选语句;利用领域词典以及所述候选语句中的分词信息,确定所述候选语句中具有并列结构的领域分词,所述领域词典是记录有相同领域分词的词典;根据所述领域分词的位置特征,输出具有整体与部分关系的领域分词集合。本发明主要用于获取文本中整体与部分关系的词语。
-
公开(公告)号:CN106776653A
公开(公告)日:2017-05-31
申请号:CN201510828979.6
申请日:2015-11-24
申请人: 北京国双科技有限公司
摘要: 本发明公开了一种数据挖掘方法及装置,涉及数据处理技术领域,解决了现有的数据挖掘准确率低的问题。本发明的主要技术方案为:提取行业特征信息,所述行业特征信息是从所述待挖掘数据中提取的多个词语;将所述行业特征信息和预置行业知识库中各个行业的行业信息分别进行匹配,所述预置行业知识库中保存有与各个行业分别对应的行业信息;获取与所述行业特征信息匹配度最高的行业;根据所述获取的行业,对所述待挖掘数据进行数据挖掘。本发明主要用于挖掘数据。
-
公开(公告)号:CN106682044B
公开(公告)日:2021-01-15
申请号:CN201510767682.3
申请日:2015-11-11
申请人: 北京国双科技有限公司
IPC分类号: G06F16/9535
摘要: 本发明公开了一种数据处理的方法及装置,涉及互联网技术领域,主要目的在于减少筛选数据的占用时间及提高筛选数据的准确性。本发明的主要技术方案包括:从待处理数据中提取目标数据;其中,所述目标数据包含数据属性值;将所述目标数据缓存于预设收藏夹内;响应于筛选数据指令,根据所述数据属性值对所述预设收藏夹内的目标数据进行筛选,以得到筛选后的目标数据;对所述筛选后的目标数据进行展示。本发明主要应用于数据筛选的过程中。
-
公开(公告)号:CN104166741B
公开(公告)日:2018-09-18
申请号:CN201410459079.4
申请日:2014-09-10
申请人: 北京国双科技有限公司
IPC分类号: G06F17/30
摘要: 本发明公开了一种网页浏览分析处理方法及装置。该网页浏览分析处理方法包括:确定目标网页上的滚动轴,其中,目标网页为当前被浏览的网页;检测滚动轴在目标网页上的第一位置,其中,第一位置为滚动轴在目标网页上的初始位置;检测滚动轴在目标网页上的第二位置,其中,第二位置为滚动轴发生滚动后滚动轴在目标网页上的位置;确定目标网页的浏览区域,其中,浏览区域为滚动轴在目标网页上的第一位置时目标网页的显示区域;计算浏览区域的浏览时间。通过本发明,达到了提高用户网页浏览行为分析结果准确性的效果。
-
公开(公告)号:CN106855852A
公开(公告)日:2017-06-16
申请号:CN201510906638.6
申请日:2015-12-09
申请人: 北京国双科技有限公司
IPC分类号: G06F17/27
摘要: 本申请公开了一种语句情感的确定方法及装置。该方法包括:获取目标语料;从目标语料中筛选关键词为情感词的语句,得到多个目标语句,其中,关键词为在目标语料包含的语句中预设位置上的词语;分别计算多个目标语句中每个目标语句的关键词的置信度,得到每个关键词的置信度,其中,每个关键词的置信度为每个关键词对判断每个目标语句的语句情感的置信度;以及分别根据每个关键词的置信度确定多个目标语句中每个目标语句的语句情感。通过本申请,解决了相关技术中判断语句情感的准确率较低的问题。
-
公开(公告)号:CN106776652A
公开(公告)日:2017-05-31
申请号:CN201510828945.7
申请日:2015-11-24
申请人: 北京国双科技有限公司
IPC分类号: G06F17/30
摘要: 本发明公开了一种数据处理方法及装置,涉及数据处理技术领域,解决了数据聚类的准确率低的问题。本发明的主要技术方案为:获取目标网站的栏目框架,所述栏目框架中至少包括一个栏目层级;获取所述栏目框架中各个栏目层级的标题名称;根据所述栏目层级的标题名称,确定所述栏目层级在预置栏目体系中对应的栏目标签;其中,所述预置栏目体系中保存有多个所述栏目标签,和所述栏目标签分别对应的栏目内容;将同一栏目层级下的栏目内容,聚类到所述预置栏目体系对应的栏目标签中。本发明主要用于聚类数据。
-
公开(公告)号:CN106713952A
公开(公告)日:2017-05-24
申请号:CN201510784669.9
申请日:2015-11-16
申请人: 北京国双科技有限公司
IPC分类号: H04N21/258 , H04N21/466
摘要: 本申请公开了一种视频处理方法及装置。该方法包括:通过爬虫技术爬取视频点播量,其中,视频点播量为在预设时间段内在目标网址上对目标视频进行播放的次数;绘制预设时间段内的视频点播量的点播趋势图,其中,点播趋势图中包含:针对目标视频所对应的视频类型、用户群体类型;利用点播趋势图,分别确定目标视频在视频类型和用户群体类型中的点播量趋势分布;以及根据点播量趋势分布,对目标视频进行推广。通过本申请,解决了相关技术中对视频推广的精准度较低的问题。
-
-
-
-
-
-
-
-
-