一种基于用户画像的构建方法、装置及存储介质

    公开(公告)号:CN109815386B

    公开(公告)日:2022-04-29

    申请号:CN201811577206.5

    申请日:2018-12-21

    Abstract: 本发明提供了一种基于用户画像的构建方法、装置及存储介质,该方法包括:登记用户的个人信息数据,记录用户的网页浏览记录和收藏的网页记录,对所述用户的搜索网页记录和收藏的网页记录进行处理得到初始兴趣标签,以所述初始兴趣标签为起点关联用户的网页浏览记录,以生成最终兴趣标签,基于用户的所述最终兴趣标签和个人信息数据为该用户构建用户画像。本发明从用户在浏览器的使用记录信息生成初始兴趣标签,然后,通过改进PageRank算法生成所有用户的最终兴趣标签,减少用户无意识浏览对用户兴趣标签的影响,减少广告网页对用户最终兴趣标签产生的不利影响,以及对未知兴趣标签属性的挖掘,使用户兴趣标签更加准确,使得构建的用户画像信息更为准确。

    一种在分布式环境下动态调度IP代理池的方法、装置及存储介质

    公开(公告)号:CN109743411B

    公开(公告)日:2022-03-01

    申请号:CN201811509275.2

    申请日:2018-12-10

    Abstract: 本发明提供了一种在分布式环境下动态调度IP代理池的方法、装置及存储介质。该方法包括:构建步骤,扫描代理IP资源,为扫描获得的代理IP初始化状态标识后构建IP代理池;检测步骤,对初始代IP理池中的代理IP进行检测,并根据检测结果更新代理IP的状态标识;调度步骤,获取IP代理池中M个代理IP生成代理IP队列以供下载中心请求使用。本发明确保代理池中的可用IP代理保持在一定数量之上,并根据加锁机制和缓存机制,实现单个代理IP在面对多线程调度的情况下可以做到时间维度上的有序响应,防止单个代理IP高频率访问,通过IP代理池、有效性检测及调度的协同,使分布式数据采集系统在保证采集效率的同时,又可以避免因高频率访问导致访问失败。

    一种视频处理方法及终端
    54.
    发明授权

    公开(公告)号:CN111163366B

    公开(公告)日:2022-01-18

    申请号:CN201911392176.5

    申请日:2019-12-30

    Abstract: 本发明公开了一种视频处理方法及终端,预设关键信息,自动爬取符合关键信息的待分类视频;分析待分类视频的语音信息的语音情感特征并得到其情感特征类别,根据情感特征类别得到待分类视频的第一视频类别;分析待分类视频的每一帧图片信息的归属类别以得到待分类视频的第二视频类别;根据待分类视频的第一视频类别和第二视频类别以得到待分类视频的分类结果;本发明通过预设关键信息以获取到视频信息,根据视频信息的语音信息来进行自动提取及分析出语音情感特征,以得到待分类视频在情感特征上的视频类别,通过分析每一帧图片信息的归属类别,以得到待分类视频的归属类别,从而得到更为合理有效的视频分类结果。

    一种国际事件风险推演方法及终端

    公开(公告)号:CN111310116A

    公开(公告)日:2020-06-19

    申请号:CN201911401996.6

    申请日:2019-12-30

    Abstract: 本发明公开了一种国际事件风险推演方法及终端,建立风险推演指标体系,并运用改进的层次分析法,得到风险推演指标体系的各项权重;根据专家对各个国际事件进行量化,代入风险推演指标体系得到各个国际事件所造成的国际事件风险等级,使用影响因子IN进行反模糊化,以得出每个国际事件所造成的具体风险指数;本发明结合模糊综合评判的方法,得到一个风险推演指标体系,根据专家所发生的重大国际事件的互联网公开信息的具体量化,代入到对风险推演指标体系以得到风险推演结果,通过引入影响因子,以得到更为具体的风险指数,从而对当前重大国际事件造成的风险进行更加准确具体的分析推演。

    基于关键词的自动化测试方法及计算机可读存储介质

    公开(公告)号:CN111209185A

    公开(公告)日:2020-05-29

    申请号:CN201911337307.X

    申请日:2019-12-23

    Abstract: 本发明公开了一种基于关键词的自动化测试方法及计算机可读存储介质,方法包括:根据预设的业务场景对应的关键词和断言值,生成业务场景的测试用例;根据业务模块的业务流程所包含的各业务场景的测试用例,组合得到所述业务模块的测试脚本;获取业务模块对应的测试脚本,并依序获取所述测试脚本中的一测试用例;根据预设的正则表达式,对所述与一测试用例进行解析,得到关键词参数和断言值;根据所述关键词参数,进行一测试用例对应的业务操作,并获取操作响应值;将所述操作响应值和所述断言值进行比较,得到所述一测试用例的测试结果。本发明可降低自动化测试脚本的编写难度,提高开发效率。

    一种在分布式环境下动态调度IP代理池的方法、装置及存储介质

    公开(公告)号:CN109743411A

    公开(公告)日:2019-05-10

    申请号:CN201811509275.2

    申请日:2018-12-10

    Abstract: 本发明提供了一种在分布式环境下动态调度IP代理池的方法、装置及存储介质。该方法包括:构建步骤,扫描代理IP资源,为扫描获得的代理IP初始化状态标识后构建IP代理池;检测步骤,对初始代IP理池中的代理IP进行检测,并根据检测结果更新代理IP的状态标识;调度步骤,获取IP代理池中M个代理IP生成代理IP队列以供下载中心请求使用。本发明确保代理池中的可用IP代理保持在一定数量之上,并根据加锁机制和缓存机制,实现单个代理IP在面对多线程调度的情况下可以做到时间维度上的有序响应,防止单个代理IP高频率访问,通过IP代理池、有效性检测及调度的协同,使分布式数据采集系统在保证采集效率的同时,又可以避免因高频率访问导致访问失败。

    一种网页要素的自动提取方法、系统及计算机存储介质

    公开(公告)号:CN109657117A

    公开(公告)日:2019-04-19

    申请号:CN201811341252.5

    申请日:2018-11-12

    Abstract: 本发明提供一种网页要素的自动提取方法、系统及计算机存储介质,该方法包括:基于浏览器插件提取所述网页的URL,获取爬虫采集规则库和网站版块集合;判断所述网站版块集合在爬虫采集规则库中是否存在提取规则,如果所述爬虫采集规则库中存在所述网站版块集合的提取规则,则提取所述网页的要素;判断所述网页的要素是否提取成功,如果所述网页的要素提取成功则将提取的内容填充到对应的文本区域。根据本发明的方法、系统及计算机存储介质,可以增加提取网页要素以及截图的准确性、灵活性、易用性,为信息编辑人员查阅收集网页信息提供很好的技术支持。

    舆情事件数据发现的方法、终端设备及存储介质

    公开(公告)号:CN108009229A

    公开(公告)日:2018-05-08

    申请号:CN201711224272.X

    申请日:2017-11-29

    Abstract: 本发明公开一种基于RDF知识库的舆情事件数据发现的方法,包括如下步骤,S1:根据描述舆情事件的要素,构建至少包括人物、地点和组织的多个实体(即要素)的多维度的RDF实体库,进入S2步骤;S2:依据RDF实体库,从各个维度对需要进行舆情事件数据发现的网络文本数据,使用隐马尔科夫模型对网络文本数据中命中的实体进行判断,获得包含有该网络文本数据在各个维度中命中的实体及其相关信息的结构化的文本数据,进入S3步骤;S3:根据用户输入的舆情事件条件,对S2中获得的结构化的文本数据进行舆情事件条件匹配,并将匹配到的结构化的文本数据,作为相关的舆情事件数据,进入S4步骤;S4:将相关的舆情事件数据返回给用户。

Patent Agency Ranking