-
公开(公告)号:CN111126050B
公开(公告)日:2023-05-05
申请号:CN201911358328.X
申请日:2019-12-25
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06F40/258 , G06F40/289 , G06F16/951 , G06V20/62 , G06V30/14 , G06V30/18
Abstract: 本申请提供一种网站标题提取方法,包括:获取目标网站对应的html内容;提取html内容中的title标签;确定标签权重以及html内容中文本文字、图片和视频分别对应的第一权重、第二权重和第三权重;确定标签权重、第一权重、第二权重和第三权重中的权重最大值;将权重最大值对应的内容提取到的标题作为网站标题。本申请能够提高网站标题的准确性,解决了直接根据html内容得到的title标签不准确的问题,能够避免网站站点名错误和乱码。本申请还提供一种网站标题提取系统、计算机可读存储介质和电子设备,具有上述有益效果。
-
公开(公告)号:CN111126050A
公开(公告)日:2020-05-08
申请号:CN201911358328.X
申请日:2019-12-25
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06F40/258 , G06F40/289 , G06F16/951 , G06K9/20 , G06K9/46
Abstract: 本申请提供一种网站标题提取方法,包括:获取目标网站对应的html内容;提取html内容中的title标签;确定标签权重以及html内容中文本文字、图片和视频分别对应的第一权重、第二权重和第三权重;确定标签权重、第一权重、第二权重和第三权重中的权重最大值;将权重最大值对应的内容提取到的标题作为网站标题。本申请能够提高网站标题的准确性,解决了直接根据html内容得到的title标签不准确的问题,能够避免网站站点名错误和乱码。本申请还提供一种网站标题提取系统、计算机可读存储介质和电子设备,具有上述有益效果。
-
公开(公告)号:CN109408620A
公开(公告)日:2019-03-01
申请号:CN201811183268.8
申请日:2018-10-11
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06F16/332 , G06F16/951 , G16H50/80
Abstract: 本发明公开了一种网络舆论趋势预测的方法、装置、设备以及计算机可读存储介质,包括:采集预设时间段内预选监管项目的舆情数据,在时间轴上计算所述舆情数据的增长率;将所述增长率输入至预先建立的预测模型中,得到所述预选监管项目对应的分值;根据所述分值查找所述预选监管项目网络舆论的当前发展阶段以及未来发展趋势。利用本发明所提供的方法、装置、设备以及计算机可读存储介质,可以预估预选监管项目当前所处发展阶段,并对所述预选监管项目未来大发展趋势进行了预测,有利于相关人员对所述预选监管项目进行监控。
-
-