一种互联网网站相似度分析方法、装置以及可读存储介质

    公开(公告)号:CN113378090B

    公开(公告)日:2022-09-06

    申请号:CN202110445408.X

    申请日:2021-04-23

    Abstract: 本发明公开了一种互联网网站相似度分析方法、装置以及可读存储介质,方法包括:从多个未分类的互联网网站中提取文本特征词;将各个未分类的互联网网站的文本特征词分别输入预先获取到的孪生网络编码工具,得到各个未分类的互联网网站的文本向量序列,其中:所述孪生网络编码工具是从训练好的孪生网络中的输入层至权值共享循环神经网络层进行迁移得到,且所述孪生网络的训练是基于从多个已分类的互联网网站中提取的文本特征词实现;将各个未分类的互联网网站的文本向量序列组成的矩阵进行降维处理得到低维弱相关矩阵;对低维弱相关矩阵进行聚类分析,根据聚类分析结果获取所述多个未分类的互联网网站的相似度情况,从而实现互联网网站相似度分析。

    基于移动轨迹数据的用户识别方法、装置及存储介质

    公开(公告)号:CN113704373A

    公开(公告)日:2021-11-26

    申请号:CN202110955784.3

    申请日:2021-08-19

    Abstract: 本申请提供了一种基于移动轨迹数据的用户识别方法、装置及存储介质,该方法包括:获取任意两条待判别的目标轨迹数据,其中,目标轨迹数据为从目标区域中提取出的路径信息,目标区域为用户访问过的区域;将目标轨迹数据的表征集合输入到目标模型内,判断目标轨迹数据是否来自同一用户,其中,目标模型是由初始判别模型训练得到的,输入初始判别模型的训练参数包括:任意两条初始轨迹数据之间的共现次数、任意两条初始轨迹数据之间的角度余弦值、任意两条初始轨迹数据之间的概率偏差值、任意两条初始轨迹数据之间的相似度数值以及用于指示任意两条初始轨迹数据是否来自同一用户的标注信息。通过本申请,解决了相关技术中存在的用户识别准确率较低,稳定性不高的问题。

    一种突发事件检测方法、装置、设备及存储介质

    公开(公告)号:CN111507110A

    公开(公告)日:2020-08-07

    申请号:CN201910092796.0

    申请日:2019-01-30

    Abstract: 本申请涉及一种突发事件检测方法、装置、设备及存储介质,该方法包括:获取待检测事件的文本数据;提取文本数据中的关键信息,关键信息包括:关键词;根据关键信息生成触发词关系链;在预设的关键词库与触发词关系图的对应关系中,将与关键信息中的关键词对应的触发词关系图确定为目标触发词关系图;计算触发词关系链和目标触发词关系图的匹配度;若匹配度大于预设匹配阈值,则将待检测事件确定为突发事件。该方法可以缓解现有技术中存在的突发事件检测的效率低的问题,达到了提高突发事件检测效率的技术效果。

Patent Agency Ranking