基于表示学习的相似移动应用计算方法及装置

    公开(公告)号:CN110879861A

    公开(公告)日:2020-03-13

    申请号:CN201910834941.8

    申请日:2019-09-05

    Abstract: 本发明公开了一种基于表示学习的相似移动应用计算方法,所述方法包括:读取移动应用相关的文档、网页以及图数据库中的三元组,获取与文档、网页以及图数据库中与所述移动应用相关的实体,构建表示学习算法-网络嵌入模型LINE网络;基于LINE负采样技术优化Skip-gram模型,通过所述Skip-gram模型训练所述LINE网络,得到每个实体以及移动应用自身的向量表示;根据每个实体以及移动应用自身的向量表示,对移动应用进行相似度计算。

    一种事件类型识别方法及装置

    公开(公告)号:CN106095928B

    公开(公告)日:2019-10-29

    申请号:CN201610409465.1

    申请日:2016-06-12

    Abstract: 本发明公开了一种事件类型识别方法及装置。该方法包括以下步骤:对训练集中所有文本进行分词、提取词性处理后训练词向量空间模型,提取文本的特征,将文本表示为特征向量;对于训练集进行事件类型聚类,训练带有类型聚类正则化项的神经网络模型;对于测试样本同样进行分析、提取词性处理,并利用已经训练好的词向量模型,得到特征表示;利用类型聚类正则化项的神经网络模型进行事件类别识别。借助于本发明的技术方案,能够利用同一群组中的类型共享信息来减轻标注数据不平衡带来的问题。

    一种信息提取方法和装置
    18.
    发明公开

    公开(公告)号:CN107340954A

    公开(公告)日:2017-11-10

    申请号:CN201710532768.7

    申请日:2017-07-03

    CPC classification number: G06F3/0484 G06K9/2054 G06K2209/01

    Abstract: 本发明公开了一种信息提取方法和装置,该方法包括:按照预定遍历算法获取预定应用软件APP自动运行过程中所有界面的屏幕快照,并按照预设命名规则为得到的每个屏幕快照确定名称;对获取到的所有屏幕快照进行文字识别,以得到每个屏幕快照对应的文字内容;按照每个屏幕快照的名称将各个屏幕快照对应的文字内容进行拼接,并将拼接后的文档进行保存,以还原预定APP的完整文字内容。本发明的信息提取方法自动获得准确的文字内容,并且适用于多种操作系统的多种APP,解决了现有技术的如下问题:现有信息提取方法无法实现针对多种不同操作系统、不同应用程序的信息提取,而且提取的信息在可读性方面也具有较大的不确定性。

    一种URL链接有效性的验证方法

    公开(公告)号:CN105975526A

    公开(公告)日:2016-09-28

    申请号:CN201610280958.X

    申请日:2016-04-29

    CPC classification number: G06F16/9566

    Abstract: 本发明公开了一种URL链接有效性的验证方法。该方法包括:向待验证的URL链接发送网络请求,根据网络请求状态返回码判定网络请求是否访问成功;当访问失败时,直接判定URL链接失效;当访问成功时,调用浏览器,模拟用户访问过程,并根据浏览器的渲染结果判定URL链接是否有效。本发明将待验证的URL链接通过网络请求返回状态码对URL进行粗过滤,然后在根据浏览器的渲染结果对URL链接进行更为准确的判断。通过将两者相结合的方式,可提升整个验证过程的验证效率、减小系统开销,同时保证了验证结果的准确性。

Patent Agency Ranking