一种信息提取方法和装置
    11.
    发明公开

    公开(公告)号:CN107340954A

    公开(公告)日:2017-11-10

    申请号:CN201710532768.7

    申请日:2017-07-03

    CPC classification number: G06F3/0484 G06K9/2054 G06K2209/01

    Abstract: 本发明公开了一种信息提取方法和装置,该方法包括:按照预定遍历算法获取预定应用软件APP自动运行过程中所有界面的屏幕快照,并按照预设命名规则为得到的每个屏幕快照确定名称;对获取到的所有屏幕快照进行文字识别,以得到每个屏幕快照对应的文字内容;按照每个屏幕快照的名称将各个屏幕快照对应的文字内容进行拼接,并将拼接后的文档进行保存,以还原预定APP的完整文字内容。本发明的信息提取方法自动获得准确的文字内容,并且适用于多种操作系统的多种APP,解决了现有技术的如下问题:现有信息提取方法无法实现针对多种不同操作系统、不同应用程序的信息提取,而且提取的信息在可读性方面也具有较大的不确定性。

    一种中文微博主客观句分类方法

    公开(公告)号:CN106055633A

    公开(公告)日:2016-10-26

    申请号:CN201610367978.0

    申请日:2016-05-30

    CPC classification number: G06F16/35 G06K9/6256 G06K9/6269

    Abstract: 本发明提出了一种中文微博主客观句分类方法,所述方法包括:根据预设的主观句训练语料集和客观句训练语料集形成如下的六个特征集:3‑POS主观模式特征集、句法依存关系特征集、情感词特征集、情感影响因子特征集、语气词及标点符号特征集、字数及链接特征集;根据所述六个特征集,利用支持向量机SVM算法,形成中文微博主客观句分类模型,以利用所述中文微博主客观句分类模型对待测试语句进行主客观句分类。所述方法不但考虑了中文文本的语言学特点,同时也充分利用微博的个性化特征,使得本文所选取的特征更加接近微博本身的语义描述。

    一种URL链接有效性的验证方法

    公开(公告)号:CN105975526A

    公开(公告)日:2016-09-28

    申请号:CN201610280958.X

    申请日:2016-04-29

    CPC classification number: G06F16/9566

    Abstract: 本发明公开了一种URL链接有效性的验证方法。该方法包括:向待验证的URL链接发送网络请求,根据网络请求状态返回码判定网络请求是否访问成功;当访问失败时,直接判定URL链接失效;当访问成功时,调用浏览器,模拟用户访问过程,并根据浏览器的渲染结果判定URL链接是否有效。本发明将待验证的URL链接通过网络请求返回状态码对URL进行粗过滤,然后在根据浏览器的渲染结果对URL链接进行更为准确的判断。通过将两者相结合的方式,可提升整个验证过程的验证效率、减小系统开销,同时保证了验证结果的准确性。

    一种针对大模型内容安全能力的评测方法及系统

    公开(公告)号:CN118035711A

    公开(公告)日:2024-05-14

    申请号:CN202410431137.6

    申请日:2024-04-11

    Abstract: 本发明公开了一种针对大模型内容安全能力的评测方法及系统,属于网络空间安全技术领域。所述评测方法包括步骤1,构建多模态、多领域和多题型的评测集;步骤2,构建内容安全评测模型;步骤3,将评测集的问题输入至被测大模型,输出对应的大模型回答;将问题和对应大模型回答整理成问答集,将所述问答集输入至所述内容安全评测模型,根据内容安全评测模型的输出对所述大模型进行综合打分,获得针对大模型内容安全能力的评测结果。该方法可以量化评价大模型跨模态内容安全防护性能,为监管部门、第三方评测机构、大模型研发机构提供参考数据。

Patent Agency Ranking