一种网页主题的标注方法和装置

    公开(公告)号:CN104881458B

    公开(公告)日:2019-05-28

    申请号:CN201510266108.X

    申请日:2015-05-22

    Abstract: 本发明公开了一种网页主题的标注方法和装置。所述方法包括:基于网页的标题和正文,获得所述网页的主题特征向量;利用预先训练获得的分类器,对所述主题特征向量进行分类处理;判断是否存在所述主题特征向量所属的类型;若是,则将所述网页标注为所述主题特征向量所属的类型;若否,则将所述网页标记为待标注网页;进一步地,对多个待标注网页进行聚类处理;分析出每个聚类集合的类型;将待标注网页标注为其所属的聚类集合的类型。本发明采用有监督的分类方法和无监督的聚类方法级联的方式,自动的从网页中获取主题并标注网页,有效提高了网页主题标注的效率和准确性。

    一种APK应用软件行为的分析方法及装置

    公开(公告)号:CN105160251A

    公开(公告)日:2015-12-16

    申请号:CN201510390821.5

    申请日:2015-07-06

    CPC classification number: G06F21/563 G06F2221/033

    Abstract: 本发明公开了一种APK应用软件行为的分析方法及装置,其中,该方法包括:接收用户上传的APK文件及体验数据,其中,体验数据为用户在APK文件对应的应用软件下的基础用户信息;使用体验数据在沙盒中动态运行对APK文件,并记录运行过程中APK文件的动态行为,以构建动态行为集;对APK文件进行静态分析,以构建静态行为集;根据动态行为集和静态行为集对APK文件进行综合分析,以确认APK文件的安全性能。通过运用本发明,解决了现有技术中的软件安全管理,都是在软件运行过程中进行监测,一旦发现问题对其进行记录及阻止,由于现有应用软件的复杂多样,目前的监测方式无法完全阻止非法应用软件窃取用户隐私及乱扣费等操作,用户体验较低的问题。

    一种多出口环境下异常flow日志的识别和纠正方法及系统

    公开(公告)号:CN118573598B

    公开(公告)日:2024-11-15

    申请号:CN202411029828.X

    申请日:2024-07-30

    Abstract: 本申请公开了一种多出口环境下异常flow日志的识别和纠正方法及系统,涉及数据处理技术,包括:获取以指定字段的形式记录的待识别flow日志;查询具有相同五元组的flow日志的数量;在查询的数量大于第一预设阈值的情况下,对查询到的flow日志计算时间分布间隔的标准差和均值,并确定偏差范围;在所确定的偏范围小于预设偏差阈值的情况下,根据时间戳对查询到的flow日志进行排序,确定是否存在时间间隔大于时间阈值的分割点;若不存在时间间隔大于时间阈值的分割点,删除异常flow日志,将flow日志进行纠正处理。本申请的方法用以对分布式设备生成后的flow日志进行检查识别和纠正,生成准确的flow日志。

    一种前缀掩码的五元组关键字匹配方法及装置

    公开(公告)号:CN118427408B

    公开(公告)日:2024-11-15

    申请号:CN202410890093.3

    申请日:2024-07-04

    Abstract: 本发明涉及网络数据处理领域,尤其涉及一种前缀掩码的五元组关键字匹配方法及装置,方法包括:加载作为匹配规则的五元组以及五元组对应的掩码信息;对掩码信息进行预处理,得到目标五元组;基于目标五元组,构建至少一个字典树;通过对至少一个字典树对应的数据包进行解析,生成目标五元组信息;基于目标五元组信息,对待匹配的关键字进行查询,生成匹配结果。应用本方法,通过对掩码信息进行预处理,可有效节省字典树的存储空间;基于目标五元组构建至少一个字典树中,实现了字典树的掩码匹配功能,提高了匹配效率;在命中数组的方式中保留匹配标记,最终实现对匹配结果的批量返回,有利于提高匹配效率与掩码匹配的灵活性。

Patent Agency Ranking