一种网页主题的标注方法和装置

    公开(公告)号:CN104881458B

    公开(公告)日:2019-05-28

    申请号:CN201510266108.X

    申请日:2015-05-22

    Abstract: 本发明公开了一种网页主题的标注方法和装置。所述方法包括:基于网页的标题和正文,获得所述网页的主题特征向量;利用预先训练获得的分类器,对所述主题特征向量进行分类处理;判断是否存在所述主题特征向量所属的类型;若是,则将所述网页标注为所述主题特征向量所属的类型;若否,则将所述网页标记为待标注网页;进一步地,对多个待标注网页进行聚类处理;分析出每个聚类集合的类型;将待标注网页标注为其所属的聚类集合的类型。本发明采用有监督的分类方法和无监督的聚类方法级联的方式,自动的从网页中获取主题并标注网页,有效提高了网页主题标注的效率和准确性。

    一种基于多文件格式自动识别的跨地域关联统计方法

    公开(公告)号:CN107168984A

    公开(公告)日:2017-09-15

    申请号:CN201710165255.7

    申请日:2017-03-20

    CPC classification number: G06F17/30194 G06F17/30424

    Abstract: 本发明涉及一种基于多文件格式自动识别的跨地域关联统计方法,属于大数据检索分析领域。该方法通过统一SQL查询入口接收SQL查询请求;然后对SQL查询请求进行解析,以识别查询的不同文件格式;然后全局节点将解析成功后的查询请求发送到对应的分节点;然后各分节点进行相应的查询操作,并将查询结果回传给全局节点;最后全局节点对各分节点回传的数据进行关联统计并输出统计结果。本发明可以应用在离线或在线数据统计场景中,能够实现多种文件格式的自动识别,突破了地域限制,能够将不同数据中心的数据进行关联统计。

    一种基于MPP引擎的跨数据中心快速查询方法和系统

    公开(公告)号:CN107066546A

    公开(公告)日:2017-08-18

    申请号:CN201710165501.9

    申请日:2017-03-20

    Abstract: 本发明涉及一种基于MPP引擎的跨数据中心快速查询方法和系统,属于大数据检索分析领域,可应用于实时系统或离线备份系统。该方法将不同MPP引擎中的数据进行统一标记并存储到元数据中;全局中心节点接收查询请求并对其进行语法解析,然后分发送到对应的数据分中心节点;各数据分中心节点通过元数据的相应MPP引擎进行查询,并将数据传输给全局中心节点;全局中心节点利用MPP引擎对数据分中心节点返回的数据进行快速查询,并输出查询结果。本发明能够实现不同数据中心数据的联合查询,兼容多种MPP引擎,充分利用不同存储模式的特点优化查询,支持多种方式导出查询结果,便于实现上层不同应用对结果数据再分析的不同要求。

    一种分布式系统中高维流量数据变化点检测方法

    公开(公告)号:CN104050070B

    公开(公告)日:2017-02-22

    申请号:CN201410243426.X

    申请日:2014-03-28

    Abstract: 本发明提供了一种分布式系统中高维流量数据变化点检测方法,该方法包括以下步骤:获取所述分布式系统中标准化的高维原始流量数据;高维原始流量数据降维;主成分表征的有序样本数据聚类,确定主成分数据的非平凡点;判定原始各维流量数据在对应的非平凡点处是否发生显著变化。该方法用于检测分布式系统中高维流量数据的变化点,进一步用于帮助管理人员更好的对分布式系统中的流量数据进行监测、分析。

    一种APK应用软件行为的分析方法及装置

    公开(公告)号:CN105160251A

    公开(公告)日:2015-12-16

    申请号:CN201510390821.5

    申请日:2015-07-06

    CPC classification number: G06F21/563 G06F2221/033

    Abstract: 本发明公开了一种APK应用软件行为的分析方法及装置,其中,该方法包括:接收用户上传的APK文件及体验数据,其中,体验数据为用户在APK文件对应的应用软件下的基础用户信息;使用体验数据在沙盒中动态运行对APK文件,并记录运行过程中APK文件的动态行为,以构建动态行为集;对APK文件进行静态分析,以构建静态行为集;根据动态行为集和静态行为集对APK文件进行综合分析,以确认APK文件的安全性能。通过运用本发明,解决了现有技术中的软件安全管理,都是在软件运行过程中进行监测,一旦发现问题对其进行记录及阻止,由于现有应用软件的复杂多样,目前的监测方式无法完全阻止非法应用软件窃取用户隐私及乱扣费等操作,用户体验较低的问题。

    基于社交应用信息传播模式的评估方法及系统

    公开(公告)号:CN104408659A

    公开(公告)日:2015-03-11

    申请号:CN201410592639.3

    申请日:2014-10-29

    CPC classification number: G06Q50/01 G06Q10/0635

    Abstract: 本发明公开了一种基于社交应用信息传播模式的评估方法及系统。该方法包括:对社交应用的信息传播过程进行分析和抽象,建立社交应用信息传播模式;基于社交应用信息传播模式,按照层次关系将社交应用信息传播风险分解为各项因素,并根据各项因素间的相互关系将各项因素按照层次关系进行聚集组合,生成虚假信息传播风险评估模型;其中,虚假信息传播风险评估模型的层次关系具体包括:系统层、实体层、以及风险点层;以虚假信息传播风险评估模型的风险点层中的风险点为基础原始数据,对该社交应用面临的虚假信息传播威胁进行评估。

Patent Agency Ranking