-
公开(公告)号:CN108737203B
公开(公告)日:2020-07-17
申请号:CN201710239754.6
申请日:2017-04-13
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团公司
IPC: H04L12/26 , G06F11/30 , G06F16/955
Abstract: 本申请实施例中公开了一种集合提取的方法及装置,该方法为分别提取每一个应用程序与网络侧交互的信息中包含的Host字段;分别设置每一个获取的Host字段与对应的应用程序之间的关联关系;基于关联关系,按照预设的规则,分别针对每一个应用程序对应的各个Host字段进行筛选处理;基于各个应用程序对应的筛选处理后的各个Host字段,分别建立每一个应用程序对应的匹配集合,其中,一个应用程序对应的匹配集合中包含一个应用程序对应的各个Host字段。这样,可以去除大量冗余以及错误的Host字段,从而节省了匹配集合占用的存储资源,以及提高了应用程序与对应的匹配集合中包含的各个Host字段匹配的精准度。
-
公开(公告)号:CN108153754B
公开(公告)日:2021-09-14
申请号:CN201611101349.X
申请日:2016-12-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团公司
IPC: G06F16/31
Abstract: 本发明实施例公开了一种数据处理方法,所述方法包括:获取基准标签树和待融合标签树;从所述待融合标签树中选取出待融合标签,从所述基准标签树中选取出与所述待融合标签对应的基准标签;获取所述待融合标签的标签特征,和与所述待融合标签具有关联关系的至少一个上一级标签的标签特征;以及,获取所述基准标签的标签特征,和与所述基准标签具有关联关系的至少一个上一级标签的标签特征;基于标签特征,将所述待融合标签与所述基准标签进行匹配,并至少基于匹配结果确定出所述待融合标签插入到所述基准标签树中的合并位置,以便于将所述待融合标签树与所述基准标签树进行合并处理。本发明实施例还公开了一种数据处理装置。
-
公开(公告)号:CN107958008B
公开(公告)日:2020-10-27
申请号:CN201610906668.1
申请日:2016-10-18
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团公司
IPC: G06F16/958
Abstract: 本发明公开了一种统一标签库的更新方法及装置,通过确定获取的统一标签库外部的外部内容标签以及各外部内容标签之间的隶属关系;分别确定除叶子节点之外的各外部内容标签与统一标签库中相对应层级的每个统一内容标签的相似度;根据除叶子节点之外的各外部内容标签是否存在相似度最高的靶位标签,将外部内容标签及子内容标签融合或加入至统一标签库中相对应层级中,实现了自动匹配与融合,省去了人工合并过程中对内容标签相似度判断标准不一致及人工合并时花费的大量时间成本;同时能够在最大程度上丰富用户访问互联网内容的行为轨迹和兴趣点,基于这些轨迹和兴趣点,便于开展用户访问互联网内容的偏好分析、精准营销和广告推荐等个性化营销。
-
公开(公告)号:CN107958008A
公开(公告)日:2018-04-24
申请号:CN201610906668.1
申请日:2016-10-18
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种统一标签库的更新方法及装置,通过确定获取的统一标签库外部的外部内容标签以及各外部内容标签之间的隶属关系;分别确定除叶子节点之外的各外部内容标签与统一标签库中相对应层级的每个统一内容标签的相似度;根据除叶子节点之外的各外部内容标签是否存在相似度最高的靶位标签,将外部内容标签及子内容标签融合或加入至统一标签库中相对应层级中,实现了自动匹配与融合,省去了人工合并过程中对内容标签相似度判断标准不一致及人工合并时花费的大量时间成本;同时能够在最大程度上丰富用户访问互联网内容的行为轨迹和兴趣点,基于这些轨迹和兴趣点,便于开展用户访问互联网内容的偏好分析、精准营销和广告推荐等个性化营销。
-
公开(公告)号:CN108737203A
公开(公告)日:2018-11-02
申请号:CN201710239754.6
申请日:2017-04-13
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团公司
Abstract: 本申请实施例中公开了一种集合提取的方法及装置,该方法为分别提取每一个应用程序与网络侧交互的信息中包含的Host字段;分别设置每一个获取的Host字段与对应的应用程序之间的关联关系;基于关联关系,按照预设的规则,分别针对每一个应用程序对应的各个Host字段进行筛选处理;基于各个应用程序对应的筛选处理后的各个Host字段,分别建立每一个应用程序对应的匹配集合,其中,一个应用程序对应的匹配集合中包含一个应用程序对应的各个Host字段。这样,可以去除大量冗余以及错误的Host字段,从而节省了匹配集合占用的存储资源,以及提高了应用程序与对应的匹配集合中包含的各个Host字段匹配的精准度。
-
公开(公告)号:CN108153754A
公开(公告)日:2018-06-12
申请号:CN201611101349.X
申请日:2016-12-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明实施例公开了一种数据处理方法,所述方法包括:获取基准标签树和待融合标签树;从所述待融合标签树中选取出待融合标签,从所述基准标签树中选取出与所述待融合标签对应的基准标签;获取所述待融合标签的标签特征,和与所述待融合标签具有关联关系的至少一个上一级标签的标签特征;以及,获取所述基准标签的标签特征,和与所述基准标签具有关联关系的至少一个上一级标签的标签特征;基于标签特征,将所述待融合标签与所述基准标签进行匹配,并至少基于匹配结果确定出所述待融合标签插入到所述基准标签树中的合并位置,以便于将所述待融合标签树与所述基准标签树进行合并处理。本发明实施例还公开了一种数据处理装置。
-
公开(公告)号:CN109995605B
公开(公告)日:2021-04-13
申请号:CN201810000615.2
申请日:2018-01-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Inventor: 熊龙
IPC: H04L12/26
Abstract: 本发明公开了一种流量识别方法,包括:获取电子设备被使用时所产生的待识别流量数据包;对所述待识别流量数据包进行特征提取,获得第一内容特征;将所述第一内容特征与预先构建的特征数据库中各App的第二内容特征进行匹配,确定所述待识别流量数据包关联的至少一个App;所述第二内容特征为从App的有效流量样本中提取的内容特征,所述有效流量样本包括App调用本地数据库所产生的流量数据包;根据所述特征数据库中所述至少一个App的第二行为特征,从所述至少一个App中确定所述待识别流量数据包所属的App;所述第二行为特征表征App对第三方数据库的调用行为特征。本发明同时还公开了一种流量识别装置以及计算机可读存储介质。
-
公开(公告)号:CN109995601B
公开(公告)日:2020-12-01
申请号:CN201711483710.4
申请日:2017-12-29
Applicant: 中国移动通信集团上海有限公司 , 中国移动通信有限公司研究院
Abstract: 本发明实施例公开了一种网络流量识别方法及装置,方法包括:根据具有卷积神经网络特征的区域R‑CNN模型对运行在纯净模拟器环境中的应用程序的界面进行对象识别,得到应用程序的动态操作行为信息;根据当前的操作行为类型和动态操作行为信息,对应用程序的操作行为进行分类触发,监听分类触发后的流量,并对分类触发后的流量进行流量标定,得到样本流量;将样本流量输入字符级循环神经网络char‑RNN模型进行训练,得到目标模型,根据目标模型对网络流量进行识别。弥补了代码静态分析获取操作行为的不足;根据操作行为类型有针对性地触发并监听流量,省时省力;通过目标模型来识别网络管道中的混杂用户流量,以挖掘用户所使用的应用程序中的操作行为信息。
-
公开(公告)号:CN109995605A
公开(公告)日:2019-07-09
申请号:CN201810000615.2
申请日:2018-01-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Inventor: 熊龙
IPC: H04L12/26
Abstract: 本发明公开了一种流量识别方法,包括:获取电子设备被使用时所产生的待识别流量数据包;对所述待识别流量数据包进行特征提取,获得第一内容特征;将所述第一内容特征与预先构建的特征数据库中各App的第二内容特征进行匹配,确定所述待识别流量数据包关联的至少一个App;所述第二内容特征为从App的有效流量样本中提取的内容特征,所述有效流量样本包括App调用本地数据库所产生的流量数据包;根据所述特征数据库中所述至少一个App的第二行为特征,从所述至少一个App中确定所述待识别流量数据包所属的App;所述第二行为特征表征App对第三方数据库的调用行为特征。本发明同时还公开了一种流量识别装置以及计算机可读存储介质。
-
公开(公告)号:CN109995601A
公开(公告)日:2019-07-09
申请号:CN201711483710.4
申请日:2017-12-29
Applicant: 中国移动通信集团上海有限公司 , 中国移动通信有限公司研究院
Abstract: 本发明实施例公开了一种网络流量识别方法及装置,方法包括:根据具有卷积神经网络特征的区域R‑CNN模型对运行在纯净模拟器环境中的应用程序的界面进行对象识别,得到应用程序的动态操作行为信息;根据当前的操作行为类型和动态操作行为信息,对应用程序的操作行为进行分类触发,监听分类触发后的流量,并对分类触发后的流量进行流量标定,得到样本流量;将样本流量输入字符级循环神经网络char‑RNN模型进行训练,得到目标模型,根据目标模型对网络流量进行识别。弥补了代码静态分析获取操作行为的不足;根据操作行为类型有针对性地触发并监听流量,省时省力;通过目标模型来识别网络管道中的混杂用户流量,以挖掘用户所使用的应用程序中的操作行为信息。
-
-
-
-
-
-
-
-
-