-
公开(公告)号:CN116992128A
公开(公告)日:2023-11-03
申请号:CN202310761657.9
申请日:2023-06-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F18/24 , G06Q10/0639
Abstract: 本申请公开了一种检测推荐系统的推荐结果多样性的方法及设备,包括:获取所述推荐系统的推荐结果,并基于预设主题分类模型对所述推荐结果进行分类,以获得推荐内容的主题类别;确定推荐内容的主题类别中,相似的主题内容,通过预设情感立场检测模型进行情感立场检测;根据情感立场检测结果,计算考虑情感立场多样性的多样性评价指标。本申请的方法将情感立场维度的多样性融入到推荐系统多样性指标中,由此提出了一种考虑了情感立场多样性的推荐系统多样性检测方法。
-
公开(公告)号:CN116595316A
公开(公告)日:2023-08-15
申请号:CN202310430301.7
申请日:2023-04-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/10 , G06F18/22 , G06F18/214 , G06F16/9035 , G06F16/951 , G06F16/9537 , G06F16/9538 , G06F16/9535 , G06F16/9038
Abstract: 本发明提出了一种基于评分卡模型的多平台虚假信息识别方法及装置,方法包括:获取各自表征一主题的多组数据信息;基于数据信息与预先标记的数据信息的比对情况进行筛选;对当前数据信息进行排序以及填充处理;利用当前数据信息,构建评分卡模型,并确认每一主题对应的数据信息中,各个维度信息对数据信息危险程度的影响情况;利用当前构建的评分卡模型,对再次获取的表征一主题的数据信息进行识别处理。本发明应用评分卡模型,可基于同一主题的虚假信息识别,并且可以根据影响主题信息的多种因素,在不同的周期内,识别不同维度数据的影响因素权重。
-
公开(公告)号:CN116561599A
公开(公告)日:2023-08-08
申请号:CN202310538213.9
申请日:2023-05-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/22 , G06F17/16 , G06F18/25 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及社交网络技术领域,尤其为基于少样本几何深度学习的用户重识别系统及方法,包括:生成排序模块:用于生成候选实体,并对候选实体进行相应排序;向量转化模块:用于通过图卷积的方式将待链接实体和候选实体转换成含有语义信息的向量表示;深度训练模块:用于使用几何深度学习对所有的用户属性、内容、关系进行训练;身份重识别模块:用于计算两个实体之间的相似度,进行用户身份的重识别。本发明通过使用少样本几何深度学习实现用户身份重识别,通过图卷积的方式将待链接实体和候选实体转换成含有语义信息的向量表示,生成了有用的实体嵌入,并通过深度学习网络对所有的用户属性、内容、关系进行学习输出,获得更为准确的用户身份重识别信息。
-
公开(公告)号:CN115712738A
公开(公告)日:2023-02-24
申请号:CN202211429752.0
申请日:2022-11-15
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/383 , G06F40/289 , G06F18/25
Abstract: 本发明公开了一种融合多源数据的Telegram中文群组检索方法、装置及设备,所述方法包括:对获取检索词,并对所述检索词进行Telegram中文群组检索,生成多源融合群组;分析多源融合群组对应的群聊记录集合,得到特征词集合;基于特征词集合筛选所述多源融合群组,得到符合特征群组;对符合特征群组进行关联联想,生成关联联想群组;基于所述多源融合群组与符合特征群组集合,得到Telegram中文群组检索结果。本发明着重于解决Telegram中文群组检索困难。
-
公开(公告)号:CN115034286A
公开(公告)日:2022-09-09
申请号:CN202210435266.3
申请日:2022-04-24
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于自适应损失函数的异常用户识别方法和装置,其中,该方法包括:获取web系统的用户行为日志数据样本,并将用户行为日志数据样本向量化,得到无标签数据样本和有标签数据样本;进行数据预处理得到训练数据集;基于训练数据集的输入特征训练第一自编码器模型,并基于第一自编码器模型构造无标签数据样本损失函数和有标签数据样本损失函数;迭代优化第一自编码器模型并构造异常用户检测优化问题函数,得到第二自编码器模型;基于第二自编码器模型,对无标签数据样本进行异常点检测,以识别异常用户。本发明解决实际业务场景中,无标签数据中存在异常点,采用固定损失函数难以提高准确率,误报率高的技术问题。
-
公开(公告)号:CN113132383A
公开(公告)日:2021-07-16
申请号:CN202110421317.2
申请日:2021-04-19
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及大数据技术领域。本发明公开了一种网络数据采集系统,该系统包括服务器,服务器包括:任务下发模块,用于创建用户信息获取任务,将用户信息获取任务分配至不同的任务池,计算任务池优先级,根据任务下发规则,得到并传输具有优先级参数的用户信息获取任务;数据解析模块,与任务下发模块数据连接,用于获取来自中间代理服务端的用户信息流量数据,数据解析模块构建报文解析神经网络模型,将待解析报文信息输入训练后报文解析神经网络模型,判断待解析报文信息中是否包括指定用户信息并提取。通过设置任务优先级,优先处理重要的任务,提高任务处理效率。本公开实施例还公开了一种网络数据采集方法。
-
公开(公告)号:CN112836493A
公开(公告)日:2021-05-25
申请号:CN202011404000.X
申请日:2020-12-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/226 , G06F40/284 , G06F16/33
Abstract: 本发明公开了一种转写文本校对方法及存储介质,包括,基于预先构建的校对样本库对待校对文本按照不同文本粒度进行分析校对,获得对应的候选方案集;根据所述候选方案集确定校对方案,并通过所述校对方案确定校对结果。本发明方法基于预先构建的校对样本库对待校对文本按照不同文本粒度进行分析校对,获得对应的候选方案集;根据所述候选方案集确定校对方案,由此从不同的文本粒度出发确定校对方案,提高了转写文本的准确性和语义的合理性。
-
公开(公告)号:CN112632597A
公开(公告)日:2021-04-09
申请号:CN202011420230.5
申请日:2020-12-08
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种数据脱敏方法、装置可读存储介质,其中方法包括:根据获取的用户提交的数据文件通过预先训练的标注模型对所述数据文件中的敏感数据进行标注,以获得标注文件;利用预设评测规则对与所述标注文件的文件类型相匹配的脱敏算法进行评测;根据用户从评测结果中选取的脱敏算法完成对所述标注文件的脱敏。本发明利用预设评测规则对与标注文件的文件类型相匹配的脱敏算法进行评测;根据用户从评测结果中选取的脱敏算法完成对标注文件的脱敏,由此可以通过规则评测和用户选择确定对应的脱敏算法,具有广泛的适用性。
-
公开(公告)号:CN112085614A
公开(公告)日:2020-12-15
申请号:CN202010778007.1
申请日:2020-08-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q50/00 , G06F16/9536
Abstract: 一种基于时空行为数据的跨社交网络虚拟用户身份对齐方法,主要步骤为:1)预处理用户在社交网络上产生的时空行为数据,生成用户时空行为序列;2)基于时空行为序列数据定义并计算社交网络间任意两用户的相似度;3)构建以社交网络用户为节点的二部图,相同社交网络用户节点间无边,不同社交网络用户节点间边的权重等于用户相似度;4)计算二部图的最大权匹配;5)基于最大权匹配结果生成虚拟身份对齐结果。本发明能够为全方位分析用户在社交网络中扮演的角色、准确估计用户真实属性提供重要理论基础与技术支撑,所需要数据在现实社交网络中易于获取,计算过程易于通过分布式框架进行,可以在大规模复杂网络中快速做到虚拟用户身份对齐。
-
公开(公告)号:CN110059181A
公开(公告)日:2019-07-26
申请号:CN201910202727.0
申请日:2019-03-18
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明属于文本分类领域,具体涉及一种面向大规模分类体系的短文本标签方法、系统、装置,旨在为了解决有限数据情况下面向大规模分类体系的短文本标签系统的稳定性不高的问题。本发明方法包括:获取待分类的第一短文本信息集合,并基于正向最大匹配分词和word2vec词向量表示技术进行预处理得到第二短文本信息集合;基于规则的分类方法、有监督的神经网络分类方法,对第二短文本信息集合进行二分类后进行短文本过滤,并基于同样的分类方法进行各短文本的第一、二级分类标签,基于半监督学习的标签传播方法进行各短文本的第三、四级分类标签。本发明在有限数据情况下保证了面向大规模分类体系的短文本标签系统的稳定性。
-
-
-
-
-
-
-
-
-