-
公开(公告)号:CN115718835A
公开(公告)日:2023-02-28
申请号:CN202211370652.5
申请日:2022-11-03
申请人: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC分类号: G06F16/9535 , G06F17/16
摘要: 本申请涉及一种破除信息茧房问题的冷启动个性化推荐方法及装置,其中,方法包括:在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;利用目标兴趣矩阵在预设内容池中确定候选推荐集;利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。通过对照账号来预测用户账号的兴趣矩阵,然后用兴趣矩阵选出候选推荐集,最后结合目标账号的浏览记录确定推荐数据,解决了为冷启动阶段用户推荐的内容趋于同质化的问题。
-
公开(公告)号:CN118349883A
公开(公告)日:2024-07-16
申请号:CN202410345245.1
申请日:2024-03-25
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F18/241 , G06F18/214 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06F21/60
摘要: 本申请提供一种重要数据的识别方法、装置和电子设备,涉及数据处理技术领域和人工智能技术领域。该方法包括:在识别重要数据时,可以先获取待识别数据集,待识别数据集中包括多个数据和各数据的重要度指标;针对各数据,将数据和数据的重要度指标输入至预设的重要数据识别模型中,得到数据对应的重要度得分;再基于各数据对应的重要度得分,从多个数据中识别重要数据,这样基于重要数据识别模型识别重要数据,与现有技术中基于预设重要度规则识别重要数据相比,不仅可以有效地提高重要数据的识别效率,而且提高了识别结果的准确度。
-
公开(公告)号:CN118035711A
公开(公告)日:2024-05-14
申请号:CN202410431137.6
申请日:2024-04-11
IPC分类号: G06F18/21 , G06F18/2431 , G06N3/09
摘要: 本发明公开了一种针对大模型内容安全能力的评测方法及系统,属于网络空间安全技术领域。所述评测方法包括步骤1,构建多模态、多领域和多题型的评测集;步骤2,构建内容安全评测模型;步骤3,将评测集的问题输入至被测大模型,输出对应的大模型回答;将问题和对应大模型回答整理成问答集,将所述问答集输入至所述内容安全评测模型,根据内容安全评测模型的输出对所述大模型进行综合打分,获得针对大模型内容安全能力的评测结果。该方法可以量化评价大模型跨模态内容安全防护性能,为监管部门、第三方评测机构、大模型研发机构提供参考数据。
-
公开(公告)号:CN117312864A
公开(公告)日:2023-12-29
申请号:CN202311618449.X
申请日:2023-11-30
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F18/214 , G06F18/10 , G06F18/25 , G06F40/284 , G06N3/08 , G06N3/0455 , G06N3/0475
摘要: 本发明提供一种基于多模态信息的变形词生成模型的训练方法及装置,涉及语言生成技术领域,方法包括:获取变形词语料库,变形词语料库包括的不同初始样本由多模态信息组成;对变形词语料库中不同初始样本的不同类型的语料信息,采用对应类型的预处理方式分别进行预处理,生成大规模语料库;大规模语料库中每个语料样本包括多个语料信息的权重及特征向量,不同的语料信息的权重用于表征不同的语料信息在对应样本中不同的贡献程度;基于大规模语料库中预设数量的语料样本包括的多个语料信息的权重及特征向量,对初始模型进行训练,得到基于多模态信息的变形词生成模型。本发明能够提高变形词生成的精度和准确率。
-
公开(公告)号:CN116578942B
公开(公告)日:2023-12-22
申请号:CN202310853781.8
申请日:2023-07-12
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F18/2433 , G06F17/18 , G06F18/214 , G06Q10/10
摘要: 本申请实施例涉及一种榜单异常的处理方法及装置,所述方法包括:获取目标榜单信息,并按照设定的检测方法对目标榜单信息进行异常检测,得到对应的异常检测结果;将异常检测结果对应的异常样本信息输入到预先训练好的预估模型中进行评估处理,输出异常样本信息对应的在榜时长;根据在榜时长确定反馈调节策略;基于反馈调节策略执行对异常在榜信息的处理。通过创建榜单异常的检测工具,检测出每个榜单信息中存在的异常样本信息,通过设定的反馈调节策略对异常样本信息进行处理,达到治理异常榜单信息的目的;由此,可以实现利用机器审核结合人工审核,形成一套实时报警、反馈、调节的热榜治理机制,维护热榜的公平和稳定的技术效果。
-
公开(公告)号:CN116561512A
公开(公告)日:2023-08-08
申请号:CN202310431305.7
申请日:2023-04-20
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F18/10 , G06F18/27 , G06F18/22 , G06F18/214 , G06F16/9035 , G06F16/951 , G06F16/9537 , G06F16/9538 , G06F16/9535 , G06F16/9038
摘要: 本发明提出了一种基于COX回归的多平台虚假信息识别方法及装置,方法包括:获取各自表征一主题的多组数据信息;基于数据信息与预先标记的数据信息的比对情况进行筛选;对当前数据信息进行排序以及填充处理;基于COX回归算法,利用当前数据信息,构建COX回归识别模型,并确认每一主题对应的数据信息中,各个维度信息对数据信息危险程度的影响情况;利用当前构建的COX回归识别模型,对再次获取的表征一主题的数据信息进行识别处理。本发明可基于同一主题的虚假信息识别,并且可以根据影响主题信息的多种因素,在不同的周期内,识别不同维度数据的影响因素权重。
-
公开(公告)号:CN116992128A
公开(公告)日:2023-11-03
申请号:CN202310761657.9
申请日:2023-06-26
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/9535 , G06F18/24 , G06Q10/0639
摘要: 本申请公开了一种检测推荐系统的推荐结果多样性的方法及设备,包括:获取所述推荐系统的推荐结果,并基于预设主题分类模型对所述推荐结果进行分类,以获得推荐内容的主题类别;确定推荐内容的主题类别中,相似的主题内容,通过预设情感立场检测模型进行情感立场检测;根据情感立场检测结果,计算考虑情感立场多样性的多样性评价指标。本申请的方法将情感立场维度的多样性融入到推荐系统多样性指标中,由此提出了一种考虑了情感立场多样性的推荐系统多样性检测方法。
-
公开(公告)号:CN116881550A
公开(公告)日:2023-10-13
申请号:CN202310764113.8
申请日:2023-06-26
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/9535 , G06F18/23213 , G06F9/445 , G06F21/56 , G06N3/04 , G06N3/08
摘要: 本申请公开了一种内容推荐系统冷启动安全风险检测方法及装置,包括:对被测推荐系统,根据所述被测推荐系统的注册规则,生成用户画像,并根据生成的用户画像、在本地系统构建相应的用户;为任一用户,基于配置的交互策略,在所述本地系统执行交互;根据交互结果构建训练数据;将训练数据输入潜在特征学习模型,执行训练;对所述待检测的内容数据,输入训练好的潜在特征学习模型;统计并逆向排序所述潜在特征学习模型的输出结果的重构误差;取排序后前指定数量的输出数据作为异常数据、进行聚类;根据聚类结果,判断内容推荐系统冷启动是否存在安全风险。本申请的方法能够用于判别被测推荐系统在冷启动阶段是否被恶意操纵。
-
公开(公告)号:CN116595316A
公开(公告)日:2023-08-15
申请号:CN202310430301.7
申请日:2023-04-20
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F18/10 , G06F18/22 , G06F18/214 , G06F16/9035 , G06F16/951 , G06F16/9537 , G06F16/9538 , G06F16/9535 , G06F16/9038
摘要: 本发明提出了一种基于评分卡模型的多平台虚假信息识别方法及装置,方法包括:获取各自表征一主题的多组数据信息;基于数据信息与预先标记的数据信息的比对情况进行筛选;对当前数据信息进行排序以及填充处理;利用当前数据信息,构建评分卡模型,并确认每一主题对应的数据信息中,各个维度信息对数据信息危险程度的影响情况;利用当前构建的评分卡模型,对再次获取的表征一主题的数据信息进行识别处理。本发明应用评分卡模型,可基于同一主题的虚假信息识别,并且可以根据影响主题信息的多种因素,在不同的周期内,识别不同维度数据的影响因素权重。
-
公开(公告)号:CN115309899B
公开(公告)日:2023-05-16
申请号:CN202210949186.X
申请日:2022-08-09
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/35 , G06F18/22 , G06F40/284 , G06N3/0455
摘要: 本发明公开了一种文本中特定内容识别存储方法及系统,属于文特定词识别的技术领域,其方法包括生成特定词库和规则库;获取待识别的文本集合;提取当前特定文本数据集中的新特定词,得到新特定词集合;将需要训练的词组输入BERT模型;从特定文本中获取疑似新特定词集合,利用BERT模型计算特定词库中各词的特征向量与疑似新特定词集合中各词的特征向量的余弦相似度,并基于计算结果判定新特定词。本发明解决了现有技术中基于预构建模式规则的匹配方式仅局限于特定匹配规则模式,匹配方式不够灵活,结果不够全面,难以及时识别海量新出现的特定词及其变体词,且由于文本中涉及大量错综复杂的词语,容易造成特定词的模糊匹配,导致误识别的问题。
-
-
-
-
-
-
-
-
-