-
公开(公告)号:CN119940368A
公开(公告)日:2025-05-06
申请号:CN202510008588.3
申请日:2025-01-03
Applicant: 国家计算机网络与信息安全管理中心 , 烟台中科网络技术研究所
IPC: G06F40/30 , G06F40/194 , G06F40/16 , G06N3/045 , G06N3/0475 , G06N3/042 , G06N3/0464 , G06F18/22 , G06F18/23211
Abstract: 本发明涉及文本数据分析技术领域,尤其涉及一种面向生成式大模型的文本同源性分析方法,包括以下步骤:S1:对面向生成式大模型的文本数据进行预处理后,将文本数据转化为高维语义嵌入向量,引入混合距离度量进行相似度分析;S2:采用基于密度峰值的动态聚类算法进行动态聚类分析,生成初步的同源文本簇,引入多重迭代映射与动态梯度扰动机制进一步分析,得到优化的同源文本簇;S3:将优化的同源文本簇进行多模态融合,利用图结构对融合后的多模态同源文本簇进行分析,应用时间序列分析方法,得到文本的同源性分析与来源追踪结果,本方法能够有效应对生成式大模型生成文本数据语义表达的多样性和复杂性,增强了文本表示的鲁棒性和准确性。
-
公开(公告)号:CN115309899A
公开(公告)日:2022-11-08
申请号:CN202210949186.X
申请日:2022-08-09
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06K9/62 , G06F40/284
Abstract: 本发明公开了一种文本中特定内容识别存储方法及系统,属于文特定词识别的技术领域,其方法包括生成特定词库和规则库;获取待识别的文本集合;提取当前特定文本数据集中的新特定词,得到新特定词集合;将需要训练的词组输入BERT模型;从特定文本中获取疑似新特定词集合,利用BERT模型计算特定词库中各词的特征向量与疑似新特定词集合中各词的特征向量的余弦相似度,并基于计算结果判定新特定词。本发明解决了现有技术中基于预构建模式规则的匹配方式仅局限于特定匹配规则模式,匹配方式不够灵活,结果不够全面,难以及时识别海量新出现的特定词及其变体词,且由于文本中涉及大量错综复杂的词语,容易造成特定词的模糊匹配,导致误识别的问题。
-
公开(公告)号:CN113536077B
公开(公告)日:2022-06-17
申请号:CN202110606596.X
申请日:2021-05-31
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/906 , G06F16/953 , G06F16/901 , G06N20/00
Abstract: 本发明公开了一种移动APP特定事件内容检测方法,涉及网络信息安全和自然语言处理交叉技术领域。首先获取互联网上特定事件的若干内容作为原始语料,从中抽取原始关键词;针对原始语料构建关键词关系图,并对关键词关系图进行聚类,得到若干簇;对同一簇中的关键词进行量化和排序,得到最能够表达该事件的特征关键词;将特征关键词输入到APP搜索框中进行自动化检索,保存结果;使用机器学习算法对保存结果进行分析,实现了移动APP中特定事件的自动、高效检测分析。本发明以很低的搜索成本获得了不同移动应用针对特定事件的舆论观点和舆论走向信息。本发明还公开了一种移动APP特定事件内容检测装置。
-
公开(公告)号:CN110505348A
公开(公告)日:2019-11-26
申请号:CN201910794491.4
申请日:2019-08-27
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种APP收集用户个人敏感信息的风险评估方法,通过对APP进行静态分析以及动态分析,得出权限评分、调用函数评分、SDK评分、流量包参数评分和域名评分,再进行加权求和,得出被评估APP的最终评分,根据评估矩阵得出被评估APP的风险评级;根据风险评级反向维护SDK风险权重库和域名风险权重库,对SDK或域名进行风险权重的修正。本发明的APP收集用户个人敏感信息的风险评估方法包含用户输入的用户个人敏感信息、非用户输入的潜在用户个人敏感信息,对APP收集用户个人敏感信息的风险程度进行量化,更全面的涵盖了多种敏感信息点,细化了APP收集用户个人敏感信息的风险大小,能大批量的评估APP收集用户个人敏感信息的风险程度。
-
-
公开(公告)号:CN104573033B
公开(公告)日:2017-12-19
申请号:CN201510020876.7
申请日:2015-01-15
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明提出了一种动态URL过滤方法及装置,该方法包括:基于URL标注集创建信息字典;针对URL标注集中的每一个URL,根据所述信息字典生成对应的特征向量,由URL标注集中所有的URL对应的特征向量组成特征矩阵;对URL特征矩阵进行分类得到特征权重向量和二分类阈值;基于所述信息字段对待预测的URL进行特征提取,并基于提取出的特征生成所述待预测的URL的特征向量;将所述待预测的URL的特征向量与所述特征权重向量对应相乘后相加得到目标数值,将目标数值与二分类阈值相比较以判断所述待预测的URL是动态URL还是静态URL。本发明可以离线处理,不需要访问网络、减少了存储,比较节省处理时间和计算资源。
-
公开(公告)号:CN104361037A
公开(公告)日:2015-02-18
申请号:CN201410591807.7
申请日:2014-10-29
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F17/30705 , G06F17/271
Abstract: 本发明公开了一种微博分类方法及装置。该方法包括:步骤1,对训练语料集合进行预处理,对预处理后的训练语料进行分词,获取候选特征,并对候选特征进行权重计算,根据权重计算结果进行特征选择,获取最终的分类特征;步骤2,根据最终的分类特征,采用贝叶斯分类器进行模型训练,获取分类模型;步骤3,采用贝叶斯分类器根据分类模型对微博文档进行分类。借助于本发明的技术方案,提高了分类的召回率与准确率。
-
公开(公告)号:CN117172245A
公开(公告)日:2023-12-05
申请号:CN202310610786.8
申请日:2023-05-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , G06F18/24 , G06F18/22
Abstract: 本发明实施例涉及一种控制方法及控制系统,所述方法包括:当检测到目标账号存在新发布的目标文章时,对所述目标文章进行引流标题的先验检测,得到先验检测结果,所述引流标题表征所述目标文章的文章类别;在所述先验检测结果满足预设条件时,对所述目标文章进行引流标题的后验检测,得到后验检测结果;根据所述先验检测结果和所述后验检测结果对所述目标账号进行分数评估,得到所述目标账号的评分结果;根据所述评分结果对所述目标账号进行控制。由此,可以实现对作者账号的调控机制限定,维护平台生态环境以及提高用户体验的技术效果。
-
公开(公告)号:CN116881550A
公开(公告)日:2023-10-13
申请号:CN202310764113.8
申请日:2023-06-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F18/23213 , G06F9/445 , G06F21/56 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种内容推荐系统冷启动安全风险检测方法及装置,包括:对被测推荐系统,根据所述被测推荐系统的注册规则,生成用户画像,并根据生成的用户画像、在本地系统构建相应的用户;为任一用户,基于配置的交互策略,在所述本地系统执行交互;根据交互结果构建训练数据;将训练数据输入潜在特征学习模型,执行训练;对所述待检测的内容数据,输入训练好的潜在特征学习模型;统计并逆向排序所述潜在特征学习模型的输出结果的重构误差;取排序后前指定数量的输出数据作为异常数据、进行聚类;根据聚类结果,判断内容推荐系统冷启动是否存在安全风险。本申请的方法能够用于判别被测推荐系统在冷启动阶段是否被恶意操纵。
-
公开(公告)号:CN115718835A
公开(公告)日:2023-02-28
申请号:CN202211370652.5
申请日:2022-11-03
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F17/16
Abstract: 本申请涉及一种破除信息茧房问题的冷启动个性化推荐方法及装置,其中,方法包括:在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;利用目标兴趣矩阵在预设内容池中确定候选推荐集;利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。通过对照账号来预测用户账号的兴趣矩阵,然后用兴趣矩阵选出候选推荐集,最后结合目标账号的浏览记录确定推荐数据,解决了为冷启动阶段用户推荐的内容趋于同质化的问题。
-
-
-
-
-
-
-
-
-