-
公开(公告)号:CN116628209A
公开(公告)日:2023-08-22
申请号:CN202310721792.0
申请日:2023-06-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/289 , G06N3/044 , G06N3/0442
Abstract: 本发明涉及文本处理技术领域,尤其涉及一种不规则文本的标签化方法,本发明在对不规则文本进行标签化时,首先对所述不规则文本进行判断,判断所述不规则文本为长文本还是短文本,当所述不规则文本为长文本时,采用深度学习模型对所述长文本进行标签化,当所述不规则文本为短文本时,采用基于样本的分类模型对所述短文本进行标签化;这样,可有效提高不规则文本的分类准确率。
-
公开(公告)号:CN111597333B
公开(公告)日:2022-08-02
申请号:CN202010343965.6
申请日:2020-04-27
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/9535 , G06F40/30 , G06F40/289 , G06Q50/26
Abstract: 本发明公开一种面向区块链领域的事件与事件要素抽取方法及装置,该方法包括:步骤一、基于区块链关键词图的web文本聚类,得到区块链文本聚合词图;步骤二、基于所述的区块链文本聚合词图,构建图注意力机制的图表示学习的事件及其要素抽取方法;首先以区块链文本聚合词图作为输入,基于图注意力模型GAT的深度学习模型进行词的表示学习,以事件及其要素进行抽取的模型训练直到模型收敛;基于收敛的模型实现Tensorflow的后台接口,而对于新的待抽取的文本通过该后台接口进行预测,返回输出的抽取值。本发明可以准确提取事件及其事件要素。
-
公开(公告)号:CN111737551A
公开(公告)日:2020-10-02
申请号:CN202010452949.0
申请日:2020-05-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/953 , G06F16/951 , G06N3/08 , G06N3/04
Abstract: 本发明公开一种基于异构图注意力神经网络的暗网线索检测方法:步骤一、对暗网进行文本采集;步骤二、针对采集到的暗网文本信息,进行事件标题、关键词及实体提取,构建动态异构信息网络;步骤三、对构建的异构信息网络中的节点进行embedding处理,并得到各节点的特征向量;步骤四、对异构信息网络的图结构进行学习;步骤五、根据对异构信息网络的图结构学习得到的结果,对异构信息网络中的节点进行线索类别分类,从而完成对暗网信息的线索检测。本发明利用了外部知识库作为依托,并且采用了两套方法来对构建的异构信息网络的图结构进行学习,具有良好的线索检测效果。
-
公开(公告)号:CN119990203A
公开(公告)日:2025-05-13
申请号:CN202411812196.4
申请日:2024-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
IPC: G06N3/06 , G06F18/2431
Abstract: 本发明提供一种大模型安全神经元筛选方法和装置,方法包括:对基础大模型进行安全对齐,得到安全对齐模型;计算所述安全对齐模型和所述基础大模型的神经元激活差异;基于所述神经元激活差异,确定对所述基础大模型进行安全对齐时的安全神经元。本发明从模型自身内部的性质出发,不受任务形式限制,容易扩展,适用于大模型中的安全神经元发现,为进一步研究大模型的安全机理提供方案。
-
公开(公告)号:CN119990134A
公开(公告)日:2025-05-13
申请号:CN202411808989.9
申请日:2024-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
IPC: G06F40/30 , G06F40/284 , G06F40/237
Abstract: 本发明提供一种使用自述式提示与集成梯度的语义贡献识别方法及系统,包括:获取输入数据并编写特定的问题提示;将所述问题提示多次输入至预设的大语言模型,引导大语言模型自动识别并报告在决策过程中起到关键作用的词汇,生成关键词提议集合;基于所述关键词提议集合抽取关键词,生成第一语义贡献度列表;基于所述输入数据通过预设的公式进行集成梯度计算,生成第二语义贡献度列表;将所述第一语义贡献度列表和第二语义贡献度列表进行整合分析,确定对大语言模型决策有重大影响的词汇。本发明解决了现有技术中大语言模型行为解释单一方法的局限性问题,提高了模型解释的全面性和准确性,满足了在多种自然语言处理应用中对可解释性的要求。
-
公开(公告)号:CN114880496A
公开(公告)日:2022-08-09
申请号:CN202210471183.X
申请日:2022-04-28
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/432 , G06F16/435 , G06F16/483 , G06F40/279 , G06F40/30 , G06V40/16 , G06V20/40 , G06V20/62 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , G06N7/00 , G10L15/22
Abstract: 本公开涉及一种多媒体信息话题分析方法、装置、设备及计算机可读存储介质,本公开通过音频数据得到语音识别文本、通过视频数据的关键帧得到字幕文本;针对上述语音识别文本及字幕文本从实体、关键词、语义标签三方面提取话题信息,实现了基于文本数据的全方面、多粒度的文本话题提取;针对视频数据的关键帧,从人脸标签及图片标签两方面提取话题信息,实现了基于图像数据的视觉话题提取;本公开实施例充分考虑了视频数据的多模态特征,全面的分析视频话题,提高了话题分析的准确性;进一步的,通过准确的话题分析,可以使受众快速有效的获取视频的主要信息,提升了工作效率,并可以广泛应用于视频个性化推荐、视频内容检索等场景。
-
公开(公告)号:CN111047448A
公开(公告)日:2020-04-21
申请号:CN201911392756.4
申请日:2019-12-30
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了多通道数据融合的分析方法,包括:根据恶意数字货币地址为种子,从暗网中爬取交易数据,所述交易数据包括交易地址及交易内容;将具有相同身份标识的交易地址的交易内容合并;结合区块链交易流分析和明网数据分析,对交易地址的身份标识进行信息补充。本发明还提供了多通道数据融合的分析装置。本发明通过对互联网和暗网信息进行关联分析,能有效弥补主被动分析方法的问题。
-
公开(公告)号:CN114880496B
公开(公告)日:2024-12-24
申请号:CN202210471183.X
申请日:2022-04-28
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/432 , G06F16/435 , G06F16/483 , G06F40/279 , G06F40/30 , G06V40/16 , G06V20/40 , G06V20/62 , G06V10/774 , G06V10/82 , G06N3/0442 , G06N3/08 , G06N7/01 , G10L15/22
Abstract: 本公开涉及一种多媒体信息话题分析方法、装置、设备及计算机可读存储介质,本公开通过音频数据得到语音识别文本、通过视频数据的关键帧得到字幕文本;针对上述语音识别文本及字幕文本从实体、关键词、语义标签三方面提取话题信息,实现了基于文本数据的全方面、多粒度的文本话题提取;针对视频数据的关键帧,从人脸标签及图片标签两方面提取话题信息,实现了基于图像数据的视觉话题提取;本公开实施例充分考虑了视频数据的多模态特征,全面的分析视频话题,提高了话题分析的准确性;进一步的,通过准确的话题分析,可以使受众快速有效的获取视频的主要信息,提升了工作效率,并可以广泛应用于视频个性化推荐、视频内容检索等场景。
-
公开(公告)号:CN114817636A
公开(公告)日:2022-07-29
申请号:CN202210469600.7
申请日:2022-04-28
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/783 , G06V20/40 , G06V20/62 , G06V10/774 , G06V10/764 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种视频检测方法、装置、设备及计算机可读存储介质,该方法包括:获取待检测视频的多种特征信息;基于所述多种特征信息,生成所述待检测视频的融合特征信息;基于所述待检测视频的融合特征信息,对所述待检测视频的安全性进行检测,得到检测结果。本公开通过充分利用视频数据中的多种模态维度的特征信息得到视频的融合特征信息,根据融合特征信息对待检测视频内容进行检测,能够发现各模态维度信息之间关联而形成的隐性安全问题,大大提高了视频检测方法的准确性。
-
公开(公告)号:CN111737551B
公开(公告)日:2022-08-05
申请号:CN202010452949.0
申请日:2020-05-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/953 , G06F16/951 , G06N3/08 , G06N3/04
Abstract: 本发明公开一种基于异构图注意力神经网络的暗网线索检测方法:步骤一、对暗网进行文本采集;步骤二、针对采集到的暗网文本信息,进行事件标题、关键词及实体提取,构建动态异构信息网络;步骤三、对构建的异构信息网络中的节点进行embedding处理,并得到各节点的特征向量;步骤四、对异构信息网络的图结构进行学习;步骤五、根据对异构信息网络的图结构学习得到的结果,对异构信息网络中的节点进行线索类别分类,从而完成对暗网信息的线索检测。本发明利用了外部知识库作为依托,并且采用了两套方法来对构建的异构信息网络的图结构进行学习,具有良好的线索检测效果。
-
-
-
-
-
-
-
-
-