-
公开(公告)号:CN115081437B
公开(公告)日:2022-12-09
申请号:CN202210855918.9
申请日:2022-07-20
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/279 , G06F40/253 , G06F40/242 , G06F40/216 , G06F40/211 , G06F40/30 , G06F16/33
Abstract: 本发明涉及文本检测技术领域,公开了基于语言学特征对比学习的机器生成文本检测方法及系统,该机器生成文本检测方法,包括以下步骤:S1,预训练模型调整;S2,话语图构建;S3,向量表示计算;S4,文本检测参数更新。本发明解决了现有技术存在的在标注数据有限的情况下自动准确识别网络中的机器生成文本等问题。
-
公开(公告)号:CN114915599B
公开(公告)日:2022-11-11
申请号:CN202210845605.5
申请日:2022-07-19
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
IPC: H04L47/2483 , H04L47/2441 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明涉及计算机网络技术领域,公开了一种基于半监督聚类学习的暗网站点会话识别方法及系统,该会话识别方法,利用深度学习CNN算法自动提取Obfs4网桥下暗网站点会话的特征,并利半监督聚类算法对暗网站点的onion地址进行识别。本发明解决了现有技术存在的泛化性不足、识别准确度较低、实用性不足等问题。
-
公开(公告)号:CN114936723A
公开(公告)日:2022-08-23
申请号:CN202210856300.4
申请日:2022-07-21
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及数据挖掘技术领域,公开了一种基于数据增强的社交网络用户属性预测方法及系统,该属性预测方法,基于用户的历史行为序列,推断用户未来一段时间的行为序列,通过将历史行为序列与预测得到的行为序列进行拼接,扩大行为序列的长度,对用户的行为数据进行增强。本发明解决了现有技术存在的线网络用户行为序列长度较短时不能为用户属性预测任务提供足够信息、从而导致用户属性预测的预测准确性低的问题。
-
公开(公告)号:CN115001861B
公开(公告)日:2022-12-09
申请号:CN202210852995.9
申请日:2022-07-20
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
IPC: H04L9/40
Abstract: 本发明涉及计算机网络技术领域,公开了一种基于混合指纹特征的暗网服务异常检测方法及系统,该异常检测方法,对暗网站点的流量数据和状态数据进行分析,通过分析状态数据和流量数据,提取暗网站点的单点指纹特征、话题关联的指纹特征、流量指纹信息,进行暗网服务异常检测。本发明解决了解决现有技术存在的难以对暗网站点的重要度进行整体地准确检测等问题。
-
公开(公告)号:CN114936723B
公开(公告)日:2023-04-14
申请号:CN202210856300.4
申请日:2022-07-21
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及数据挖掘技术领域,公开了一种基于数据增强的社交网络用户属性预测方法及系统,该属性预测方法,基于用户的历史行为序列,推断用户未来一段时间的行为序列,通过将历史行为序列与预测得到的行为序列进行拼接,扩大行为序列的长度,对用户的行为数据进行增强。本发明解决了现有技术存在的在线网络用户行为序列长度较短时不能为用户属性预测任务提供足够信息、从而导致用户属性预测的预测准确性低的问题。
-
公开(公告)号:CN115001861A
公开(公告)日:2022-09-02
申请号:CN202210852995.9
申请日:2022-07-20
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
IPC: H04L9/40
Abstract: 本发明涉及计算机网络技术领域,公开了一种基于混合指纹特征的暗网服务异常检测方法及系统,该异常检测方法,对暗网站点的流量数据和状态数据进行分析,通过分析状态数据和流量数据,提取暗网站点的单点指纹特征、话题关联的指纹特征、流量指纹信息,进行暗网服务异常检测。本发明解决了解决现有技术存在的难以对暗网站点的重要度进行整体地准确检测等问题。
-
公开(公告)号:CN114915599A
公开(公告)日:2022-08-16
申请号:CN202210845605.5
申请日:2022-07-19
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
IPC: H04L47/2483 , H04L47/2441 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明涉及计算机网络技术领域,公开了一种基于半监督聚类学习的暗网站点会话识别方法及系统,该会话识别方法,利用深度学习CNN算法自动提取Obfs4网桥下暗网站点会话的特征,并利半监督聚类算法对暗网站点的onion地址进行识别。本发明解决了现有技术存在的泛化性不足、识别准确度较低、实用性不足等问题。
-
公开(公告)号:CN115081437A
公开(公告)日:2022-09-20
申请号:CN202210855918.9
申请日:2022-07-20
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/279 , G06F40/253 , G06F40/242 , G06F40/216 , G06F40/211 , G06F40/30 , G06F16/33
Abstract: 本发明涉及文本检测技术领域,公开了基于语言学特征对比学习的机器生成文本检测方法及系统,该机器生成文本检测方法,包括以下步骤:S1,预训练模型调整;S2,话语图构建;S3,向量表示计算;S4,文本检测参数更新。本发明解决了现有技术存在的在标注数据有限的情况下自动准确识别网络中的机器生成文本等问题。
-
公开(公告)号:CN113205801B
公开(公告)日:2024-03-19
申请号:CN202110498059.8
申请日:2021-05-08
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
Abstract: 本申请涉及一种恶意语音样本的确定方法、装置、计算机设备和存储介质。该方法包括:获取初始语音样本集;根据预设的多种恶意类别对初始语音样本集进行分类,得到多种恶意类别中每种恶意类别对应的语音样本子集;根据每种恶意类别对应的语音样本子集中的语音样本信息,计算每种恶意类别对应的语音样本子集的恶意度;将恶意度满足预设恶意度条件的恶意类别对应的语音样本子集中的语音样本,确定为恶意语音样本。本方法基于语音样本子集的恶意类别以及恶意度可自动确定恶意语音样本,有利于提高恶意语音样本的确定效率。
-
公开(公告)号:CN117095673A
公开(公告)日:2023-11-21
申请号:CN202310830037.6
申请日:2023-07-07
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及语音识别领域,尤其为一种特定场景语音内容识别优化方法,包括如下步骤:包括如下步骤:S1:使用网络爬虫技术对网络中特定场景的语音进行爬取,获得初始语音数据;S2:提取初始语音数据并对初始语音数据进行数据预处理获得预处理数据;S3:通过卷积神经网络训练实用模型,对预处理数据进行语音识别并生成初始文本;S4:使用文本规范算法对初始文本进行文本润色保证输出最终文本的正确性。本发明通过对获取的语音进行预处理起到数据增强的作用保证了数据不失真,在获取到不失真的数据后对其进行特征提取确保了工作速度,对提取出的初始文本进行文本规范算法用常见的文本代替初始文本中出现的非人类语言,保证最后出现的文本不会出现错误。
-
-
-
-
-
-
-
-
-