-
公开(公告)号:CN119863846A
公开(公告)日:2025-04-22
申请号:CN202411792800.1
申请日:2024-12-07
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种人脸匿名化方法,包括:筛选从视图数据中检出的人脸图像;从所述人脸图像中获取关键点的特征向量和高维嵌入的表征向量;构造与所述表征向量同维度的随机向量,将所述表征向量结合所述随机向量和为所述随机向量设定的噪声系数,计算扰动表征向量;将所述扰动表征向量和所述特征向量拼接后获得随机扰动后的人脸图像,以所述随机扰动后的人脸图像替换所述人脸图像。本发明有益效果:通过对人脸属性特征的的修改,不改变人脸基本状态的情况下就可以隐藏特定个人的属性特征信息,同时不会影响视觉效果。
-
公开(公告)号:CN119741919A
公开(公告)日:2025-04-01
申请号:CN202411802628.3
申请日:2024-12-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G10L15/22 , G10L13/02 , G10L21/007 , G06F40/151 , G10L25/30
Abstract: 本发明提供了一种语音匿名化方法,包括:将语音数据按照激活检测结果分割为语音数据片段,转写所述语音数据片段为文本序列;由敏感词列表和所述文本序列对比以获取敏感词,以敏感词替换符替换所述敏感词,生成脱敏文本片段;根据所述脱敏文本片段生成文本嵌入表征码,与随机声纹嵌入表征码拼接,生成拼接表征码;通过后向解码网络将所述拼接表征码解码为时频谱后,声码器将所述时频谱转化为音频波形。本发明有益效果:通过对语音声纹的修改和敏感词的提出,实现的在不改变语音数据属性的条件下,对语音数据脱敏和匿名化。
-
公开(公告)号:CN113761919B
公开(公告)日:2025-01-07
申请号:CN202010500426.9
申请日:2020-06-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/211
Abstract: 本发明提供一种口语化短文本的实体属性提取方法及电子装置,包括对口语化短文本切词及词性标注,并对各标注词性的词语进行命名主体识别,得到实体词语;将口语化短文本映射为主谓宾三元组,获取主谓宾三元组中各词语的依存关系,并使用实体词语对主谓宾三元组中各词语进行实体识别;当主谓宾三元组中的主谓宾满足一触发规则时,提取宾语词组作为实体属性。本发明采用词性标注、依存句法分析、实体识别以及结合触发词词性规则的综合方法,更加有针对性的提取了口语化短数据的实体属性信息,丰富了口语化短文本领域的结构化信息抽取方法。
-
公开(公告)号:CN118332103A
公开(公告)日:2024-07-12
申请号:CN202410507046.6
申请日:2024-04-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/34 , G06F16/35 , G06F16/33 , G06F16/332 , G06F40/30 , G06F40/284 , G06N3/0455 , G06N3/047 , G06N3/084
Abstract: 本公开提供一种主题提取方法、装置、相关设备和计算机程序产品,涉及计算机与互联网技术领域。主题提取方法包括:获取多个文本和多个热点关键词,热点关键词是从网络中获得的;根据多个热点关键词对各个文本分别进行关键词匹配,以确定各个文本中的文本关键词;通过文本关键词对多个文本进行文本聚类,以确定至少一个文本组;将每个文本组中命中热点关键词最多的文本作为文本组的主题。本公开实施例可以快速且准确的从多个文本中提取出主题信息。
-
公开(公告)号:CN110830999B
公开(公告)日:2023-04-07
申请号:CN201910991032.5
申请日:2019-10-18
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司 , 杭州东信北邮信息技术有限公司
IPC: H04W12/041 , H04W12/122
Abstract: 一种呼叫处置策略的加密方法,包括:管理装置使用非对称加密算法生成公钥和私钥,并将公钥提供给通讯业务服务器上的控制装置;管理装置将诈骗电话呼叫处置策略通过公钥进行加密,策略包括可疑诈骗号码数据和可疑诈骗号段数据,其中,可疑诈骗号码数据是使用公钥加密后的可疑诈骗号码,可疑诈骗号段数据由可疑诈骗号段长度和加密后的可疑诈骗号段组成,然后将呼叫处置策略同步至控制装置;控制装置从触发至业务服务器的呼叫中提取号码,将提取号码和呼叫处置策略进行匹配,当匹配一致时,则表示该呼叫是可疑诈骗电话,对呼叫处理。本发明属于信息技术领域,能保证呼叫处置策略中可疑诈骗号码和号段数据的安全性,防止敏感数据泄露。
-
公开(公告)号:CN111709472B
公开(公告)日:2022-09-23
申请号:CN202010543099.5
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种动态融合规则到诈骗行为识别模型的方法,包括:由全量通话记录生成电信通联网络:G={V,E,Y},并据此构建识别诈骗行为的时空图;读取诈骗行为识别规则表中的每条规则,计算每个用户对应于每条规则的转换值;将每个用户对应于规则的转换值构成每个用户的通话特征指标向量,每个用户的通话特征指标向量即是时空图中每个用户的节点特征;构建、并训练诈骗行为识别模型,然后将待识别用户的节点特征输入至诈骗行为识别模型,并根据模型输出判断待识别用户是否是可疑诈骗行为号码。本发明属于信息技术领域,能实现规则和模型的动态融合,从而实时检测、并准确识别各种诈骗行为。
-
公开(公告)号:CN110556114B
公开(公告)日:2022-06-17
申请号:CN201910684343.7
申请日:2019-07-26
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
IPC: G10L17/18 , G10L17/04 , H04M1/656 , H04M1/72454 , H04M1/72403
Abstract: 本发明公开了一种基于注意力机制的说话人识别方法及装置,包括如下步骤:采集多个被测试通话人的通话录音和测试通话人的通话录音;根据所述被测试通话人对应的通话录音,建立通话人语音库;采用基于注意力的神经网络对所述被测试通话人语音进行训练,获得训练模型;存储所述测试通话人的通话录音,获得录音文件;将所述录音文件采用所述训练模型识别所述被测试通话人是否目标通话人。通过采用基于注意力的神经网络对所述被测试通话人语音进行训练,获得训练模型,采用训练模型识别所述被测试通话人,确认了拨号码对应的主人的一致性,避免了由于通话人身份被仿冒带来的通信安全隐患,进一步提高了通话过程中的信息的安全性。
-
公开(公告)号:CN113761919A
公开(公告)日:2021-12-07
申请号:CN202010500426.9
申请日:2020-06-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/211
Abstract: 本发明提供一种口语化短文本的实体属性提取方法及电子装置,包括对口语化短文本切词及词性标注,并对各标注词性的词语进行命名主体识别,得到实体词语;将口语化短文本映射为主谓宾三元组,获取主谓宾三元组中各词语的依存关系,并使用实体词语对主谓宾三元组中各词语进行实体识别;当主谓宾三元组中的主谓宾满足一触发规则时,提取宾语词组作为实体属性。本发明采用词性标注、依存句法分析、实体识别以及结合触发词词性规则的综合方法,更加有针对性的提取了口语化短数据的实体属性信息,丰富了口语化短文本领域的结构化信息抽取方法。
-
公开(公告)号:CN113761903A
公开(公告)日:2021-12-07
申请号:CN202010504536.2
申请日:2020-06-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06F40/30 , G06F40/232 , G06F16/35 , G06N3/04
Abstract: 本发明提出一种针对海量高噪音口语化短文本的文本筛选方法,属于自然语言处理领域,通过对训练语料和待筛选的目标文本进行预处理;对预处理后的训练语料中的标注的正类语料进行句式信息提取,区分出业务强相关句式和弱相关句式;利用提取的句式信息对预处理后的目标文本进行句式匹配,将业务强相关句式的匹配结果归为正类文本,对业务弱相关句式的匹配结果进行以下步骤的处理;对目标文本和训练语料都进行文本处理,将处理后的文本转化为词向量表示;使用训练语料的词向量表示训练文本分类模型,将目标文本的词向量表示输入到训练好的文本分类模型中对文本进行分类,实现对目标文本的文本筛选。
-
公开(公告)号:CN113645356A
公开(公告)日:2021-11-12
申请号:CN202010343481.1
申请日:2020-04-27
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明提出一种基于网内开卡行为分析的诈骗电话识别方法,包括:收集诈骗电话和普通电话的开卡行为数据,并提取诈骗电话和普通电话的特征向量;使用诈骗电话和普通电话的特征向量进行诈骗电话模型训练,生成诈骗电话判断模型;接收新电话的开卡行为数据,并提取新电话的特征向量;使用诈骗电话判断模型对新电话的特征向量进行分析,对新电话进行判断。本发明针对诈骗电话手段不断变化,采用大数据分析历史诈骗电话和普通电话的相关数据,使用“GBDT‑LSTM‑RF”的深度学习模型架构,构建诈骗电话判断模型,通过自学习技术学习到网内开卡时序特征,并将多类特征进行融合,从而可以发现诈骗电话;本发明还可以自更新,可以有效发现新型诈骗电话。
-
-
-
-
-
-
-
-
-