-
公开(公告)号:CN115083422B
公开(公告)日:2022-11-15
申请号:CN202210859678.X
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种语音溯源取证方法及装置、设备及存储介质,所述方法包括:本提取待测试语音的至少两种不同的声学特征;对提取的待测试语音的至少两种不同的声学特征进行融合,得到第一融合声学特征;基于预先训练的语音溯源取证模型,从所述第一融合声学特征中提取帧级别的算法指纹特征,对帧级别的算法指纹特征进行池化平均,根据池化平均得到的特征加权平均向量和加权标准差向量计算段级别的算法指纹特征,以基于段级别的算法指纹特征预测出待测试语音的生成算法;将预测出的待测试语音的生成算法作为语音溯源取证结果,通过提取算法指纹,不仅可以判断音频的真实性,而且可以进一步溯源取证,得到虚假音频的生成来源。
-
公开(公告)号:CN115083423A
公开(公告)日:2022-09-20
申请号:CN202210861979.6
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种语音鉴别的数据处理方法和装置,涉及语音识别技术、人工智能和计算机技术领域,上述数据处理方法包括:获取待鉴别音频;对上述待鉴别音频进行特征提取,得到初始声学特征;对上述初始声学特征进行量化处理,得到量化声学特征;将上述量化声学特征输入至目标语音鉴别模型中进行处理,输出得到上述待鉴别音频的真伪结果,上述目标语音鉴别模型为参数预训练好且经过量化后的语音鉴别模型。在确保语音真伪鉴别准确率的基础上能够提升语音真伪鉴别的鉴别速度,提升数据处理的效率。
-
公开(公告)号:CN114267333A
公开(公告)日:2022-04-01
申请号:CN202111509949.0
申请日:2021-12-10
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 讯飞智元信息科技有限公司
IPC: G10L15/00 , G10L15/06 , G06F40/126 , G06F40/242
Abstract: 本发明公开了一种混合双语语音识别方法及系统,所述方法包括如下步骤:数据处理步骤,包括:对一定量的目标双语音频数据和目标双语文本语料执行BPE共享词典制作、数据增广和特征提取操作,为后端网络训练提供有效数据输入;Encoder‑Decoder训练步骤,包括:对所述数据处理步骤获得的有效数据采用Transformer结构训练语音识别器。本发明涉及双语混合连续语音识别技术领域。根据输入的目标语种的单语语音数据、双语混合语音数据或者双语混杂语音数据,自动转写出语音的内容信息。
-
公开(公告)号:CN113642328A
公开(公告)日:2021-11-12
申请号:CN202010343089.7
申请日:2020-04-27
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种诈骗文本命名实体识别方法,包括:收集诈骗文本,对诈骗文本进行类别标记;使用诈骗文本和类别标记过的诈骗文本进行诈骗文本模型训练,生成诈骗文本命名实体判断模型;接收新通信文本,使用诈骗文本命名实体判断模型对新通信文本进行分析,获取新通信文本中的命名实体及类别。本发明针对诈骗文本手段不断变化,收集大量的历史诈骗文本,构建诈骗文本命名实体判断模型,周期性收集多条历史诈骗文本的相关数据对诈骗文本命名实体判断模型进行自回溯验证,对新通讯文本命名实体识别进行实时验证,实现系统自动化分析处理与人工校准相结合,有效识别新型诈骗文本中的命名实体,通过自动验证不断完善系统模型,实现系统自动化。
-
公开(公告)号:CN111641531B
公开(公告)日:2021-08-17
申请号:CN202010399499.3
申请日:2020-05-12
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种基于DPDK的数据包分发和特征提取方法,包括:步骤一、设置多台Worker服务器和1台采集Proxy服务器,并对每台服务器预先进行DPDK环境部署;步骤二、采集Proxy服务器从绑定网卡中读取网络数据包并存入缓冲区中,同时,按照每个数据包的五元组信息,将缓存区中五元组信息相对应的所有数据包分发给其中1台对应的Worker服务器;步骤三、每台Worker服务器从收到的数据包中提取数据特征信息。本发明属于信息技术领域,能有效提高对网络海量数据包的处理效率和正确率。
-
公开(公告)号:CN113115363A
公开(公告)日:2021-07-13
申请号:CN202110426526.6
申请日:2021-04-20
Applicant: 国家计算机网络与信息安全管理中心
Inventor: 倪善金 , 万辛 , 黄远 , 孙晓晨 , 宁珊 , 沈亮 , 高圣翔 , 计哲 , 杨晶超 , 张震 , 李鹏 , 石瑾 , 李沁 , 侯炜 , 刁则鸣 , 刘发强 , 孙旭东 , 王立强 , 刘睿霖
IPC: H04W28/02 , H04W28/08 , H04B17/318 , H04B17/382
Abstract: 本公开提供一种异构网络中的移动通信方法、装置与电子设备。异构网络中的移动通信方法包括:确定目标用户在所述目标异构网络中的目标位置确定所述目标位置处于所述目标低功率节点的目标信号范围内,所述目标信号范围是根据所述目标低功率节点与所述宏基站之间的目标信号强度边界和所述目标信号强度边界的目标范围扩展基基确定的将所述目标用户与所述宏基站之间通信切换为所述目标用户与所述目标低功率节点进行通信。本公开实施例提供的技术方案可以通过低功率节点的覆盖边界扩展,降低宏基站的负载,提高异构网络中用户的网络信号强度,增强系统的可靠性和频谱效率。
-
公开(公告)号:CN112836043A
公开(公告)日:2021-05-25
申请号:CN202011093000.2
申请日:2020-10-13
Applicant: 讯飞智元信息科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于预训练语言模型的长文本聚类方法及装置,该方法包括:步骤SS1:使用文本摘要模型将长文本压缩为短文本;步骤SS2:根据步骤SS1获得的所述短文本与BERT模型的有标签文本句子对来预测是否两个文本包含相同的事件,生成文本对初始分数;步骤SS3:使用步骤SS2获得的所述文本对初始分数作为初始分数,根据文本对相较于其他文本的关系来重新计算分数;步骤SS4:根据步骤SS3获得的文本对分数,从得分最高的文本对开始计算分组。本发明运用深度学习方法的同时,采用迁移学习,将大规模预训练模型应用到文本聚类中。
-
公开(公告)号:CN111726460B
公开(公告)日:2021-04-20
申请号:CN202010542365.2
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种基于时空图的诈骗号码识别方法,包括:由全量通话记录生成电信通联网络,并构建识别诈骗号码的时空图,使用Snapshot方法按时间间隔T、从图中连续截取出多张时空子图;基于用户在每张时空子图对应时间周期下的通话记录,计算每个用户在每张时空子图对应时间周期下的通话特征指标向量,同时,为每个用户从时空子图中提取和其有相同被叫的邻居用户;构建、并训练识别诈骗号码的时空图神经网络;将待识别目标用户和其所有邻居用户在所有时空子图中的通话特征指标向量输入时空图神经网络,并根据输出判断待识别目标用户号码是否是疑似诈骗号码。本发明属于信息技术领域,能动态的捕获到号码呼叫行为的变化,从而实现诈骗号码的精准识别。
-
公开(公告)号:CN111881682A
公开(公告)日:2020-11-03
申请号:CN202010554413.X
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G06F40/295 , G06F40/30 , G06N3/04
Abstract: 本发明公开了一种改进的DRNN模型的意图识别方法及装置,该方法包括如下步骤:步骤SS1:将输入序列输入到DRNN循环神经网络中进行阻断信息流动,使输入序列传递固定的步长K;步骤SS2:将DRNN循环神经网络的每个隐层标识送入MLP多层感知器中,来抽取更高层的特征信息;步骤SS3:通过Max Pooling池化操作来抽取整个输入序列的文本中最重要的特征信息;步骤SS4:通过一层MLP多层感知器送入softmax逻辑回归模型中进行分类,输出文本分类结果。本发明通过改进的DRNN(Disconnected Recurrent Neural Networks)进行意图识别分类,以提高文本分类的准确性,使相关技术在实际应用场景中达到更好效果。
-
公开(公告)号:CN111737318A
公开(公告)日:2020-10-02
申请号:CN202010585668.2
申请日:2020-06-24
Applicant: 国家计算机网络与信息安全管理中心浙江分中心
IPC: G06F16/2458 , G06F16/2457
Abstract: 本发明提供一种网络诈骗易感人群筛选方法,包括:提取高危用户的社会属性数据;根据高危用户的社会属性进行分段,统计每个属性分段的访问诈骗网站人数;根据高危用户在各个属性分段的数量分布,为每个属性分段分配不同的权重,形成权重集合;计算所有高危用户的权重的加权平均值,取加权平均值最小的用户作为筛选阈值;使用权重集合与筛选阈值建立初始模型。由于容易受害的群体往往集中在部分人群,针对这些人群重点宣传,可以起到事半功倍的效果,因此通过本发明可以准确、迅速的对诈骗网站的访问数据分析筛选,挖掘出网络诈骗易受害人群,从而提高防网络诈骗宣传的效率,针对易被骗人群重点宣传,有效降低诈骗率,降低宣传成本。
-
-
-
-
-
-
-
-
-