-
公开(公告)号:CN113420112B
公开(公告)日:2025-02-18
申请号:CN202110685518.3
申请日:2021-06-21
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/334 , G06F40/289 , G06F18/214 , G06F18/23213
Abstract: 本发明涉及一种基于无监督学习的新闻实体分析方法及装置。方法包括:对待处理的多条新闻数据中的每条新闻数据分别进行分词处理,将分词处理后的每条新闻中包含的多个实体进行标注以得到标注结果;基于所述标注结果构建分布式表示模型,得到所述多个实体的分布式表示信息,所述分布式表示信息标识为实体向量;根据所述多个实体的分布式表示信息,对所述多个实体进行聚类分析以得到聚类结果。本申请将分布式的思想引入新闻实体的处理当中,通过新闻实体所处位置的上下文来得到实体的分布式表示,通过对实体的聚类分析来得到实体的聚类结果。
-
公开(公告)号:CN106972967B
公开(公告)日:2020-07-24
申请号:CN201710195501.3
申请日:2017-03-29
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明提出了一种用于链路预测的深度学习降维方法和装置,该方法,包括:根据各个网络节点在设定时间段内的连接关系,确定每个网络节点的一级连接网络节点和二级连接网络节点;按照设定时长将所述设定时间段划分为多个时间片,并根据所述各个网络节点在每个时间片内的连接关系,确定出在每个时间片内每个网络节点与对应的一级连接网络节点和二级连接网络节点的连接关系;根据在每个时间片内每个网络节点与对应的一级连接网络节点和二级连接网络节点的连接关系,通过深度学习算法模型,对所述各个网络节点进行链路预测。本发明减少输入到深度学习算法模型的数据量,减少学习训练时间并提高链路预测的准确性。
-
公开(公告)号:CN110895933A
公开(公告)日:2020-03-20
申请号:CN201811030952.2
申请日:2018-09-05
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于空时残差神经网络的远场语音识别方法,所述方法包括:步骤1)构建并训练空时残差神经网络ST-RES-LSTM,该神经网络是在的空间和时间两个维度上都引入了残差结构的LSTM神经网络;步骤2)利用训练好的空时残差神经网络ST-RES-LSTM进行声学模型训练,并生成每一帧的分类概率;步骤3)构建语音识别解码网络,并使用步骤2)的训练好的声学模型进行维特比解码出最终识别结果。本发明的方法在LSTM网络的空间和时间两个维度都引入残差结构,既能缓解层数加深带来的梯度消失问题,又能缓解LSTM在时间维度存在的梯度消失问题,从而提高语音识别的性能。
-
公开(公告)号:CN119559964A
公开(公告)日:2025-03-04
申请号:CN202310496296.X
申请日:2023-05-05
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本申请提供了一种伪造语音检测方法,包括:训练阶段,训练阶段包括:采集用于训练第一语音信号;确定第一语音信号中的静音帧和语音帧;对第一语音信号的静音帧进行零值掩蔽;获取掩蔽后的第一语音信号的特征;将特征输入伪造语音检测模型进行训练,得到训练好的伪造语音检测模型;推理阶段,推理阶段包括:采集目标语音,获取目标语音的特征;对所述目标语音进行零值掩蔽,获取掩蔽后的所述目标语音的特征;将目标语音的特征输入训练好伪造语音检测模型,输出目标语音的检测结果,检测结果包括目标语音为伪造语音或目标语音为真语音。
-
公开(公告)号:CN113420121B
公开(公告)日:2023-07-28
申请号:CN202110704938.1
申请日:2021-06-24
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/33 , G06F16/332 , G06F16/951 , G06F18/214
Abstract: 本申请提供了一种文本处理模型训练方法、语音文本处理方法及装置,涉及自然语言处理技术领域。该方法包括:从互联网爬取对话文本,得到正样本;对对话文本中的语句进行变换操作,得到负样本和负样本的第一标签信息;将正样本和负样本对应输入至预先训练的第一文本处理模型中和待训练的第二文本处理模型中,生成第一文本处理模型的目标层的第一特征向量和第二文本处理模型的目标层的第二特征向量;根据第一特征向量、第二特征向量,对第二文本处理模型进行知识蒸馏,得到训练好的第二文本处理模型。根据本申请实施例,能够解决相关技术中对语音文本进行校对效率低、耗时长且计算资源占用大的问题。
-
公开(公告)号:CN106972967A
公开(公告)日:2017-07-21
申请号:CN201710195501.3
申请日:2017-03-29
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
CPC classification number: H04L41/147 , G06N20/00 , G06Q10/04 , H04L41/12
Abstract: 本发明提出了一种用于链路预测的深度学习降维方法和装置,该方法,包括:根据各个网络节点在设定时间段内的连接关系,确定每个网络节点的一级连接网络节点和二级连接网络节点;按照设定时长将所述设定时间段划分为多个时间片,并根据所述各个网络节点在每个时间片内的连接关系,确定出在每个时间片内每个网络节点与对应的一级连接网络节点和二级连接网络节点的连接关系;根据在每个时间片内每个网络节点与对应的一级连接网络节点和二级连接网络节点的连接关系,通过深度学习算法模型,对所述各个网络节点进行链路预测。本发明减少输入到深度学习算法模型的数据量,减少学习训练时间并提高链路预测的准确性。
-
公开(公告)号:CN106960672A
公开(公告)日:2017-07-18
申请号:CN201710203054.1
申请日:2017-03-30
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
IPC: G10L21/0388 , H04S7/00
CPC classification number: G10L21/0388 , H04S7/303
Abstract: 本发明公开了一种立体声音频的带宽扩展方法与装置。该方法包括:将立体声信号分解为直达声和扩散声;按照预设的频带扩展方法对扩散声进行带宽扩展;将直达声分离成多个不同方位的点声源,对多个点声源分别进行带宽扩展,得到带宽扩展后的多个点声源;将带宽扩展后的多个点声源按照预先估计的方位信息进行重新混合,得到带宽扩展后的直达声;根据带宽扩展后的直达声结合带宽扩展后的扩散声重建出宽带立体声音频信号。借助于本发明的技术方案,解决了现有技术中仅根据单个声道重建信号的主观质量实现对信号带宽的扩展,没有考虑到两个声道中信号能量和相位的相关性,其重建立体声信号严重影响了听者对声源位置和距离的判定的问题。
-
公开(公告)号:CN117574412B
公开(公告)日:2024-04-02
申请号:CN202410060420.2
申请日:2024-01-16
Applicant: 国家计算机网络与信息安全管理中心天津分中心 , 国家计算机网络与信息安全管理中心
Inventor: 贾云刚 , 王建礼 , 刘铭 , 许光全 , 李鹏霄 , 崔婧怡 , 刘健 , 段东圣 , 井雅琪 , 赵曦滨 , 赵志云 , 赵淳璐 , 贺欣 , 马宏远 , 张震 , 高一骄 , 武南南 , 孙捷 , 孙海亮 , 刘秀龙
Abstract: 本申请实施例提供一种多方隐私求交方法、装置和电子设备,涉及数据处理技术领域,应用于目标参与方,多个参与方包括目标参与方和其他参与方,该方法包括:依次接收其他参与方发送的多个隐私信息,各隐私信息包括其他参与方的签名信息和第一哈希表数据片段;基于多个隐私信息中的签名信息,对其他参与方的身份进行验证;在其他参与方的身份验证通过的情况下,基于多个第一哈希表数据片段和目标参与方的哈希表数据,确定其他参与方和目标参与方之间的隐私求交结果。这样在计算多个参与方的隐私求交结果时,可以有效地实现隐私求交结果的计算效率和参与方之间的通信效率的平衡。
-
公开(公告)号:CN117632041A
公开(公告)日:2024-03-01
申请号:CN202410102237.4
申请日:2024-01-25
Applicant: 国家计算机网络与信息安全管理中心天津分中心 , 国家计算机网络与信息安全管理中心 , 南开大学
Inventor: 贾云刚 , 刘健 , 刘铭 , 许光全 , 闫莉莉 , 李鹏霄 , 光炫 , 贺欣 , 朱佳伟 , 李晓华 , 赵志云 , 井雅琪 , 吕东 , 马宏远 , 张震 , 段东圣 , 高一骄 , 刘秀龙 , 孙捷 , 孙海亮
IPC: G06F3/06 , G06F11/10 , H04L67/1097
Abstract: 本发明提供一种基于再生码的分布式存储方法、装置和电子设备,属于分布式存储技术领域。该方法包括:获取待存储的原始数据,确定原始数据对应的原始数据向量;确定分布式存储系统中各系统节点的编码矩阵以及分布式存储系统中各校验节点的编码矩阵;基于各系统节点的编码矩阵和原始数据向量分别确定各系统节点存储的第一再生码数据向量;基于各校验节点的编码矩阵和原始数据向量分别确定各校验节点存储的第二再生码数据向量。将第一再生码数据向量发送至对应的系统节点进行存储,将第二再生码数据向量发送至对应的校验节点进行存储。本方案通过以向量为单位进行存储,通信过程中是对每个单位向量整体进行编解码,节约了计算资源。
-
公开(公告)号:CN117574412A
公开(公告)日:2024-02-20
申请号:CN202410060420.2
申请日:2024-01-16
Applicant: 国家计算机网络与信息安全管理中心天津分中心 , 国家计算机网络与信息安全管理中心
Inventor: 贾云刚 , 王建礼 , 刘铭 , 许光全 , 李鹏霄 , 崔婧怡 , 刘健 , 段东圣 , 井雅琪 , 赵曦滨 , 赵志云 , 赵淳璐 , 贺欣 , 马宏远 , 张震 , 高一骄 , 武南南 , 孙捷 , 孙海亮 , 刘秀龙
Abstract: 本申请实施例提供一种多方隐私求交方法、装置和电子设备,涉及数据处理技术领域,应用于目标参与方,多个参与方包括目标参与方和其他参与方,该方法包括:依次接收其他参与方发送的多个隐私信息,各隐私信息包括其他参与方的签名信息和第一哈希表数据片段;基于多个隐私信息中的签名信息,对其他参与方的身份进行验证;在其他参与方的身份验证通过的情况下,基于多个第一哈希表数据片段和目标参与方的哈希表数据,确定其他参与方和目标参与方之间的隐私求交结果。这样在计算多个参与方的隐私求交结果时,可以有效地实现隐私求交结果的计算效率和参与方之间的通信效率的平衡。
-
-
-
-
-
-
-
-
-