-
公开(公告)号:CN114267333A
公开(公告)日:2022-04-01
申请号:CN202111509949.0
申请日:2021-12-10
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 讯飞智元信息科技有限公司
IPC: G10L15/00 , G10L15/06 , G06F40/126 , G06F40/242
Abstract: 本发明公开了一种混合双语语音识别方法及系统,所述方法包括如下步骤:数据处理步骤,包括:对一定量的目标双语音频数据和目标双语文本语料执行BPE共享词典制作、数据增广和特征提取操作,为后端网络训练提供有效数据输入;Encoder‑Decoder训练步骤,包括:对所述数据处理步骤获得的有效数据采用Transformer结构训练语音识别器。本发明涉及双语混合连续语音识别技术领域。根据输入的目标语种的单语语音数据、双语混合语音数据或者双语混杂语音数据,自动转写出语音的内容信息。
-
公开(公告)号:CN114265932A
公开(公告)日:2022-04-01
申请号:CN202111530106.9
申请日:2021-12-10
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 讯飞智元信息科技有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/211 , G06F40/284 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明公开一种融入深度语义关系分类的事件脉络生成方法及系统,所述方法包括如下步骤:对新闻数据集合进行分词,合并后生成词文档序列;训练主题模型,利用训练好的主题模型来完成主题的聚类,得到主题聚类结果;将所有的关键词拼接后输入到bert模型中,最终的新闻文本向量表示为所有token的向量的平均;对于每个主题下获得的所有事件进行分支确定,得到每个主题对应的分支集合,将每个分支中的事件按照时间先后顺序连接,并将分支也按照时间先后顺序连接,即按照分支中最早事件的时间先后顺序连接,最终获得事件脉络。本发明通过结合基于主题模型的文本聚类方法和基于深度语义的事件聚类方法完成事件脉络的生成过程。
-
公开(公告)号:CN115910104A
公开(公告)日:2023-04-04
申请号:CN202211567062.1
申请日:2022-12-07
Applicant: 讯飞智元信息科技有限公司 , 甘肃省国家安全特种技术重点实验室
Abstract: 本发明提供一种伪造语音检测方法、装置、电子设备和存储介质,其中方法包括:确定待检测的语音;将语音输入至语音检测模型中,得到语音检测模型输出的语音检测结果,语音检测结果为真实语音和伪造语音中的一种;其中,语音检测模型是根据样本语音对进行对比训练得到,样本语音对包含真实语音样本和伪造语音样本,真实语音样本和伪造语音样本的文本信息和声学特征相同。提高语音真伪检测的准确性和通用性。
-
公开(公告)号:CN116386664A
公开(公告)日:2023-07-04
申请号:CN202211567068.9
申请日:2022-12-07
Applicant: 讯飞智元信息科技有限公司 , 甘肃省国家安全特种技术重点实验室
Abstract: 本申请公开了一种语音伪造检测方法、装置、系统及存储介质,所述方法包括以下步骤:获取待检测语音数据;提取所述待检测语音数据的多分辨率声学特征;将所述待检测语音数据的多分辨率声学特征输入到已训练的自编码模型中,以获得所述待检测语音数据的重构误差得分;将所述待检测语音数据的重构误差得分与预设的得分阈值进行比较,以获得语音伪造检测结果。根据本申请公开的语音伪造检测方法、装置、系统及存储介质,实现了语音伪造检测,提高了用于语音检测的自编码模型的泛化能力和鲁棒性。
-
-
-