-
公开(公告)号:CN112837690B
公开(公告)日:2024-04-16
申请号:CN202011622002.6
申请日:2020-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种音频数据生成方法、音频数据转写方法及其装置,该生成方法包括:先获取待处理音频数据和该待处理音频数据的身份信息,再根据该待处理音频数据和该待处理音频数据的身份信息生成目标音频数据,以使该目标音频数据携带有该待处理音频数据和该待处理音频数据的身份信息。其中,因目标音频数据携带有身份信息,使得后续转写设备能够依据该目标音频数据携带的身份信息来确定该目标音频数据为合法音频数据,如此能够在转写设备中实现音频数据的合法性筛选,从而能够实现转写设备只需转写合法音频数据即可,无需转写非法音频数据,使得转写设备能够及时地对合法音频数据进行转写,如此能够提高该转写设备对合法音频数据的转写实时性。
-
公开(公告)号:CN120070872A
公开(公告)日:2025-05-30
申请号:CN202510533837.0
申请日:2025-04-27
Applicant: 浙江师范大学 , 科大讯飞股份有限公司
IPC: G06V10/25 , G06N3/0464 , G06N3/042 , G06V10/40
Abstract: 本申请公开了一种序列推荐方法、设备及介质,涉及电子数字数据处理领域,该方法包括:基于用户交互序列中物品间的相关性构建Top‑k全局物品图;基于所述用户交互序列生成动态图;采用图卷积网络和卷积神经网络,基于所述动态图,得到长期兴趣信息和短期兴趣信息;基于所述Top‑k全局物品图提取与用户当前感兴趣物品相关的物品特征;基于与用户当前感兴趣物品相关的物品特征、所述长期兴趣信息和所述短期兴趣信息得到物品序列推荐信息。本申请能够提高序列推荐的准确性和实时性。
-
公开(公告)号:CN119416035A
公开(公告)日:2025-02-11
申请号:CN202510018288.3
申请日:2025-01-07
Applicant: 浙江师范大学 , 科大讯飞股份有限公司
IPC: G06F18/241 , G06F18/2415 , G06F40/30 , G06Q50/20 , G06N3/0442 , G06N3/0455 , G06N3/0464 , G06N3/042
Abstract: 本申请公开了一种基于多模态大模型的对话情感识别方法及设备,涉及情感识别领域,该方法包括在当前场景中获取对话中的所有语句集合;每一语句中包括音频、视频和文本三个模态;构建对话情感识别模型;所述对话情感识别模型包括:特征提取层、双向门控单元、多模态大模型、BERT语言模型、模态信息互补模块、基于语义图的多层残差图卷积网络以及全连接层;根据对话中的所有语句集合,采用训练好的对话情感识别模型,得到情感识别结果。本申请能够提高对话情感识别的准确性与稳健性。
-
公开(公告)号:CN116168688A
公开(公告)日:2023-05-26
申请号:CN202211635640.0
申请日:2022-12-19
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种语音识别模型的训练、语音识别方法、装置、设备及介质,其中方法包括:确定非流式识别分支和流式识别分支;获取所述非流式识别分支进行语音识别时提取的样本语音中各帧的第一语音特征,以及所述流式识别分支进行语音识别时提取的所述样本语音中各帧的第二语音特征;对所述各帧的第一语音特征进行聚类,得到多个第一特征簇;将所述各帧的第二语音特征划分至所述多个第一特征簇,并基于所述第二语音特征所属的第一特征簇,确定特征提取损失;基于所述特征提取损失,对所述流式识别分支进行参数迭代,得到所述语音识别模型。本发明提供的方法、装置、电子设备及存储介质,进一步提高流式识别分支的语音识别结果的可靠性和准确性。
-
公开(公告)号:CN112837690A
公开(公告)日:2021-05-25
申请号:CN202011622002.6
申请日:2020-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种音频数据生成方法、音频数据转写方法及其装置,该生成方法包括:先获取待处理音频数据和该待处理音频数据的身份信息,再根据该待处理音频数据和该待处理音频数据的身份信息生成目标音频数据,以使该目标音频数据携带有该待处理音频数据和该待处理音频数据的身份信息。其中,因目标音频数据携带有身份信息,使得后续转写设备能够依据该目标音频数据携带的身份信息来确定该目标音频数据为合法音频数据,如此能够在转写设备中实现音频数据的合法性筛选,从而能够实现转写设备只需转写合法音频数据即可,无需转写非法音频数据,使得转写设备能够及时地对合法音频数据进行转写,如此能够提高该转写设备对合法音频数据的转写实时性。
-
公开(公告)号:CN120070014A
公开(公告)日:2025-05-30
申请号:CN202510550994.2
申请日:2025-04-29
Applicant: 浙江师范大学 , 科大讯飞股份有限公司
IPC: G06Q30/0601 , G06F18/22 , G06F18/25 , G06N3/042 , G06N3/0442
Abstract: 本申请公开了一种基于图表示学习的会话推荐方法、设备、介质及产品,涉及会话推荐技术领域,该方法包括:利用会话数据集和总损失函数,对多视角图表示学习会话推荐初始架构进行训练,得到多视角图表示学习会话推荐架构;获取目标用户与推荐系统进行交互产生的会话;将会话输入到多视角图表示学习会话推荐架构中,得到目标用户的推荐项目序列。本申请通过构建多视角图表示学习会话推荐架构,能够提高物品推荐的合理性和准确性。
-
公开(公告)号:CN118690292A
公开(公告)日:2024-09-24
申请号:CN202410700313.1
申请日:2024-05-31
Applicant: 浙江光电子研究院 , 浙江师范大学 , 科大讯飞股份有限公司
IPC: G06F18/2433 , G06F18/214 , G06F18/213 , G06N3/042 , G06N3/044 , G06N3/0455 , G06N3/0895
Abstract: 本申请公开了一种基于图神经网络的动态图数据异常边检测方法及系统,方法包括:通过动态异常边注入策略对真实动态图数据进行注入异常边处理,得到异常动态图数据;引入局部结构感知机制与门控循环神经网络,构建动态图异常边检测模型;基于动态图异常边检测模型对异常动态图数据进行异常边特征捕捉处理,得到异常边嵌入特征值;通过异常打分机制对异常边嵌入特征值进行异常边区分处理,得到动态图数据异常边检测结果。本申请实施例能够加强对动态图中时间序列数据的理解,充分利用动态图中的局部结构信息,从而提高异常边检测的准确性和效率。本申请可以广泛应用于数据异常边检测技术领域。
-
公开(公告)号:CN117894300A
公开(公告)日:2024-04-16
申请号:CN202311870857.4
申请日:2023-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种样本音频数据的获取方法、语音识别方法及相关装置。该方法包括:获取目标音频数据的标注文本和至少两个参考文本,标注文本是基于目标音频数据的字幕确定的,各参考文本是分别利用不同的语音识别模型对目标音频数据进行识别得到的;基于标注文本和至少两个参考文本之间的比对结果,确定目标音频数据的类型,类型表征标注文本的准确性或者目标音频数据的语音识别难度;对目标音频数据执行与类型匹配的处理,并将经处理后的目标音频数据作为用于对目标语音识别模型进行训练的样本音频数据。上述方案,能够提高获取对目标语言识别模型训练的样本音频数据的效率。
-
公开(公告)号:CN307481093S
公开(公告)日:2022-08-02
申请号:CN202230110556.1
申请日:2022-03-04
Applicant: 科大讯飞股份有限公司
Abstract: 1.本外观设计产品的名称:无线麦克风。
2.本外观设计产品的用途:用于音频无线传输、音频储存、音频播放、音频数据处理等。
3.本外观设计产品的设计要点:在于形状。
4.最能表明设计要点的图片或照片:立体图。 -
-
-
-
-
-
-
-
-