-
公开(公告)号:CN120015037A
公开(公告)日:2025-05-16
申请号:CN202510043397.0
申请日:2025-01-10
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种模型移植和语音任务处理方法、装置、设备、介质及产品,该方法包括:获取原始语音任务处理模型,原始语音任务处理模型在模型训练平台上训练得到,且包括多个节点;确定多个节点中的需保存节点,得到表征语音任务处理模型的拓扑结构的拓扑文件,语音任务处理模型在语音任务处理平台上运行,需保存节点包括参与语音任务处理模型的推理过程,且其输出结果被其他算子节点使用的算子节点,算子节点为执行计算操作的节点;根据拓扑文件生成语音任务处理模型的模型资源文件,模型资源文件用于将语音任务处理模型加载至语音任务处理平台。本申请能够将语音任务处理模型移植至hifi5平台,并在hifi5平台上稳定且高效地运行。
-
公开(公告)号:CN119988559A
公开(公告)日:2025-05-13
申请号:CN202510111040.1
申请日:2025-01-23
Applicant: 科大讯飞股份有限公司
IPC: G06F16/3329 , G16H20/70 , G06F16/334
Abstract: 本申请提出一种基于心理咨询的问答方法、装置、设备和计算机程序产品,该方法能够根据咨询对象的第一问题描述语句,从案例数据库存储的多个问题描述语句中检索与第一问题描述语句关联的第二问题描述语句。通过学习第二问题描述语句和第二问题描述语句对应的第二咨询规划方案,生成第一问题描述语句对应的第一咨询规划方案,以便于根据第一咨询规划方案生成与咨询对象的心理干预对话。如此能够通过学习与咨询对象关联的案例自动生成心理咨询对话,实现自动进行心理咨询问答,用户即使不与专业的心理咨询师进行互动交流也可以得到专业的心理干预,能够覆盖到广大有需求的人群。
-
公开(公告)号:CN119962541A
公开(公告)日:2025-05-09
申请号:CN202510437524.5
申请日:2025-04-09
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/284 , G06F40/242 , G06N5/04 , G06N3/0455
Abstract: 本发明提供一种水印添加方法、水印检测方法及水印添加模型训练方法,涉及计算机视觉技术领域,引入拆分模型,用于根据历史词元确定词元分类参数,使文本生成模型的不同次输出对应的词元字典中相同类别的词元的占比不同,可以适用于多种情况下的生成文本,避免强硬地设置固定占比破坏文本生成模型的生成内容的准确性和可用性,使水印添加效果稳定,进而保证了后续的水印检测效果。而且,还引入偏差模型,以根据历史词元确定词元字典中不同词元类别的概率偏差参数,进而使水印添加模块结合概率偏差参数和词元分类参数对第一词元概率分布进行更新,可以改变词元字典中不同词元类别的词元被选中的概率值,进一步提升后续的水印检测效果。
-
公开(公告)号:CN119962513A
公开(公告)日:2025-05-09
申请号:CN202411893898.X
申请日:2024-12-20
Applicant: 科大讯飞股份有限公司
IPC: G06F40/205 , G06F40/226 , G06Q50/20 , G06F1/18 , G06F1/20 , G06N3/082 , G06F13/40 , G10L15/26
Abstract: 本申请公开了一种试题评分设备、方法、装置、系统和存储介质,试题评分设备用于部署在考场范围内,试题评分设备包括本地接口模块和处理模块,本地接口模块用于与考试设备进行本地连接;处理模块与本地接口模块连接,用于接收考试设备发送的考生针对试题的作答数据,并运行本地大模型对作答数据进行评分,得到考生的评分结果。上述方案,实现直接利用本地大模型评估考生的考试作答,提升了评分的效率。
-
公开(公告)号:CN119961365A
公开(公告)日:2025-05-09
申请号:CN202411967167.5
申请日:2024-12-30
Applicant: 海南声谷科技有限公司 , 科大讯飞股份有限公司 , 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种区域探测方法及相关装置、设备和存储介质,其中,区域探测方法包括:基于待探测区域的环境数据和探测设备的属性数据,构建用于指引探索待探测区域的目标地图;基于目标优化函数,确定各个子区域的探测优先级;其中,目标优化函数包含遍历若干子区域所涉及的至少一项目标指标值;基于探测优先级,得到若干子区域的预规划路径;基于目标地图和探测设备依照预规划路径探索时获取的传感器数据,驱动探测设备探索待探测区域。上述方案,能够在待探测区域环境复杂的情况下,提升探测设备在待探测区域的探索合理性。
-
公开(公告)号:CN119323625B
公开(公告)日:2025-05-09
申请号:CN202411866722.5
申请日:2024-12-18
Applicant: 科大讯飞股份有限公司
IPC: G06T11/60 , G10L13/08 , G06V40/20 , G06F16/732 , G06F16/783
Abstract: 本申请提出一种合成视频的方法、电子设备及计算机程序产品。该合成视频的方法包括:获取包含第一虚拟对象的第一视频以及包含目标虚拟对象的肢体动作的第二视频,针对第一视频,去除目标视频段中第一虚拟对象的目标肢体部位,得到待合成视频,目标视频段为第一视频中对应动作插入时段的视频段;基于第二视频和目标视频段的时序对应关系,将第二视频各视频帧的目标肢体部位拼接到待合成视频各视频帧的目标肢体部位缺失处,生成合成视频。由于第二视频仅包含目标肢体部位,因此,可以做到虚拟对象与肢体动作的解耦。在虚拟对象为虚拟人物的情况下,制作第二视频/动作视频时,无需考虑人物主要身体部位的穿着打扮,甚至无需考虑人物的身份。
-
公开(公告)号:CN114333786B
公开(公告)日:2025-05-09
申请号:CN202111363984.6
申请日:2021-11-17
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音情感识别方法及相关装置、电子设备和存储介质,其中,语音情感识别方法包括:获取待识别语音;利用情感识别网络对待识别语音进行识别,得到待识别语音的情感类别;其中,情感识别网络包含于联合模型,联合模型还包括域识别网络,联合模型是基于情感识别网络对属于第一数据域类别的第一样本语音的情感分类损失以及域识别网络分别对第一样本语音和第二样本语音的域分类损失联合训练得到的,且第二样本语音属于第二数据域类别,第一样本语音标注有样本情感类别。上述方案,能够在具有准确情感类别标注的样本数据较为稀少的情况下,提升语音情感识别的准确性。
-
公开(公告)号:CN119943071A
公开(公告)日:2025-05-06
申请号:CN202510063415.1
申请日:2025-01-15
Applicant: 科大讯飞股份有限公司
IPC: G10L21/02 , G10L21/0208 , G10L25/03 , G10L25/24 , G10L25/30
Abstract: 本申请提供一种语音交互方法、装置、设备、介质及程序产品,该语音交互方法包括:确定第一原始信号的第一置信度和第一语音增强信号的第二置信度;其中,第一语音增强信号是对第一原始信号进行语音增强后得到的信号;基于第一置信度、第二置信度、第二原始信号和第二语音增强信号,确定目标信号;其中,第二语音增强信号是对第二原始信号进行语音增强后得到的信号;基于目标信号,与目标设备进行语音交互。本申请能够减小语音增强带来的语音失真。
-
公开(公告)号:CN119922351A
公开(公告)日:2025-05-02
申请号:CN202411771790.3
申请日:2024-12-04
Applicant: 科大讯飞股份有限公司
IPC: H04N21/234 , G10L25/63 , G10L15/25 , G06T5/50
Abstract: 本申请提出一种视频生成方法、装置、电子设备和计算机程序产品,该方法能够基于复刻对象的音频和参考图像,生成复刻对象的虚拟形象视频。具体可以根据音频和参考图像,生成复刻对象口唇区域的动态图像,结合口唇区域的动态图像、参考图像和音频对应的情绪状态,得到复刻对象的动态图像;或者,从音频和参考图像中提取得到复刻特征,根据复刻特征和音频对应的情绪状态生成复刻对象的动态图像,然后根据音频和复刻对象的动态图像,生成复刻对象的虚拟形象视频,实现复刻特定对象的虚拟形象的目的。
-
公开(公告)号:CN119920443A
公开(公告)日:2025-05-02
申请号:CN202411979903.9
申请日:2024-12-31
Applicant: 安徽影联云享医疗科技有限公司 , 科大讯飞华南人工智能研究院(广州)有限公司 , 讯飞医疗科技股份有限公司 , 科大讯飞股份有限公司
Abstract: 本发明涉及医学影像分析,具体涉及基于多模态大模型的医学影像分析系统,多模态特征提取器,提取当前病例中医学影像的视觉特征信息,以及当前病例中病人信息的文本特征信息,融合视觉特征信息和文本特征信息得到当前病例的多模态特征;多模态RAG模块,根据当前病例的多模态特征从专科临床数据库、典型病例知识库中分别检索与当前病例相关的专科临床知识、典型病例数据,并作为检索增强信息发送给医学影像多模态大模型;医学影像多模态大模型,根据当前病例的多模态特征、检索增强信息,以及反馈与修正建议,提供医学影像分析结果及其相关服务;本发明提供的技术方案能够有效克服现有技术所存在的难以对医学影像进行准确、高效分析的缺陷。
-
-
-
-
-
-
-
-
-