-
公开(公告)号:CN117854507A
公开(公告)日:2024-04-09
申请号:CN202311757128.8
申请日:2023-12-19
Applicant: 科大讯飞股份有限公司
IPC: G10L15/26 , G10L21/0208 , G10L21/10 , G06V40/16
Abstract: 本申请提供一种语音识别方法、装置、电子设备及存储介质,所述方法包括:采集目标场景下的视频图像和语音信息,并对所述视频图像进行图像切割和人脸检测,获得每个人脸的唇部区域;根据所述语音信息和所述唇部区域,确定目标对象的语音片段,所述语音片段用于表示语音和唇部运动的关联性;将每个目标对象的语音片段从背景语音中分离出干净语音,并对所述干净语音进行语音识别以将其转换为语音识别文本。本申请可以在复杂噪声场景中提高语音识别的准确性。
-
公开(公告)号:CN117435484A
公开(公告)日:2024-01-23
申请号:CN202311381153.0
申请日:2023-10-23
Applicant: 科大讯飞股份有限公司
IPC: G06F11/36
Abstract: 本发明提供一种代码检错方法、装置、一体机和程序产品,其中方法包括:获取目标代码;对所述目标代码进行规则检错,和/或,对所述目标代码进行代码修复,得到所述目标代码的预检错信息;基于所述预检错信息,对所述目标代码进行代码检错。本发明提供的方法、装置、一体机和程序产品,通过对目标代码进行规则检错和/或代码修复,以获取能够辅助定位代码错误的预检错信息,并基于预检错信息进行代码检错,从而为代码检错提供丰富的提示,由此在实现自动化的代码检错的前提下,有效提高代码检错的可靠性和准确率。
-
公开(公告)号:CN116628508B
公开(公告)日:2023-12-01
申请号:CN202310893103.4
申请日:2023-07-20
Applicant: 科大讯飞股份有限公司
IPC: G06F18/214
Abstract: 本申请公开了一种模型训练过程异常检测方法、装置、设备及存储介质,方法包括:在模型并行训练过程中,按照设定周期记录训练效率数据,该训练效率数据表示在一个周期内集群中各设备节点对训练数据的使用效率。当集群中存在异常的设备节点时,该异常设备节点对训练数据的读取、使用效率会大大降低,导致整个周期内记录的训练效率数据也偏离正常值,因此,本申请基于当前周期的训练效率数据,确定集群在当前周期是否出现异常,可以及时准确地发现集群的异常。在确定集群在当前周期出现异常时,可以进一步启动进程进行通信异常分析,从而确定异常通信的设备节点,协助快速发现问题节点。
-
公开(公告)号:CN116955430A
公开(公告)日:2023-10-27
申请号:CN202310678673.1
申请日:2023-06-07
Applicant: 科大讯飞股份有限公司
IPC: G06F16/2457 , G06N3/08
Abstract: 本申请公开了一种需求反馈方法、系统及相关装置,该方法包括:获取用户输入的需求内容以及所述用户对应的用户信息;基于所述需求内容以及所述用户信息,确定待分析内容;其中,所述待分析内容包括需求内容以及所述用户信息中的至少部分;将所述待分析内容输入智能分析模型,得到所述智能分析模型输出的与所述需求内容匹配的目标反馈内容。通过上述方式,本申请能够提高获得目标反馈内容的效率和准确性。
-
公开(公告)号:CN116954461A
公开(公告)日:2023-10-27
申请号:CN202310678636.0
申请日:2023-06-07
Applicant: 科大讯飞股份有限公司
IPC: G06F3/0488 , G06F3/0481 , G06F3/0484 , G06N3/0464 , G06N3/08 , G06F18/25
Abstract: 本申请公开了一种交互响应方法及相关装置、电子设备和存储介质,其中,交互响应方法包括:获取用户在交互界面输入的请求数据;其中,请求数据输入至后台运行的人工智能模型,人工智能模型输出请求数据的第一反馈数据及其第一判断结果,第一判断结果表征第一反馈数据能否响应请求数据;并响应于第一反馈数据不能响应请求数据,获取由请求数据分析得到的查询数据,并获取基于查询数据联网获取到的参考数据,及获取人工智能模型基于参考数据输出的第二反馈数据;再在交互界面显示第二反馈数据,以响应请求数据。上述方案,能够在提升交互响应速率的同时,提高交互响应的准确性。
-
公开(公告)号:CN116932888A
公开(公告)日:2023-10-24
申请号:CN202310678638.X
申请日:2023-06-07
Applicant: 科大讯飞股份有限公司
IPC: G06F16/9535 , G06F3/0484 , G06F3/0488
Abstract: 本申请公开了一种任务推荐方法及相关装置、电子设备和存储介质,其中,任务推荐方法包括:获取用户关于目标任务的描述数据,并获取目标任务的第一推荐数据和完成数据;其中,第一推荐数据和完成数据至少基于描述数据分析得到,第一推荐数据包括是否存在与目标任务关联的第一推荐任务,再显示完成数据,并响应于第一推荐数据包括存在与目标任务关联的第一推荐任务,显示用于供用户开启第一推荐任务的交互控件。上述方案,能够提升任务触发的精度和效率。
-
公开(公告)号:CN116627659A
公开(公告)日:2023-08-22
申请号:CN202310899664.5
申请日:2023-07-21
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种模型检查点文件保存方法、装置、设备及存储介质,本申请在确定需要保存检查点checkpoint文件时,为了避免单节点网卡或磁盘IO拥塞问题,引入了负载均衡机制,将模型分割后的各个部分的checkpoint文件保存任务分散到多个不同的设备节点上,控制不同的设备节点采用并行处理的方式执行本设备节点的checkpoint文件保存任务,这样可以充分利用各设备节点的资源,避免单节点网卡或磁盘IO拥塞,提高保存效率。
-
公开(公告)号:CN116610775A
公开(公告)日:2023-08-18
申请号:CN202310893553.3
申请日:2023-07-20
Applicant: 科大讯飞股份有限公司
IPC: G06F16/33
Abstract: 本申请实施例公开了一种人机交互方法、装置、设备及存储介质,获得输入的交互信息后,在文本库中查找与交互信息关联的多个文本片段,对交互信息和多个文本片段进行处理,生成交互信息的应答信息,输出应答信息。由于应答信息是基于文本库中与交互信息关联的多个文本片段生成的,因此,应答信息中携带了文本库中多个文本片段中的知识内容,也就是说,本申请提供了一种自动从文本库中提取知识内容的方法,从而提高获得知识内容的效率。
-
公开(公告)号:CN116013303A
公开(公告)日:2023-04-25
申请号:CN202211644564.X
申请日:2022-12-20
Applicant: 科大讯飞股份有限公司
Abstract: 本发明涉及音频处理技术领域,提供一种音频优化方法、装置、电子设备和存储介质,其中方法包括:对获取到的待优化音频进行语音转写,得到所述待优化音频的转写文本;基于所述转写文本的语义特征,对所述转写文本进行目标优化点检测,得到目标文本对应的目标音频段和针对所述目标音频段的优化建议;基于所述目标音频段和针对所述目标音频段的优化建议,对所述待优化音频进行优化。本发明提供的音频优化方法、装置、电子设备和存储介质,无需人工进行音频回听,能够快速准确定位到音频中需要优化的目标音频段。并能够自动进行优化处理,无需人工进行重录或编辑,可以提高音频优化效率的同时,降低了使用者的学习成本。
-
公开(公告)号:CN107562760B
公开(公告)日:2020-11-17
申请号:CN201610513351.1
申请日:2016-06-30
Applicant: 科大讯飞股份有限公司
IPC: G06F16/30 , G06F16/68 , G06F40/279 , G10L15/26 , G10L25/78
Abstract: 本发明实施例提供了一种语音数据处理方法及装置,其中方法主要包括:将语音数据转换为语音文本;获取所述语音文本的篇章结构信息;对所述语音文本进行段落划分;提取每个段落的结构特征;根据每个段落的结构特征及预设的结构判断模型确定每个段落所属的篇章;标识出各语音数据片段所属的篇章,以实现所述语音数据的结构化。在本发明中,根据获知的篇章结构信息(例如会议的流程安排等)判断出每段内容属于哪个篇章(例如属于会议流程里的哪个环节),从而梳理出语音数据的结构。这样无需再从头到尾、盲目地聆听整个语音数据,而是可以在结构化的语音数据中直接根据各语音数据片段所属的篇章来缩小查找范围,快速定位到目标内容。
-
-
-
-
-
-
-
-
-