-
公开(公告)号:CN117708290A
公开(公告)日:2024-03-15
申请号:CN202311693723.X
申请日:2023-12-06
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/38 , G06N5/022 , G06F40/30 , G06F16/33
Abstract: 本发明提供一种问答方法、装置、电子设备和存储介质,其中方法包括:获取待查询问题;基于预设向量检索库,获取所述待查询问题相关的至少一个目标片段向量,所述预设向量检索库基于知识库中各文档的文本内容构建得到;基于所述知识库,获取各目标片段向量对应的上下文,并将获得的所述各目标片段向量对应的上下文进行合并,得到参考文本;基于所述参考文本,获取所述待查询问题的回答结果。本发明提供的方法、装置、电子设备和存储介质,可以实现可用的跨多篇文档内容的知识问答功能,同时确保回答结果的全面性和准确性。
-
公开(公告)号:CN116631447B
公开(公告)日:2023-12-01
申请号:CN202310909882.2
申请日:2023-07-24
Applicant: 科大讯飞股份有限公司
IPC: G10L25/57 , G10L25/78 , G10L15/22 , H04N21/439 , H04N21/44 , H04N21/435
Abstract: 本申请公开了一种噪声提取方法、装置、设备及可读存储介质,在获取待进行噪声提取的视频;先确定视频中的各个有效音频片段以及与有效音频片段对应的子视频片段;再针对每个有效音频片段,基于有效音频片段对应的子视频片段的字幕信息,从有效音频片段中提取噪声。在本方案中,考虑到实际应用场景下的有效音频片段中往往包含噪声,在确定有效音频片段之后,进一步利用有效片段对应的子视频片段的字幕信息,确定有效音频片段中是否有噪声,进而实现对有效音频片段中的噪声的提取,因此,能够提升噪声的提取效果。
-
公开(公告)号:CN116628509B
公开(公告)日:2023-12-01
申请号:CN202310900540.4
申请日:2023-07-21
Applicant: 科大讯飞股份有限公司
IPC: G06F18/214
Abstract: 本申请公开了一种模型训练方法、装置、设备及存储介质,方法包括:当确定需要添加新增训练数据时,基于预先构建的batch列表,过滤掉已经训练使用过的batch,得到剩余各batch,避免重复读取已使用的batch迭代训练模型,其中batch列表中按照训练时的读取顺序记录各batch的标识。对于新增训练数据构建成若干batch,将对新增训练数据所构建的各batch与剩余各batch进行随机顺序打乱,并将打乱后的各batch的标识顺序的记录在batch列表中,以便后续按照batch列表顺序读取各标识对应的batch数据,进行在线模型训练,可以最大程度地保持训练数据的分布一致性,提升模型的泛化能力。
-
公开(公告)号:CN116627659B
公开(公告)日:2023-12-01
申请号:CN202310899664.5
申请日:2023-07-21
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种模型检查点文件保存方法、装置、设备及存储介质,本申请在确定需要保存检查点checkpoint文件时,为了避免单节点网卡或磁盘IO拥塞问题,引入了负载均衡机制,将模型分割后的各个部分的checkpoint文件保存任务分散到多个不同的设备节点上,控制不同的设备节点采用并行处理的方式执行本设备节点的checkpoint文件保存任务,这样可以充分利用各设备节点的资源,避免单节点网卡或磁盘IO拥塞,提高保存效率。
-
公开(公告)号:CN117036556A
公开(公告)日:2023-11-10
申请号:CN202310692433.7
申请日:2023-06-09
Applicant: 科大讯飞股份有限公司
IPC: G06T13/40 , G06T13/20 , G10L21/055 , G10L21/10
Abstract: 本发明提供一种虚拟形象驱动方法、装置及机器人,所述方法包括:获取与虚拟形象关联的目标文本;基于虚拟形象对应的提示文本,从目标文本挖掘虚拟形象的驱动信息,提示文本包括虚拟形象的形象描述信息和/或候选驱动信息;基于驱动信息,驱动虚拟形象。本发明提供的虚拟形象驱动方法、装置及机器人,由于提示文本中包含有虚拟形象描述信息和/或候选驱动信息,从而实现针对性指导从目标文本中精确挖掘高度贴合虚拟形象角色的驱动信息,进而基于驱动信息驱动虚拟形象时,虚拟形象所表现的交互行为能够呈现较高的自然度和真实度,为用户带来更好的体验和交互效果。
-
公开(公告)号:CN116629308A
公开(公告)日:2023-08-22
申请号:CN202310908675.5
申请日:2023-07-24
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供了一种神经网络模型的推理方法、装置、设备及存储介质,方法包括:预先将神经网络模型的计算图切分为N个有序的子图,并构建N个串行的处理模块,第i个处理模块包括在第i个GPU上创建的用于执行第i个子图的运算的推理引擎以及用于为该推理引擎调度数据的调度模块,i从1到N;当接收到任务数据时,基于第1个推理引擎对应的调度模块将任务数据分批提供给第1个推理引擎处理,每当第1个推理引擎处理完一批数据,向其提供一批新的数据;基于第j+1个推理引擎对应的调度模块将第j个推理引擎的输出数据提供给第j+1个推理引擎处理,j从1到N‑1。本发明具有较高的推理效率和较大的数据吞吐量,且适用于大模型。
-
公开(公告)号:CN116628508A
公开(公告)日:2023-08-22
申请号:CN202310893103.4
申请日:2023-07-20
Applicant: 科大讯飞股份有限公司
IPC: G06F18/214
Abstract: 本申请公开了一种模型训练过程异常检测方法、装置、设备及存储介质,方法包括:在模型并行训练过程中,按照设定周期记录训练效率数据,该训练效率数据表示在一个周期内集群中各设备节点对训练数据的使用效率。当集群中存在异常的设备节点时,该异常设备节点对训练数据的读取、使用效率会大大降低,导致整个周期内记录的训练效率数据也偏离正常值,因此,本申请基于当前周期的训练效率数据,确定集群在当前周期是否出现异常,可以及时准确地发现集群的异常。在确定集群在当前周期出现异常时,可以进一步启动进程进行通信异常分析,从而确定异常通信的设备节点,协助快速发现问题节点。
-
公开(公告)号:CN106057208B
公开(公告)日:2019-11-15
申请号:CN201610425682.X
申请日:2016-06-14
Applicant: 科大讯飞股份有限公司
IPC: G10L21/013 , G11B20/10
Abstract: 本发明实施例提供了一种音频修正方法及装置,其中方法包括:获取第一音频数据;获取第一音高曲线,所述第一音高曲线为所述第一音频数据的音高曲线;根据第二音高曲线,对所述第一音高曲线依次进行音阶修正及调性修正,以得到修正后的第一音高曲线,其中所述第二音高曲线为与所述第一音频数据相对应的第二音频数据的音高曲线;将修正后的第一音高曲线转换回音频信号,以得到修正后的第一音频数据。以歌曲为例,本发明实施例可以使修正后的用户演唱歌曲音高曲线与原唱歌曲音高曲线的走势保持一致,并且用户演唱歌曲音高曲线的起伏相比修正前更接近原唱歌曲,从而大大提升了用户演唱歌曲的节奏感和听感,提升了对歌曲等音频数据的修正效果。
-
公开(公告)号:CN105280196B
公开(公告)日:2019-03-19
申请号:CN201510810644.1
申请日:2015-11-19
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种副歌检测方法及系统,该方法包括:接收待检测的音频数据;提取所述音频数据的检测特征,所述检测特征包括所述音频数据不同频段的频域能量包络的极值点的频率值及能量值;利用提取的检测特征进行副歌检测,得到检测结果。利用本发明,可以有效提高副歌检测的准确度。
-
公开(公告)号:CN104571915B
公开(公告)日:2018-11-27
申请号:CN201410839870.8
申请日:2014-12-29
Applicant: 科大讯飞股份有限公司
IPC: G06F3/0488 , G06F3/0484 , G06F9/451
Abstract: 本发明提出一种触屏终端中触摸键盘的控制方法和装置,其中,该触屏终端中触摸键盘的控制方法,包括:根据用户的触发指令在触屏终端系统的触摸键盘进程中注入输入法组件,其中,输入法组件用于截取触摸键盘进程的窗口消息;加载个性化键盘控制模块;当输入法组件截取到触摸键盘进程的窗口消息时,通过个性化键盘控制模块对触屏终端的触摸键盘窗口进行控制。本发明的触屏终端中触摸键盘的控制方法,实现了触摸键盘的个性化控制,从而能够提高输入效率,符合用户的输入习惯,并且能够满足用户的个性化需求,提升了用户体验。
-
-
-
-
-
-
-
-
-