-
公开(公告)号:CN117301062A
公开(公告)日:2023-12-29
申请号:CN202311381456.2
申请日:2023-10-23
Applicant: 科大讯飞股份有限公司
IPC: B25J9/16
Abstract: 本申请实施例公开了一种机械臂控制方法、装置、设备及存储介质,在获得包含目标物体和待控制的机械臂的图像后,基于图像获得目标物体的点云数据,以及灵巧手的目标夹爪位姿,然后基于强化学习训练得到的电机控制模型直接对机械臂中的各个电机的输出扭矩进行多次调节,从而控制灵巧手逐步向目标物体移动,直至灵巧手到达目标夹爪位姿,且灵巧手不会碰到目标物体,在灵巧手到达目标夹爪位姿时,再触发灵巧手执行抓握动作,使得灵巧手抓住目标物体。本申请通过引入强化学习训练得到的电机控制模型直接对机械臂中的电机进行控制,不再调用优化算法先规划路径再对机械臂中的电机进行控制,从而提高对机械臂的控制精度,进而提高机械臂的抓取成功率。
-
公开(公告)号:CN116628141B
公开(公告)日:2023-12-01
申请号:CN202310907630.6
申请日:2023-07-24
Applicant: 科大讯飞股份有限公司
IPC: G06F16/33 , G06F40/186
Abstract: 本申请实施例公开了一种信息处理方法、装置、设备及存储介质,工作流的目标任务节点接收到输入信息时,获得目标任务节点对应的至少一个指示指令模板;目标任务节点在上述至少一个指示指令模板中的预设槽位中填充目标任务节点对应的信息,得到目标任务节点对应的至少一个目标指示指令;目标任务节点基于上述至少一个目标指示指令和输入信息调用自然语言处理模型,以获得自然语言处理模型输出的适配工作流的结构化信息。基于本申请实现了自然语言处理模型的输出与工作流相适配的目的。
-
公开(公告)号:CN116644212A
公开(公告)日:2023-08-25
申请号:CN202310908926.X
申请日:2023-07-24
Applicant: 科大讯飞股份有限公司
IPC: G06F16/783 , G06F16/71 , G06V20/40 , G06V20/62
Abstract: 本申请公开了一种视频检测方法、装置、设备及可读存储介质。在确定待检测视频以及待对比视频之后;先确定待检测视频的文本片段信息;待检测视频的每个文本片段信息包括一个文本信息,以及文本信息的时间戳;然后,获取待对比视频的文本片段信息;待对比视频的每个文本片段信息包括一个文本信息,以及文本信息的时间戳;最后,比较待检测视频的文本片段信息以及待对比视频的文本片段信息,确定待检测视频与待对比视频是否重复。基于该方案,由于视频的文本片段,相对于视频的图像帧来说,数量要少很多,而且,文本片段信息仅仅包含文本信息和其时间戳,比对文本片段信息相对于比对图像帧要更为简单,因此,采用本方案能够提升视频检测的效率。
-
公开(公告)号:CN115938342A
公开(公告)日:2023-04-07
申请号:CN202211435210.4
申请日:2022-11-16
Applicant: 科大讯飞股份有限公司
Abstract: 本公开提供了一种语音处理方法、装置、电子设备及存储介质,涉及语音合成技术领域。该方法包括获取第一语音的声音特征;根据第一语音的声音特征,将第一语音的转写文本转换为第二语音,第二语音的声音特征与第一语音的声音特征相同,且第二语音的语种与第一语音的语种不同。本公开实施例能够使不同语种的语音在转换过程中,保留原始说话人的声音特征,以便听众能够根据不同的声音特征区分不同的说话人。
-
公开(公告)号:CN106847263B
公开(公告)日:2020-09-11
申请号:CN201710024211.2
申请日:2017-01-13
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种演讲水平评价方法和装置及系统,该方法包括:接收待评价的演讲语音数据;对所述演讲语音数据进行语音识别,得到识别文本数据;分别对所述演讲语音数据和所述识别文本数据进行特征提取,得到演讲评价特征,所述演讲评价特征包括:声学演讲评价特征和语义演讲评价特征;根据所述演讲评价特征和预先构建的演讲水平评价模型,对所述演讲语音数据的演讲水平进行评价,得到演讲水平的评价结果。该方法能够在评价演讲水平时,无需人工参与,从而提高实用性、客观性和准确性,以及降低成本。
-
公开(公告)号:CN105427858B
公开(公告)日:2019-09-03
申请号:CN201510752871.3
申请日:2015-11-06
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种实现语音自动分类的方法及系统,该方法包括:接收待分类语音数据;对待分类语音数据进行语音识别,得到识别文本;对所述待分类语音数据进行声学分析,得到声学上的分类特征;对所述识别文本进行内容分析,得到内容上的分类特征;利用所述声学上的分类特征、内容上的分类特征、以及预先构建的语音分类模型对所述待分类语音数据进行分类,得到所述待分类语音数据所属类型。利用本发明,可以减少人工工作量,并提高语音数据分类的准确率。
-
公开(公告)号:CN105336342B
公开(公告)日:2019-05-28
申请号:CN201510796906.3
申请日:2015-11-17
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种语音识别结果评价方法及系统,该方法包括:对语音数据进行端点检测,得到各有效语音段;对各有效语音段进行语音识别,得到各有效语音段对应的识别文本段;提取各识别文本段的评价特征;利用预先构建的识别结果评价模型及所述评价特征对各识别文本段进行评价,得到各识别文本段的评价结果;抽查所述评价结果的准确率,并且如果有准确率低于设定阈值的评价结果,则结合人工评价对全部或部分识别文本段的评价结果进行修正;修正结束后,输出最终评价结果。利用本发明,可以减少人工工作量,并提高语音数据识别结果评价的准确率。
-
公开(公告)号:CN108764855A
公开(公告)日:2018-11-06
申请号:CN201810570415.0
申请日:2018-06-05
Applicant: 科大讯飞股份有限公司
IPC: G06Q10/10
CPC classification number: G06Q10/1093
Abstract: 本公开提供一种日程表生成方法及装置、存储介质、电子设备。该方法包括:获取待处理事件的初始日程表,所述初始日程表用于记录所述待处理事件对应的人员、地点、以及内容在至少两个时间单元内的局部映射关系;获取所述初始日程表对应预设规则的代价矩阵,所述代价矩阵中元素的代价值用于表示该元素对应的时间单元内的局部映射关系是否满足所述预设规则;调整所述初始日程表中的局部映射关系,直至调整得到的日程表对应的代价矩阵满足预设条件,作为新的日程表。如此方案,受日程复杂度、人为经验的影响较小,有助于提高日程表的生成效率以及生成效果。
-
公开(公告)号:CN107507627A
公开(公告)日:2017-12-22
申请号:CN201610425701.9
申请日:2016-06-14
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种语音数据热度分析方法及系统,该方法包括:接收语音数据;对所述语音数据进行端点检测,得到所述语音数据中的各有效语音段和非有效语音段;对所述有效语音段进行语音识别,得到对应所述有效语音段的识别文本;对各有效语音段提取基于声学上的热度特征;根据各有效语音段及其对应的识别文本提取各有效语音段基于内容上的热度特征;利用所述基于声学上的热度特征和基于内容上的热度特征、以及预先构建的热度预测模型,计算各有效语音段的第一热度值。利用本发明,可以提高语音数据热度分析的准确性。
-
公开(公告)号:CN105895085A
公开(公告)日:2016-08-24
申请号:CN201610200600.1
申请日:2016-03-30
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种多媒体转写方法,应用于多媒体转写系统中,包括以下步骤:S1、接收演示文稿,并构建所述演示文稿的关键信息树;S2、接收语音数据,并对所述语音数据进行语音识别,得到所述语音数据的转写文本;S3、通过所述关键信息树将所述语音数据和所述转写文本与所述演示文稿进行同步;S4、将同步后带有所述语音数据和所述转写文本的演示文稿显示给用户。用户在看演示文稿时可以同时听到演讲人的声音,看到演讲人声音转写的文本;进一步地,根据每页演示文稿包含的子主题对转写文本分段,同一个子主题的转写文本作为一段,不同子主题的转写文本作为不同的段,可以方便用户理解转写文本,进一步提高了用户体验。
-
-
-
-
-
-
-
-
-