-
公开(公告)号:CN114299225B
公开(公告)日:2025-04-04
申请号:CN202111524469.1
申请日:2021-12-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种动作图像生成方法、模型构建方法、计算机设备及存储介质,其中,该模型构建方法包括:获取目标人物的第一图像集和第二图像集,第一图像集和第二图像集包括关于目标人物动作的序列图像;根据第一图像集的序列图像进行三维重建,得到多个第一3D模型;获取目标人物的纹理图,根据纹理图对所述多个第一3D模型进行贴图,得到多个纹理贴图;对多个第一3D模型进行投影,得到多个2D投影图像;根据第二图像集的序列图像、2D投影图像和纹理贴图构建动作生成模型。该动作生成模型可以生成更为真实的动作图像,即动作图像包括更多细节,由此可以提高用户的体验度。
-
公开(公告)号:CN107305541B
公开(公告)日:2021-05-04
申请号:CN201610256898.8
申请日:2016-04-20
Applicant: 科大讯飞股份有限公司
IPC: G06F40/211 , G06F40/30 , G10L15/04 , G10L15/02
Abstract: 本发明公开了一种语音识别文本分段方法及装置,该方法包括:对语音数据进行端点检测,得到各语音段及各语音段的开始帧序号和结束帧序号;对各语音段进行语音识别,得到各语音段对应的识别文本;提取各语音段对应的识别文本的分段特征;利用提取的分段特征以及预先构建的分段模型,对所述语音数据对应的识别文本进行分段检测,以确定需要分段的位置;根据分段检测结果对所述语音数据对应的识别文本进行分段。本发明可以自动地实现对识别文本进行分段,使识别文本的篇章结构更加清晰。
-
公开(公告)号:CN117824692A
公开(公告)日:2024-04-05
申请号:CN202311869346.0
申请日:2023-12-28
Applicant: 科大讯飞股份有限公司
IPC: G01C21/34
Abstract: 本发明提供一种路径规划方法、装置、电子设备和存储介质,涉及机器人技术领域,其中方法包括:获取目标区域对应的全局栅格代价地图和所述目标区域的子区域对应的局部栅格代价地图;所述全局栅格代价地图的分辨率低于所述局部栅格代价地图的分辨率;将所述局部栅格代价地图嵌入至所述全局栅格代价地图中,得到双分辨率栅格代价地图;基于所述双分辨率栅格代价地图进行路径规划,得到目标路径。本发明是基于全局栅格代价地图和局部栅格代价地图组成的双分辨率栅格代价地图进行路径规划,提高了双分辨率栅格代价地图的精度,进一步提高了路径规划的准确性。
-
公开(公告)号:CN117824691A
公开(公告)日:2024-04-05
申请号:CN202311869344.1
申请日:2023-12-28
Applicant: 科大讯飞股份有限公司
IPC: G01C21/34
Abstract: 本发明提供一种路径规划方法、装置、机器人和存储介质,涉及机器人技术领域,其中方法包括:在机器人基于第一导航路线行驶的过程中,在检测到所述机器人处于停止状态的情况下,基于所述机器人的第一当前停止位置和目标位置重新规划第二导航路线;基于所述第一导航路线和所述第二导航路线,确定是否存在第一目标点,所述第一目标点用于表征透明障碍物;在存在所述第一目标点的情况下,基于所述第一目标点的位置,在地图中标记所述第一目标点;所述第一目标点为所述机器人在基于标记后的地图规划新的导航路线时规避的点。本发明能够避免机器人在透明障碍物环境中反复循环导航,提高了导航效率。
-
公开(公告)号:CN114299225A
公开(公告)日:2022-04-08
申请号:CN202111524469.1
申请日:2021-12-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种动作图像生成方法、模型构建方法、计算机设备及存储介质,其中,该模型构建方法包括:获取目标人物的第一图像集和第二图像集,第一图像集和第二图像集包括关于目标人物动作的序列图像;根据第一图像集的序列图像进行三维重建,得到多个第一3D模型;获取目标人物的纹理图,根据纹理图对所述多个第一3D模型进行贴图,得到多个纹理贴图;对多个第一3D模型进行投影,得到多个2D投影图像;根据第二图像集的序列图像、2D投影图像和纹理贴图构建动作生成模型。该动作生成模型可以生成更为真实的动作图像,即动作图像包括更多细节,由此可以提高用户的体验度。
-
公开(公告)号:CN107305541A
公开(公告)日:2017-10-31
申请号:CN201610256898.8
申请日:2016-04-20
Applicant: 科大讯飞股份有限公司
CPC classification number: G06F17/271 , G06F17/2785 , G10L15/02 , G10L15/04
Abstract: 本发明公开了一种语音识别文本分段方法及装置,该方法包括:对语音数据进行端点检测,得到各语音段及各语音段的开始帧序号和结束帧序号;对各语音段进行语音识别,得到各语音段对应的识别文本;提取各语音段对应的识别文本的分段特征;利用提取的分段特征以及预先构建的分段模型,对所述语音数据对应的识别文本进行分段检测,以确定需要分段的位置;根据分段检测结果对所述语音数据对应的识别文本进行分段。本发明可以自动地实现对识别文本进行分段,使识别文本的篇章结构更加清晰。
-
公开(公告)号:CN309124948S
公开(公告)日:2025-02-18
申请号:CN202430243753.X
申请日:2024-04-26
Applicant: 科大讯飞股份有限公司
Abstract: 1.本外观设计产品的名称:电子设备的智能体对话交互应用图形用户界面。
2.本外观设计产品的用途:用于一种电子设备。
3.本外观设计产品的设计要点:在于图形用户界面中的界面内容。
4.最能表明设计要点的图片或照片:设计1主视图。
5.指定设计1为基本设计。
6.图形用户界面的用途:用于基于智能体对话交互,根据用户对话内容,对用户意图做相关的任务规划。
7.图形用户界面的人机交互方式:设计1主视图界面中心为智能体卡片,智能体卡片可根据所需领域、类型进行选择,在该界面中点击任意一个智能体卡片进入设计1变化状态图1,界面右侧的“智能体介绍”下方呈现该智能体概述介绍,“智能体技能”下方呈现该智能体具备的技能和知识,界面中心智能体大图标下方显示该智能体的推荐引导问题,可点击任意一条引导问题对话体验,界面底部为对话框,可在该对话框中直接输入内容或点击该对话框右侧的麦克风图标通过语音输入内容,输入完成后点击麦克风图标右边的箭头图标进入设计1变化状态图2,智能体根据用户的输入内容,对用户意图做相关的任务规划。
设计2主视图界面中心为智能体卡片,智能体卡片可根据所需领域、类型进行选择,在该界面中点击任意一个智能体卡片进入设计2变化状态图1,界面右侧的“智能体介绍”下方呈现该智能体概述介绍,“智能体技能”下方呈现该智能体具备的技能和知识,界面中心智能体大图标下方显示该智能体的推荐引导问题,可点击任意一条引导问题对话体验,界面底部为对话框,可在该对话框中直接输入内容或点击该对话框右侧的麦克风图标通过语音输入内容,输入完成后点击麦克风图标右边的箭头图标进入设计2变化状态图2,智能体根据用户的输入内容,对用户意图做相关的任务规划。
8.其他需要说明的情形:设计2请求保护色彩。
-
-
-
-
-
-