-
公开(公告)号:CN119888652A
公开(公告)日:2025-04-25
申请号:CN202411753371.7
申请日:2024-12-02
Applicant: 科大讯飞股份有限公司
IPC: G06V20/56 , G06V10/147 , G06V10/75 , G06V10/80
Abstract: 本申请提出一种目标检测方法、装置、系统、设备及程序产品,该方法包括:获取当前帧图像中目标区域的第一目标检测结果和至少一组第二目标检测结果,第一目标检测结果是基于当前帧图像确定的,当前帧图像由视觉传感器采集,第二目标检测结果是基于雷达传感器所采集的雷达数据确定的,目标区域是基于视觉传感器的第一检测误差分布信息和雷达传感器的第二检测误差分布信息确定的,并对目标区域的第一目标检测结果和第二目标检测结果进行融合处理,以得到目标区域的目标检测结果。上述的目标检测方案具有更高的目标检测精度,从而能够有效保证环境感知的准确性和鲁棒性。
-
公开(公告)号:CN119741405A
公开(公告)日:2025-04-01
申请号:CN202510260633.4
申请日:2025-03-06
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种动作数据生成方法、装置、设备、存储介质和程序产品,涉及人工智能技术领域,包括:获得目标语音的音频特征以及目标语音对应的文本;基于对文本的语义理解,确定文本中需要数字人同步执行肢体动作的目标文本段,每个目标文本段对应的肢体动作的类别,以及每个目标文本段对应的待生成的骨架动作序列中的各个动作帧的位置编码;对应每个目标文本段,至少将音频特征、该目标文本段对应的肢体动作的类别以及该目标文本段对应的各个动作帧的位置编码作为扩散模型的控制条件,通过扩散模型生成与该目标文本段对应的骨架动作序列。本申请提高了基于骨架动作序列驱动的数字人的肢体动作与语音内容的匹配度。
-
公开(公告)号:CN115480511B
公开(公告)日:2025-03-28
申请号:CN202211129098.1
申请日:2022-09-16
Applicant: 科大讯飞股份有限公司
IPC: G05B19/042 , G06V40/18
Abstract: 本申请公开了一种机器人交互方法、装置、存储介质及设备,该方法包括:首先获取目标用户的人脸图像,然后,利用该目标用户的人脸图像,确定目标用户的视线角度;接着根据目标用户的人脸图像和视线角度,确定目标机器人移动的终点位置信息;进而可以控制目标机器人移动到终点位置。可见,由于本申请是根据用户的视线移动,确定出机器人移动的终点位置,再控制机器人移动到该终点位置,从而能够实现更加精准、便捷的机器人交互,进而提高了交互效果和用户的交互体验。
-
公开(公告)号:CN119380207A
公开(公告)日:2025-01-28
申请号:CN202411212407.0
申请日:2024-08-30
Applicant: 科大讯飞股份有限公司
IPC: G06V20/13 , G06V20/17 , G06V10/143 , G06V10/82 , G06V10/80 , G06N3/0455 , G06N3/0464 , G06N3/0442
Abstract: 本申请公开了一种地块变化检测方法及相关装置、设备和存储介质,其中,地块变化检测方法包括:基于目标地块在不同时间的目标拍摄图像,生成第一编码特征,以及基于关于目标拍摄图像的目标问题语句,生成第二编码特征;其中,第一编码特征与第二编码特征两者的特征维度一致;基于第一编码特征和第二编码特征进行解码,得到用于回答目标问题语句的目标回答语句。上述方案,能够提升表征地块变化情况的目标回答语句的生成效果。
-
公开(公告)号:CN119206870A
公开(公告)日:2024-12-27
申请号:CN202411343977.3
申请日:2024-09-25
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种跳绳动作评估方法、装置、系统、服务器和存储介质,应用于图像处理技术领域,该方法包括:获取目标用户的跳绳视频;确定所述跳绳视频的各帧图像中所述目标用户的骨骼点信息;基于各帧所述图像中所述目标用户的骨骼点信息,确定目标信息,所述目标信息包括所述目标用户的落地分布、跳绳姿态和跳绳计数结果中的至少两个;基于所述落地分布、所述跳绳姿态和所述跳绳计数结果中的至少两个信息,对所述目标用户的跳绳动作进行评估。本发明提供的跳绳动作评估方法、装置、系统、服务器和存储介质,实现了从多个维度对用户的跳绳动作进行评估的目的,提高了评估结果的全面性。
-
公开(公告)号:CN114173067B
公开(公告)日:2024-07-12
申请号:CN202111574773.7
申请日:2021-12-21
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种视频生成方法、装置、设备及存储介质,该方法包括:通过从预先构建的视频资源库中确定与视频剧本中的各个剧本关键词相匹配的视频资源,确定与各个剧本关键词一一对应的各个播放标签;所述播放标签中至少包括与剧本关键词相匹配的视频资源的索引信息;根据各个播放标签对应的视频资源,确定特效标签;所述特效标签中包括视频资源播放特效标签和/或相邻视频资源之间的视频转场特效标签;至少根据各个播放标签和所述特效标签进行视频剪辑处理,得到视频文件。采用该方法能够自动生成视频文件,从而能够降低视频制作的人力成本和时间成本。
-
公开(公告)号:CN112734895B
公开(公告)日:2024-07-05
申请号:CN202011643370.9
申请日:2020-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种三维人脸处理方法包括:重建视频序列中的三维人脸,以获取三维人脸参数集;以及使用三维人脸对应的二维人脸图像纹理,为所述三维人脸参数集添加时域约束,并优化所述三维人脸参数集,以使得所述三维人脸参数集在时域上与二维人脸图像纹理满足预设条件,其中所述时域约束由二维图像纹理的一致性表征。本申请还提供了相应的电子设备。通过上述方案,本申请保证重建后的三维人脸参数的时域连续,并保证三维人脸参数稳定平滑,并且不会造成迟滞问题。
-
公开(公告)号:CN118212519A
公开(公告)日:2024-06-18
申请号:CN202410254010.1
申请日:2024-03-06
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种机器人及其地图分区方法、装置、可读存储介质及计算机程序产品,即便是针对复杂的大型场景,也可以通过图像传感器采集的二维图像识别出门槛区域,并且配合深度传感器采集的点云数据对该门槛区域进行精细化修正,得到更加准确的门槛区域,将识别出的门槛区域映射到环境地图上,即可基于环境地图上的门信息及房间闭合性对环境地图进行准确的分区,提升了地图分区的准确性。此外,本申请方案对处理器算力要求较低,可以更加方便地部署于边缘设备上,如部署在机器人本地或与机器人通信的终端设备,如智能音响等。
-
公开(公告)号:CN112669424B
公开(公告)日:2024-05-31
申请号:CN202011552776.6
申请日:2020-12-24
Applicant: 科大讯飞股份有限公司
IPC: G06T13/80
Abstract: 本申请提供了一种表情动画生成方法、装置、设备及存储介质,其中,方法包括:获取目标图片和目标驱动数据,目标图片为指定动画人物的图片,目标驱动数据为决定指定动画人物脸部动作的数据;根据目标图片获取动画特征点,作为目标图片对应的参考信息;建立目标图片对应的参考信息与目标图片的目标映射关系;基于目标图片、目标驱动数据、目标图片对应的参考信息和目标映射关系,生成指定动画人物的表情动画。本申请提供的表情动画方法可基于指定动画人物的图片以及决定指定动画人物脸部动作的驱动数据自动生成指定动画人物的表情动画,由于动画的生成过程不需要人工参与,因此,节省了人工成本,降低了时间成本,提高了动画生成效率。
-
公开(公告)号:CN112465931B
公开(公告)日:2024-05-31
申请号:CN202011405952.3
申请日:2020-12-03
Applicant: 科大讯飞股份有限公司
IPC: G06T11/40
Abstract: 本申请公开了一种图像文本抹除方法、相关设备及可读存储介质,在获取待抹除文本图像之后,利用该待抹除文本图像中的前景像素点以及背景像素点,确定该待抹除文本图像中的待抹除像素点,然后对待抹除像素点进行抹除,即可得到与待抹除文本图像对应的抹除文本后的图像。上述方案中,由于该待抹除文本图像中的背景像素点中可能包含待抹除文本边缘的噪声点,因此本申请中,不只对待抹除文本图像中的全部前景像素点进行抹除,还对背景像素点进行抹除,相对于只对前景像素点进行抹除,抹除效果更好。
-
-
-
-
-
-
-
-
-