-
公开(公告)号:CN117636461A
公开(公告)日:2024-03-01
申请号:CN202311550365.7
申请日:2023-11-16
Applicant: 科大讯飞股份有限公司
Abstract: 本申请涉及运动智能化技术领域,具体涉及一种跑步测评方法、装置、设备及存储介质。获取撞线者的撞线成绩和撞线者的人体图像,以及对撞线者的人体图像进行身体特征提取,得到撞线者的身体特征;通过将撞线者的身体特征与预先注册的各个测试者的注册身体特征进行匹配,从测试者中确定出与撞线者相似度最高的至少两个候选测试者,其中,测试者的注册身体特征,通过对测试者的注册人体图像进行身体特征提取得到;通过将撞线者的人体图像与候选测试者的注册人体图像进行匹配,从候选测试者中确定出与撞线者对应的目标测试者,并将撞线者的撞线成绩,确定为目标测试者的跑步成绩。本申请能够对跑步测试者的跑步成绩进行更精准、更高效地记录。
-
公开(公告)号:CN117593502A
公开(公告)日:2024-02-23
申请号:CN202311559240.0
申请日:2023-11-21
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种图像预处理方法、装置、电子设备和存储介质,所述方法包括:对待处理的原始图像进行图像分割,得到多个原始图块,并为各原始图块创建对应的线程;并行在各线程上对各原始图块进行预处理,得到对应的预处理图块;对各预处理图块进行合并,得到预处理图像。本发明提供的图像预处理方法、装置、电子设备和存储介质,对待处理的原始图像进行图像分割,得到多个原始图块,并为各原始图块创建对应的线程,从而可以并行在各线程上对各原始图块进行预处理,大幅度提高图像预处理的效率,进而能够高效率地实现推理过程中的预处理,降低推理的延迟并且提高吞吐。
-
公开(公告)号:CN114356201B
公开(公告)日:2024-02-20
申请号:CN202111592814.5
申请日:2021-12-23
Applicant: 科大讯飞股份有限公司
IPC: G06F3/0488 , G06F3/0354 , G06T5/70
Abstract: 本申请公开了一种书写美化方法、装置、设备和可读存储介质,该方法包括:采集多个书写轨迹点的信息,进行笔宽估计得到笔宽,并依次利用改进的三阶贝塞尔算法进行轨迹平滑得到多个插值轨迹点的信息,其中改进的三阶贝塞尔算法使用的控制点包括当前处理的书写轨迹点及其前三个书写轨迹点,多个插值轨迹点在当前处理的书写轨迹点之前的第一个书写轨迹点与第二个书写轨迹点之间,计算每个笔段的外轮廓,通过上述方式,每获取到一个书写轨迹点,就利用它更新改进的三阶贝塞尔算法的控制点,并对它之前的第一个书写轨迹点和第二个书写轨迹点之间进行平滑,能够降低电子屏书写平滑的延迟,也就能够降低电子屏书写美化的延迟。
-
公开(公告)号:CN117372574A
公开(公告)日:2024-01-09
申请号:CN202311378872.7
申请日:2023-10-23
Applicant: 科大讯飞股份有限公司 , 科大讯飞(苏州)科技有限公司
IPC: G06T11/60
Abstract: 本申请公开了一种图像编辑方法、装置、设备及可读存储介质,获取待编辑的图像和文本指令之后,先基于图像和文本指令,确定用于指示图像中的待编辑对象和文本指令的图像编辑表征,以及,用于指示待编辑对象中的待编辑区域的待编辑区域图;再基于图像编辑表征以及待编辑区域图对待编辑的图像的待编辑对象中的待编辑区域进行编辑,得到编辑后的图像。基于本方案,能够实现只对待编辑的图像中的局部进行编辑。
-
公开(公告)号:CN117316158A
公开(公告)日:2023-12-29
申请号:CN202311599003.7
申请日:2023-11-28
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供了一种交互方法、装置、控制设备及存储介质,交互方法包括:获取目标用户的手部图像序列和语音序列;识别语音序列中的指令词,并获取指令词对应的时间;根据手部图像序列以及指令词对应的时间,确定目标用户发出指令词时的手部指向区域;根据目标用户发出指令词时的手部指向区域,确定交互设备;控制交互设备执行指令词对应的操作。本发明提供的交互方法为结合语音的指向交互方法,该交互方法有效利用了不同模态信息的互补性,其不但能够实现丰富的交互功能,而且具有较好的交互稳定性,用户体验较好。
-
公开(公告)号:CN117311866A
公开(公告)日:2023-12-29
申请号:CN202311030871.3
申请日:2023-08-14
Applicant: 科大讯飞股份有限公司
IPC: G06F9/451 , G06F40/106
Abstract: 本申请公开了一种文本生成方法、装置、设备及可读存储介质。首先,显示文本生成页面,该文本生成页面中包括输入框以及第一按钮,第一按钮用于指示启动文本生成;然后,获取用户在输入框输入的图片并确定文本描述信息,该文本描述信息用于指示用户的文本生成需求;再获取用户对第一按钮的触发操作并响应于用户对第一按钮的触发操作,输出与图片对应的满足用户的文本生成需求的第一文本。基于该方案,可以基于图片以及文本描述信息,便捷、快速地生成满足用户的文本生成需求的文本。
-
公开(公告)号:CN117292432A
公开(公告)日:2023-12-26
申请号:CN202311132804.2
申请日:2023-09-04
Applicant: 科大讯飞股份有限公司
IPC: G06V40/20 , A63B71/06 , G06V10/10 , G06V10/774
Abstract: 本发明涉及机器视觉技术领域,提供一种踩线评判方法、装置、系统、电子设备及存储介质,该方法首先获取评判对象在体育项目开始前的图像,并确定图像中评判对象的脚部区域图像;然后将脚部区域图像输入至踩线检测模型,得到踩线检测模型输出的评判对象的双脚的踩线比例;最后基于踩线比例以及踩线阈值,判断评判对象是否踩线。该评判方法利用踩线检测模型确定评判对象双脚的踩线比例,可以量化踩线幅度,便于根据不同场景结合踩线阈值,实现精细化的踩线评判,进而提高踩线评判精度和准确性。该评判方法结合踩线阈值,判断评判对象是否踩线,不同场景可以设置不同的踩线阈值,不仅可以控制踩线评判的灵敏度,还具有较强的场景适应性。
-
公开(公告)号:CN117237970A
公开(公告)日:2023-12-15
申请号:CN202311301393.5
申请日:2023-10-08
Applicant: 科大讯飞股份有限公司
IPC: G06V30/412 , G06V30/19
Abstract: 本申请提供了一种文本识别方法和相关装置,在对待识别文本图像进行文本识别的过程中,得到第一上下文特征和第一得分向量,在结合第一上下文特征对标准答案进行文本识别的过程中,得到第二得分向量。由于第一上下文特征能够在对标准答案进行文本识别的过程中增强对与待识别文本的形状相同或相近的目标答案内容的关注度,使得第二得分向量能够反映出标准答案是否包含目标答案内容,因此,可以根据第二得分向量确定是否对第一得分向量进行答案激励,若是,则对第一得分向量和第二得分向量进行得分融合,得到答案激励识别结果。由此可见,本申请在标准答案包含目标答案内容时,可以对待识别文本本身的识别结果进行答案激励,提高了识别准确度。
-
公开(公告)号:CN115690359B
公开(公告)日:2023-12-15
申请号:CN202211326541.4
申请日:2022-10-27
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种点云处理方法、装置、电子设备及存储介质,所述点云处理方法,包括:将目标对象的三维点云投影至预先构建的二维平面,获得所述二维平面中的与各个三维点云点对应的二维投影点;基于所述二维平面中的二维投影点,构建二维投影点网格;根据所述二维投影点网格,以及所述二维投影点与所述三维点云点之间的投影关系,获得所述三维点云的点云网格。该方法通过将三维点云投影至预先构建的二维平面,将对三维点云的点云网格构建问题转化成了二维投影点网格构建问题,并在获得二维投影点网格后,根据二维投影点与三维点云点之间的对应关系,获得三维点云的点云网格,降低了点云网格的构建难度,提高了点云网格的构建效率。
-
公开(公告)号:CN117177025A
公开(公告)日:2023-12-05
申请号:CN202311030930.7
申请日:2023-08-14
Applicant: 科大讯飞股份有限公司
Inventor: 刘聪 , 徐浩然 , 高建清 , 姚仕豪 , 何山 , 郜静文 , 杨硕 , 殷保才 , 殷兵 , 刘烨秋 , 付新勇 , 王雨露 , 张若楠 , 管广鹏 , 吕磊 , 陈付国 , 金左雨 , 董飞 , 胡国平 , 魏思 , 王士进 , 刘权
IPC: H04N21/81 , H04N21/44 , G10L13/027 , G10L13/08
Abstract: 本申请公开了一种视频生成方法、装置、设备和存储介质,其中,视频生成方法包括:基于用户关于期望输出文稿的语音数据,得到对应的识别文本;获取原始图像和用于指示视频生成的第一描述文本;获取至少响应于所述第一描述文本而生成的文案文本;获取由所述文案文本合成得到的视频配音;至少基于所述原始图像和所述视频配音,生成目标视频。通过该方式,能够缩短视频制作的时间,降低视频制作的成本,提高视频制作的工作效率。
-
-
-
-
-
-
-
-
-