-
公开(公告)号:CN119536609A
公开(公告)日:2025-02-28
申请号:CN202411654731.8
申请日:2024-11-19
Applicant: 科大讯飞股份有限公司
IPC: G06F3/04883 , G06V40/20 , G06V10/82 , G06V40/70 , G10L15/22
Abstract: 本申请公开了一种操作意图识别方法、交互方法及相关装置,涉及人机交互技术领域,操作意图识别方法包括:获取目标用户的多模态数据,多模态数据包括手部图像数据和语音数据;根据目标用户的多模态数据,获取手指端点三维坐标、手指指向向量弧度、目标操作以及操作置信度;根据操作置信度,确定目标用户是否有操作意图;若目标用户有操作意图,则根据手指端点三维坐标和手指指向向量弧度,确定目标操作对应的操作对象,以得到包含目标操作以及目标操作对应的操作对象的操作意图识别结果。本申请公开的操作意图识别方法能够较为准确地识别出操作意图,进而能够提升交互准确率,从而能够提升用户体验。
-
公开(公告)号:CN119399779A
公开(公告)日:2025-02-07
申请号:CN202411343916.7
申请日:2024-09-25
Applicant: 科大讯飞股份有限公司
IPC: G06V30/22 , G06V30/19 , G06V30/162 , G06V30/168 , G06V30/18
Abstract: 本发明公开一种笔迹识别方法及笔迹识别模型的训练方法,所述识别方法包括:获取待识别图像;待识别图像包括目标识别对象;将待识别图像输入目标笔迹识别模型进行特征提取,得到目标识别对象对应的待识别特征信息;基于目标笔迹识别模型,对待识别特征信息进行特征处理,得到特征筛选信息和待分类识别信息;基于特征筛选信息对待分类识别信息进行筛选,得到特征筛选结果;基于目标笔迹识别模型和特征筛选结果,对待分类识别信息进行分类识别,得到目标识别对象对应的目标识别结果。本发明应用笔迹识别模型,通过提取目标识别对象的特征,进而对待识别特征进行多分支识别,并对识别结果进行对齐,以生成目标识别结果,能够提高对象识别的准确性。
-
公开(公告)号:CN119169249A
公开(公告)日:2024-12-20
申请号:CN202411169170.2
申请日:2024-08-23
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种跳远测评方法、装置、设备和存储介质,该方法包括:获取目标测评对象的若干第一目标图像;分别从各所述第一目标图像中确定至少包含所述目标测评对象的区域,并作为候选区域;分别从各所述第一目标图像的所述候选区域中,确定出所述目标测评对象所在的第一目标位置;基于各所述第一目标图像对应的所述第一目标位置,确定所述目标测评对象的测评结果。通过上述方式,本申请能够在提高测评效率的同时,提高测评结果的准确性。
-
公开(公告)号:CN119097892A
公开(公告)日:2024-12-10
申请号:CN202411209616.X
申请日:2024-08-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种运动评测方法、装置、电子设备及存储介质,属于运动评测技术领域,该方法包括:在准备阶段,调用预设的人形检测模型对输入图像帧进行检测,以定位人体框,并根据人体框确定位于起跳区域的测试人员;在起跳阶段,调用预设的人体姿态估计模型和预设的关键帧定位模型,判断测试人员是否已经开始起跳,以确定起跳帧;在腾空阶段和落地阶段,基于起跳帧,调用人体姿态估计模型和关键帧定位模型,判断测试人员是否已经开始落地,以确定落地帧,并根据落地帧确定测试人员的落地点,计算立定跳远成绩。本申请通过自动化和智能化的技术手段,有效地解决了传统立定跳远评测中存在的问题,提供了更为准确、客观和便捷的评测方案。
-
公开(公告)号:CN118334679A
公开(公告)日:2024-07-12
申请号:CN202410515060.0
申请日:2024-04-26
Applicant: 科大讯飞股份有限公司
IPC: G06V30/19 , G06V30/16 , G06V10/82 , G06T3/40 , G06N3/0455
Abstract: 本申请实施例公开了一种文本识别方法、装置、设备、存储介质和计算机程序产品,对待识别图像进行缩放处理,得到第一图像和第二图像;第一图像小于第二图像;对第一图像进行编码,得到第一编码特征;对第二图像分块进行编码,得到各个图像块的编码特征;将各个图像块的编码模特征拼接,得到第二编码特征;将第一编码特征和第二编码特征融合,得到融合特征;对融合特征进行解码,得到文本识别结果。本申请提高了文本识别准确率。
-
公开(公告)号:CN118196804A
公开(公告)日:2024-06-14
申请号:CN202410143667.0
申请日:2024-02-01
Applicant: 科大讯飞股份有限公司
IPC: G06V30/14 , G06V30/148 , G06N3/04 , G06N3/08
Abstract: 本申请提出一种试题答案文本的处理方法、装置、设备、存储介质及计算机程序产品,该方法包括:获取试题答案图像;其中,所述试题答案图像包括初始答案文本;从试题答案图像中分割出各个答案区域;其中,每一项答案各自对应一个答案区域;对各个所述答案区域进行文字识别,得到所述初始答案文本中的各项答案;拼接各项答案,并在相邻所述答案之间插入分隔符,得到目标答案文本。本申请无需人工对答案文本进行处理,而是采用自动化的方式生成目标答案文本,提升了答案文本的处理效率。尤其,在面对大量需要处理的答案文本时,无疑可以更快的完成处理。
-
公开(公告)号:CN118155274A
公开(公告)日:2024-06-07
申请号:CN202311870826.9
申请日:2023-12-29
Applicant: 科大讯飞股份有限公司
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/766 , G06V10/82 , G06V10/40 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种动作计数方法及相关装置、设备和存储介质,其中,动作计数方法包括:获取对目标对象拍摄的图像序列,并基于若干种基础动作类别,得到周期动作集合;其中,周期动作集合包含若干种周期动作类别,且周期动作类别由顺序排列的基础动作类别构成;识别图像序列内拍摄图像中目标对象的目标动作类别;基于各帧拍摄图像的目标动作类别,得到目标对象的有效动作序列;其中,有效动作序列包含顺序排列的基础动作类别;基于周期动作集合对有效动作序列进行检索,得到目标对象分别执行各种周期动作类别的累计数目。上述方案,能够在尽可能地减少感知的前提下,降低动作计数的成本,并提升动作计数的精度。
-
公开(公告)号:CN117934547A
公开(公告)日:2024-04-26
申请号:CN202311868970.9
申请日:2023-12-28
Applicant: 科大讯飞股份有限公司
IPC: G06T7/246 , G06V10/75 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种目标跟踪方法、目标跟踪装置、设备和介质,该方法包括:获取跟踪目标在历史视频帧中的历史跟踪位置信息;基于跟踪目标的历史跟踪位置信息进行运动预测,得到跟踪目标在当前视频帧的预测结果;其中,预测结果至少包括预测位置信息;至少基于跟踪目标在当前视频帧中的预测位置信息,确定跟踪目标在当前视频帧中的目标跟踪结果,能够提高跟踪效率。
-
公开(公告)号:CN117831053A
公开(公告)日:2024-04-05
申请号:CN202311870569.9
申请日:2023-12-29
Applicant: 科大讯飞股份有限公司
IPC: G06V30/412 , G06V30/413
Abstract: 本申请提供一种图像中表格内容的提取方法、装置和电子设备,涉及图像处理技术领域。该方法包括:在提取表格中的内容时,可以先获取待提取图像,待提取图像中包括目标表格,并基于待提取图像和关键词,从目标表格中提取关键词对应的目标内容;其中,目标内容包括表头内容、项目列内容或者行内容中的至少一种,表头内容中的表头项通过行方向单元格分隔符分隔、项目列内容中的项目列通过列方向单元格分隔符分隔,行内容中的内容通过行方向单元格分隔符分隔,这样基于分隔符可以较好地从目标表格中,提取出关键词对应的目标内容。
-
公开(公告)号:CN117789292A
公开(公告)日:2024-03-29
申请号:CN202311718052.8
申请日:2023-12-13
Applicant: 科大讯飞股份有限公司
IPC: G06V40/20 , G06V20/40 , G06V10/42 , G06V10/44 , G06V10/62 , G06V10/764 , G06V10/80 , G06V10/82 , G06F40/30 , G06N3/0895 , G06N3/096
Abstract: 本发明涉及计算机技术领域,提供一种行为识别方法、训练方法、装置、电子设备和存储介质,其中行为识别方法包括:获取待识别视频,以及文本特征,所述文本特征是通过对比学习预训练大模型对预设的描述文本进行特征提取得到的;基于行为识别模型,对所述待识别视频中连续帧图像进行时序特征提取,并应用提取到的时序特征和所述文本特征,对所述待识别视频进行行为识别。本发明提供的行为识别方法、训练方法、装置、电子设备和存储介质,能够增强行为识别模型针对细粒度物品的特征表达能力,从而提高识别效果且使泛化性能更好。
-
-
-
-
-
-
-
-
-