-
公开(公告)号:CN119919951A
公开(公告)日:2025-05-02
申请号:CN202411762621.3
申请日:2024-12-03
Applicant: 科大讯飞股份有限公司
IPC: G06V30/412 , G06V10/26 , G06V10/44 , G06V10/82 , G06N3/0455 , G06N3/0499 , G06N3/08 , G06F40/18
Abstract: 本申请提出一种表格的还原方法、装置、电子设备和计算机程序产品,该方法从包含待还原表格的目标图像中,提取得到待还原表格的表格位置信息和待还原表格中各单元格的单元格位置信息,根据表格位置信息,从目标图像中提取得到待还原表格的结构信息,其中结构信息包括各单元格的单元格内容和单元格内容在待还原表格中的地址,然后根据单元格位置信息确定各单元格的尺寸和各单元格在待还原表格中的地址,以便于根据结构信息以及各单元格的尺寸、各单元格在待还原表格中的地址进行单元格复原,如此设置可以复原出各单元格的尺寸、各单元格的内容和表格的布局,实现在数字化处理过程中还原该表格的目的。
-
公开(公告)号:CN119830986A
公开(公告)日:2025-04-15
申请号:CN202411974154.0
申请日:2024-12-30
Applicant: 安徽影联云享医疗科技有限公司 , 科大讯飞华南人工智能研究院(广州)有限公司 , 讯飞医疗科技股份有限公司 , 科大讯飞股份有限公司
IPC: G06N3/0895 , G06T7/00 , G16H50/20 , G06N5/04 , G06V10/82 , G06V10/774 , G06F16/22 , G06F40/205
Abstract: 本发明涉及模型训练,具体涉及一种基于对比学习的医学影像分析模型的训练方法,构建包含疾病或重要发现、解剖学区域的报告库;提取各报告中的疾病或重要发现、解剖学区域信息,并对识别出的疾病描述对应的细粒度信息,构建结构化报告库;对各结构化报告中的疾病描述、解剖学区域分别进行向量化,得到对应的疾病查询向量、解剖学区域查询向量;将各结构化报告对应的医学影像转化为视觉特征向量,以捕捉医学影像的关键视觉特征;对疾病查询向量与视觉特征向量,以及解剖学区域查询向量与视觉特征向量分别进行特征交互学习;本发明提供的技术方案能够有效克服现有技术所存在的难以充分利用有限的标注数据增强模型对于疾病识别和病灶定位性能的缺陷。
-
公开(公告)号:CN115480511B
公开(公告)日:2025-03-28
申请号:CN202211129098.1
申请日:2022-09-16
Applicant: 科大讯飞股份有限公司
IPC: G05B19/042 , G06V40/18
Abstract: 本申请公开了一种机器人交互方法、装置、存储介质及设备,该方法包括:首先获取目标用户的人脸图像,然后,利用该目标用户的人脸图像,确定目标用户的视线角度;接着根据目标用户的人脸图像和视线角度,确定目标机器人移动的终点位置信息;进而可以控制目标机器人移动到终点位置。可见,由于本申请是根据用户的视线移动,确定出机器人移动的终点位置,再控制机器人移动到该终点位置,从而能够实现更加精准、便捷的机器人交互,进而提高了交互效果和用户的交互体验。
-
公开(公告)号:CN119645225A
公开(公告)日:2025-03-18
申请号:CN202411636152.0
申请日:2024-11-15
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种手势控制方法、装置、设备、存储介质及程序产品,该手势控制方法包括:获取包含手部的多个目标图像,并基于多个目标图像生成空中手势轨迹;将空中手势轨迹和模板轨迹进行匹配,得到和空中手势轨迹匹配成功的目标模板轨迹;其中,模板轨迹是基于多个预设点预先绘制的轨迹;获取目标模板轨迹对应的目标指令,并控制目标设备执行目标指令对应的操作。本申请能够提升非接触式手势控制的灵敏性和精确性。
-
公开(公告)号:CN119380207A
公开(公告)日:2025-01-28
申请号:CN202411212407.0
申请日:2024-08-30
Applicant: 科大讯飞股份有限公司
IPC: G06V20/13 , G06V20/17 , G06V10/143 , G06V10/82 , G06V10/80 , G06N3/0455 , G06N3/0464 , G06N3/0442
Abstract: 本申请公开了一种地块变化检测方法及相关装置、设备和存储介质,其中,地块变化检测方法包括:基于目标地块在不同时间的目标拍摄图像,生成第一编码特征,以及基于关于目标拍摄图像的目标问题语句,生成第二编码特征;其中,第一编码特征与第二编码特征两者的特征维度一致;基于第一编码特征和第二编码特征进行解码,得到用于回答目标问题语句的目标回答语句。上述方案,能够提升表征地块变化情况的目标回答语句的生成效果。
-
公开(公告)号:CN118618231B
公开(公告)日:2025-01-24
申请号:CN202411105233.8
申请日:2024-08-13
Applicant: 科大讯飞股份有限公司
IPC: B60R16/023 , B60W50/08 , G06N5/04 , G06N3/0455 , G06F18/241 , G06F18/25 , G06F18/27
Abstract: 本申请公开了一种汽车座舱监控方法、装置、相关设备及计算机程序产品,涉及汽车座舱监控技术领域,方法包括:获取对汽车座舱环境监测到的多模态信息;按照预先配置的各类型的监测任务,在多任务提示指令集合中获取与每一监测任务对应的提示指令;利用多模态信息及每一监测任务的提示指令,生成每一监测任务的监测结果。本申请能够整合汽车座舱内不同的监测任务,不同监测任务可以共享多模态信息,充分发挥各模态信息间的互补作用,优化了不同监测任务间的互补性,提升了整体监控性能。此外,本申请通过统一的框架可以实现跨任务的处理,无需单独部署各独立的任务功能模块,从而减轻了相关功能模型部署时的负担。
-
公开(公告)号:CN114529791B
公开(公告)日:2024-10-29
申请号:CN202210032569.0
申请日:2022-01-12
Applicant: 科大讯飞股份有限公司
IPC: G06V10/80 , G06V10/774
Abstract: 本申请公开了一种目标检测方法及相关装置、电子设备、存储介质,其中,目标检测方法包括:获取待检测图像的特征图中各像素位置的第一特征表示,并获取若干预设对象的第二特征表示和若干预设类别的第三特征表示;将预设对象的第二特征表示和预设类别的第三特征表示进行融合,得到融合特征表示;基于第一特征表示和融合特征表示进行预测,得到目标对象关于目标类别的检测结果;其中,目标对象和目标类别分别表征融合特征表示对应的预设对象和预设类别。上述方案,能够将多分类任务转换为二分类任务,进而即使类别再繁多,也能够准确检测,有利于提升目标检测精度。
-
公开(公告)号:CN118736648A
公开(公告)日:2024-10-01
申请号:CN202410927051.2
申请日:2024-07-11
Applicant: 科大讯飞股份有限公司
IPC: G06V40/16 , G06V10/80 , G06V10/74 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/09
Abstract: 本申请公开了一种人脸识别模型训练方法、人脸识别方法、装置、相关设备及计算机程序产品,对于获取的在通用人脸数据集上预训练后的通用人脸识别模型,在异质人脸数据集上进行部分参数的微调训练,提高异质人脸场景下的识别准确率。训练过程冻结了通用人脸识别模型中主干特征提取模块内主干网络的参数,对新增的微调分支网络等少量参数进行微调,提高模型的训练效率。同时,通过设置新增的微调分支网络与主干网络并行相连,训练过程既能保留通用人脸识别模型的核心参数,又实现了从通用人脸识别场景到异质人脸识别场景的迁移适应,确保训练后的模型在两种场景下具有较好的识别性能。
-
公开(公告)号:CN118733794A
公开(公告)日:2024-10-01
申请号:CN202410847926.8
申请日:2024-06-27
Applicant: 科大讯飞股份有限公司
IPC: G06F16/387 , G06F16/332 , G06F40/151 , G06V20/56 , G06V10/40 , G10L15/26
Abstract: 本发明提供一种地标识别方法、装置、电子设备和存储介质,其中方法包括:在接收到用户输入的针对待查询地标的语音问题时,基于车外摄像头,采集多张车外图像;将语音问题转换为文本,并对车外图像进行特征提取,得到图像特征;将图像特征和文本进行拼接,得到拼接结果,并将拼接结果输入至地标识别模型,得到地标识别模型输出的针对语音问题的回答,地标识别模型基于拼接结果,确定待查询地标的检索标识,应用检索标识从周边地图数据库中检索得到待查询地标的详细信息,并基于拼接结果和详细信息,生成回答。本发明提供了便捷和直观的地标查询方式,用户可以通过语音针对待查询地标进行自由提问,即可获得地标的相关信息,提升了用户体验。
-
公开(公告)号:CN118618231A
公开(公告)日:2024-09-10
申请号:CN202411105233.8
申请日:2024-08-13
Applicant: 科大讯飞股份有限公司
IPC: B60R16/023 , B60W50/08 , G06N5/04 , G06N3/0455 , G06F18/241 , G06F18/25 , G06F18/27
Abstract: 本申请公开了一种汽车座舱监控方法、装置、相关设备及计算机程序产品,涉及汽车座舱监控技术领域,方法包括:获取对汽车座舱环境监测到的多模态信息;按照预先配置的各类型的监测任务,在多任务提示指令集合中获取与每一监测任务对应的提示指令;利用多模态信息及每一监测任务的提示指令,生成每一监测任务的监测结果。本申请能够整合汽车座舱内不同的监测任务,不同监测任务可以共享多模态信息,充分发挥各模态信息间的互补作用,优化了不同监测任务间的互补性,提升了整体监控性能。此外,本申请通过统一的框架可以实现跨任务的处理,无需单独部署各独立的任务功能模块,从而减轻了相关功能模型部署时的负担。
-
-
-
-
-
-
-
-
-