表格的还原方法、装置、电子设备和计算机程序产品

    公开(公告)号:CN119919951A

    公开(公告)日:2025-05-02

    申请号:CN202411762621.3

    申请日:2024-12-03

    Abstract: 本申请提出一种表格的还原方法、装置、电子设备和计算机程序产品,该方法从包含待还原表格的目标图像中,提取得到待还原表格的表格位置信息和待还原表格中各单元格的单元格位置信息,根据表格位置信息,从目标图像中提取得到待还原表格的结构信息,其中结构信息包括各单元格的单元格内容和单元格内容在待还原表格中的地址,然后根据单元格位置信息确定各单元格的尺寸和各单元格在待还原表格中的地址,以便于根据结构信息以及各单元格的尺寸、各单元格在待还原表格中的地址进行单元格复原,如此设置可以复原出各单元格的尺寸、各单元格的内容和表格的布局,实现在数字化处理过程中还原该表格的目的。

    汽车座舱监控方法、装置、相关设备及计算机程序产品

    公开(公告)号:CN118618231B

    公开(公告)日:2025-01-24

    申请号:CN202411105233.8

    申请日:2024-08-13

    Abstract: 本申请公开了一种汽车座舱监控方法、装置、相关设备及计算机程序产品,涉及汽车座舱监控技术领域,方法包括:获取对汽车座舱环境监测到的多模态信息;按照预先配置的各类型的监测任务,在多任务提示指令集合中获取与每一监测任务对应的提示指令;利用多模态信息及每一监测任务的提示指令,生成每一监测任务的监测结果。本申请能够整合汽车座舱内不同的监测任务,不同监测任务可以共享多模态信息,充分发挥各模态信息间的互补作用,优化了不同监测任务间的互补性,提升了整体监控性能。此外,本申请通过统一的框架可以实现跨任务的处理,无需单独部署各独立的任务功能模块,从而减轻了相关功能模型部署时的负担。

    目标检测方法及相关装置、电子设备、存储介质

    公开(公告)号:CN114529791B

    公开(公告)日:2024-10-29

    申请号:CN202210032569.0

    申请日:2022-01-12

    Inventor: 娄舜 殷保才

    Abstract: 本申请公开了一种目标检测方法及相关装置、电子设备、存储介质,其中,目标检测方法包括:获取待检测图像的特征图中各像素位置的第一特征表示,并获取若干预设对象的第二特征表示和若干预设类别的第三特征表示;将预设对象的第二特征表示和预设类别的第三特征表示进行融合,得到融合特征表示;基于第一特征表示和融合特征表示进行预测,得到目标对象关于目标类别的检测结果;其中,目标对象和目标类别分别表征融合特征表示对应的预设对象和预设类别。上述方案,能够将多分类任务转换为二分类任务,进而即使类别再繁多,也能够准确检测,有利于提升目标检测精度。

    人脸识别模型训练方法、人脸识别方法及相关设备

    公开(公告)号:CN118736648A

    公开(公告)日:2024-10-01

    申请号:CN202410927051.2

    申请日:2024-07-11

    Abstract: 本申请公开了一种人脸识别模型训练方法、人脸识别方法、装置、相关设备及计算机程序产品,对于获取的在通用人脸数据集上预训练后的通用人脸识别模型,在异质人脸数据集上进行部分参数的微调训练,提高异质人脸场景下的识别准确率。训练过程冻结了通用人脸识别模型中主干特征提取模块内主干网络的参数,对新增的微调分支网络等少量参数进行微调,提高模型的训练效率。同时,通过设置新增的微调分支网络与主干网络并行相连,训练过程既能保留通用人脸识别模型的核心参数,又实现了从通用人脸识别场景到异质人脸识别场景的迁移适应,确保训练后的模型在两种场景下具有较好的识别性能。

    地标识别方法、装置、电子设备和存储介质

    公开(公告)号:CN118733794A

    公开(公告)日:2024-10-01

    申请号:CN202410847926.8

    申请日:2024-06-27

    Abstract: 本发明提供一种地标识别方法、装置、电子设备和存储介质,其中方法包括:在接收到用户输入的针对待查询地标的语音问题时,基于车外摄像头,采集多张车外图像;将语音问题转换为文本,并对车外图像进行特征提取,得到图像特征;将图像特征和文本进行拼接,得到拼接结果,并将拼接结果输入至地标识别模型,得到地标识别模型输出的针对语音问题的回答,地标识别模型基于拼接结果,确定待查询地标的检索标识,应用检索标识从周边地图数据库中检索得到待查询地标的详细信息,并基于拼接结果和详细信息,生成回答。本发明提供了便捷和直观的地标查询方式,用户可以通过语音针对待查询地标进行自由提问,即可获得地标的相关信息,提升了用户体验。

    汽车座舱监控方法、装置、相关设备及计算机程序产品

    公开(公告)号:CN118618231A

    公开(公告)日:2024-09-10

    申请号:CN202411105233.8

    申请日:2024-08-13

    Abstract: 本申请公开了一种汽车座舱监控方法、装置、相关设备及计算机程序产品,涉及汽车座舱监控技术领域,方法包括:获取对汽车座舱环境监测到的多模态信息;按照预先配置的各类型的监测任务,在多任务提示指令集合中获取与每一监测任务对应的提示指令;利用多模态信息及每一监测任务的提示指令,生成每一监测任务的监测结果。本申请能够整合汽车座舱内不同的监测任务,不同监测任务可以共享多模态信息,充分发挥各模态信息间的互补作用,优化了不同监测任务间的互补性,提升了整体监控性能。此外,本申请通过统一的框架可以实现跨任务的处理,无需单独部署各独立的任务功能模块,从而减轻了相关功能模型部署时的负担。

Patent Agency Ranking