车辆轨迹预测方法、装置、相关设备及计算机程序产品

    公开(公告)号:CN118410408A

    公开(公告)日:2024-07-30

    申请号:CN202410847282.2

    申请日:2024-06-27

    Abstract: 本申请公开了一种车辆轨迹预测方法、装置、相关设备及计算机程序产品,涉及自动驾驶领域,方法包括:对目标车辆的历史轨迹信息进行编码,得到所述目标车辆的运动编码特征;对所述目标车辆周围环境中的对象的历史轨迹信息进行编码,得到环境对象的对象编码特征;将所述目标车辆的运动编码特征与所述对象编码特征进行融合,得到融合后的上下文向量;从设定分布中采样潜变量,并将所述潜变量与所述上下文向量进行融合,基于融合向量预测所述目标车辆的轨迹。本申请方法提升了轨迹预测结果的准确度,以及增加了轨迹预测的多样性,尤其是面对复杂交通场景、不同驾驶行为和不同车辆类型的预测,能够在预测中更好地捕捉未知的、多样的情况。

    一种图像拼接方法及其相关设备

    公开(公告)号:CN113628113B

    公开(公告)日:2024-07-23

    申请号:CN202110919966.5

    申请日:2021-08-11

    Abstract: 本申请公开了一种图像拼接方法及其相关设备,方法包括:在获取到待拼接图像之后,先对待拼接图像进行字符检测处理,得到待拼接图像的字符识别结果;再根据待拼接图像的字符识别结果和参考图像的字符识别结果,确定待拼接图像与参考图像之间的字符匹配结果;其中,参考图像与待拼接图像之间存在重叠区域;然后,依据待拼接图像与参考图像之间的字符匹配结果,确定待拼接图像的非重叠区域位置信息;最后,根据待拼接图像的非重叠区域位置信息,对包括参考图像的目标图像进行图像信息更新,以使更新后的目标图像不仅能够包括参考图像所携带的图像信息,也包括待拼接图像携带的图像信息,如此能够实现针对存在重叠区域的至少两个图像进行拼接处理。

    题库资源加工方法、装置、电子设备、存储介质及产品

    公开(公告)号:CN118230334A

    公开(公告)日:2024-06-21

    申请号:CN202410140968.8

    申请日:2024-01-31

    Abstract: 本申请提出一种题库资源加工方法、装置、电子设备、存储介质及产品,该方法包括:对试题图像进行版面要素检测,确定试题图像对应的版面要素信息;版面要素信息包括:版面要素的类型、位置和内容;基于试题图像对应的版面要素信息和预先设置的阅读顺序,确定试题集合;试题集合中包括按照阅读顺序排序的试题题干和试题解答;基于试题集合中各个试题题干对应的版面要素信息和试题集合中各个试题解答对应的版面要素信息,确定各个试题题干与各个试题解答之间的匹配结果。采用本方案,能够对试题图像中的各个试题题干和试题解答进行自动匹配,提高了试题题干与试题解答之间的匹配效率,从而提高了题库资源的加工效率,减少了题库资源的加工成本。

    对焦纸面及作业学情采集方法、装置、设备及存储介质

    公开(公告)号:CN115174814B

    公开(公告)日:2024-06-04

    申请号:CN202210908066.5

    申请日:2022-07-29

    Abstract: 本申请公开了一种对焦纸面及作业学情采集方法、装置、设备及存储介质,本申请获取到对包含指定用户的手写体批注内容的纸质文档拍摄的图片,从中识别出手写体批注内容对应的目标区域,控制摄像头在不同焦距下对目标区域进行拍摄,分别确定每一焦距对应的目标区域图片中手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便摄像头基于目标焦距进行后续的拍摄。本申请中考虑到对于作业学情采集这一任务,指定用户的手写体批注内容是最重要的信息,以不同焦距下拍摄的手写体批注内容的清晰度作为筛选条件确定目标焦距,保证按照该目标焦距拍摄的图片中指定用户的手写体批注内容是清晰的,提升后续对作业学情的采集的准确度。

    文档结构确定方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN118114647A

    公开(公告)日:2024-05-31

    申请号:CN202410159255.6

    申请日:2024-02-04

    Abstract: 本申请提供了一种文档结构确定方法、装置、设备、存储介质及程序产品,具体实现方案为:对待解析文档进行版面解析,确定所述待解析文档中的各个建模单元的位置坐标;其中,所述建模单元包括段落、图像、表格、文档名称、页眉、页脚中的至少一项;基于所述各个建模单元的位置坐标,确定各个建模单元对应的文本内容和各个建模单元对应的类别信息;基于各个建模单元对应的文本内容和类别信息,确定所述待解析文档对应的文档结构根据本申请的技术方案,能够有效提升输出的文档结构的准确性。

    GAN网络压缩方法、装置、设备及存储介质

    公开(公告)号:CN112465115B

    公开(公告)日:2024-05-31

    申请号:CN202011341346.X

    申请日:2020-11-25

    Abstract: 本申请公开了一种GAN网络压缩方法、装置、设备及存储介质,对于待压缩的GAN网络,将其中每一层的原始操作子替换为至少一个候选操作子,每一层的输出由每一层替换后的各候选操作子的输出组成,并且候选操作子的计算量小于被替换的原始操作子的计算量,初始化GAN网络中各候选操作子的参数及其权重,交替更新生成网络G和判别网络D,直至GAN网络收敛为止,基于收敛的GAN网络中每一层各候选操作子的最终权重,确定每一层最终保留的操作子,以得到压缩后的GAN网络。本申请方案同时对GAN网络中生成网络G和判别网络D进行压缩,在实现对GAN网络压缩的同时,保证了压缩后GAN网络的平衡性。

    文本识别方法、装置、设备及存储介质

    公开(公告)号:CN113392825B

    公开(公告)日:2024-04-30

    申请号:CN202110666915.6

    申请日:2021-06-16

    Abstract: 本申请公开了一种文本识别方法、装置、设备及存储介质,本申请获取待识别文本所在的图像区域对应的文本图片,进一步对于待识别的文本图片,对其提取至少两个不同方向上的图像特征,进而基于提取的至少两个不同方向上的图像特征,识别文本图片中包含的文本内容。由此可见,对于待识别的文本图片,鉴于其文本内容方向上的多样化,本申请在进行图像特征提取时强化了所提取的方向信息,也即,从两个及以上的不同方向对文本图片进行特征提取,使得提取的图像特征包含了文本图片中待识别文本的多个方向上的特征信息,在此基础上,基于提取的图像特征,能够更加准确的识别文本图片中所包含的文本内容,提高了文本识别的准确度。

    一种交互方法、装置、控制设备及存储介质

    公开(公告)号:CN117316158B

    公开(公告)日:2024-04-12

    申请号:CN202311599003.7

    申请日:2023-11-28

    Abstract: 本发明提供了一种交互方法、装置、控制设备及存储介质,交互方法包括:获取目标用户的手部图像序列和语音序列;识别语音序列中的指令词,并获取指令词对应的时间;根据手部图像序列以及指令词对应的时间,确定目标用户发出指令词时的手部指向区域;根据目标用户发出指令词时的手部指向区域,确定交互设备;控制交互设备执行指令词对应的操作。本发明提供的交互方法为结合语音的指向交互方法,该交互方法有效利用了不同模态信息的互补性,其不但能够实现丰富的交互功能,而且具有较好的交互稳定性,用户体验较好。

    一种二维速算题识别方法、装置、存储介质及设备

    公开(公告)号:CN117831045A

    公开(公告)日:2024-04-05

    申请号:CN202311867437.0

    申请日:2023-12-28

    Abstract: 本申请公开了一种二维速算题识别方法、装置、存储介质及设备,该方法包括:首先获取待识别的目标图像;其中,目标图像中包含待识别的目标二维速算题;然后将目标图像输入编码器进行编码,得到目标图像对应的编码后的目标图像特征;接着,可以将目标图像特征输入预先构建的解码器进行条件式的解码,得到目标二维速算题的解码结果;并根据该解码结果,确定目标二维速算题的最终识别结果。可见,由于本申请是先对包含目标二维速算题的目标图像进行编码,再利用解码器对编码后的目标图像特征进行条件式的解码,以根据解码结果更为准确的确定出目标二维速算题的最终识别结果,从而提高了二维速算题识别结果的准确率。

Patent Agency Ranking