手写识别方法、装置、电子设备和存储介质

    公开(公告)号:CN115984877A

    公开(公告)日:2023-04-18

    申请号:CN202310130152.2

    申请日:2023-02-07

    Abstract: 本发明涉及模式识别技术领域,提供一种手写识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别的手写数据,手写数据包括匹配的笔画轨迹和手写图像;基于轨迹编码器,提取笔画轨迹的轨迹特征,并基于图像编码器,提取手写图像的图像特征,轨迹编码器和图像编码器采用差异化的训练策略训练得到;基于双模态解码器,应用图像特征和轨迹特征之间的差异化信息,将轨迹特征和图像特征进行融合,并基于融合后的特征进行手写识别。本发明提供的手写识别方法、装置、电子设备和存储介质,能够显著提升在双模态数据不匹配场景下的识别能力。

    地标识别方法、装置、电子设备和存储介质

    公开(公告)号:CN118733794A

    公开(公告)日:2024-10-01

    申请号:CN202410847926.8

    申请日:2024-06-27

    Abstract: 本发明提供一种地标识别方法、装置、电子设备和存储介质,其中方法包括:在接收到用户输入的针对待查询地标的语音问题时,基于车外摄像头,采集多张车外图像;将语音问题转换为文本,并对车外图像进行特征提取,得到图像特征;将图像特征和文本进行拼接,得到拼接结果,并将拼接结果输入至地标识别模型,得到地标识别模型输出的针对语音问题的回答,地标识别模型基于拼接结果,确定待查询地标的检索标识,应用检索标识从周边地图数据库中检索得到待查询地标的详细信息,并基于拼接结果和详细信息,生成回答。本发明提供了便捷和直观的地标查询方式,用户可以通过语音针对待查询地标进行自由提问,即可获得地标的相关信息,提升了用户体验。

    翻译方法、装置、系统、设备、存储介质和程序产品

    公开(公告)号:CN119312820A

    公开(公告)日:2025-01-14

    申请号:CN202411494986.2

    申请日:2024-10-24

    Abstract: 本发明提供一种翻译方法、装置、系统、设备、存储介质和程序产品,其中方法包括:基于用户输入中的输入文本和输入图像进行语义分析,基于分析结果确定输出回复;在输出回复为对用户的输入引导的情况下,获取用户对应于输入引导的补充输入;基于用户输入和补充输入进行翻译,得到用户输入对应的翻译结果,采用交互式的方式进行翻译,可以在分析确定当前无法得出准确结果时,提供引导以使用户针对性的进行信息补充,以获取更多有关翻译目标的信息,基于此进行翻译,克服了传统方案中翻译结果不准确、不可靠和不实用的问题,提升了翻译灵活性,可以更好地应对复杂场景,减少歧义,得到准确可靠的翻译结果,并可为用户提供有效帮助,优化用户体验。

Patent Agency Ranking