-
公开(公告)号:CN119312820A
公开(公告)日:2025-01-14
申请号:CN202411494986.2
申请日:2024-10-24
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种翻译方法、装置、系统、设备、存储介质和程序产品,其中方法包括:基于用户输入中的输入文本和输入图像进行语义分析,基于分析结果确定输出回复;在输出回复为对用户的输入引导的情况下,获取用户对应于输入引导的补充输入;基于用户输入和补充输入进行翻译,得到用户输入对应的翻译结果,采用交互式的方式进行翻译,可以在分析确定当前无法得出准确结果时,提供引导以使用户针对性的进行信息补充,以获取更多有关翻译目标的信息,基于此进行翻译,克服了传统方案中翻译结果不准确、不可靠和不实用的问题,提升了翻译灵活性,可以更好地应对复杂场景,减少歧义,得到准确可靠的翻译结果,并可为用户提供有效帮助,优化用户体验。
-
公开(公告)号:CN119312931A
公开(公告)日:2025-01-14
申请号:CN202411494182.2
申请日:2024-10-24
Applicant: 科大讯飞股份有限公司
IPC: G06N5/04 , G06F40/205 , G06V20/60 , G06V10/25
Abstract: 本发明涉及人工智能技术领域,提供一种交互问答方法、装置、电子设备和存储介质,其中方法包括:获取提问指令,以及包含指向性物体的图像;将所述提问指令中的指代词与所述指向性物体所指示的对象进行关联,得到所述指代词的指代对象,并基于所述指代对象生成回答文本;基于所述回答文本,进行交互问答。本发明提供的交互问答方法、装置、电子设备和存储介质,通过将提问指令中的指代词与指向性物体所指示的具体对象进行关联,能够精细化的识别理解用户的指代式问题,从而正确理解用户意图,通过智能解析指代词,确保多模态信息的对齐,使得回答内容更加贴近人类对话的自然逻辑,提升交互的流畅度和用户体验。
-
公开(公告)号:CN119311393A
公开(公告)日:2025-01-14
申请号:CN202411494984.3
申请日:2024-10-24
Applicant: 科大讯飞股份有限公司
IPC: G06F9/48 , G06F11/30 , G06F40/166 , G06V20/70 , G06F40/30 , G06F18/22 , H04N21/236 , H04N21/242 , H04N21/43
Abstract: 本发明提供一种辅助阅读方法、装置、电子设备、存储介质和计算机程序产品,通过监控模型监控辅助阅读指令所指向的辅助阅读任务是否完成,并在任务未完成的情况下,将监控模型切换为运行模型,并返回执行文本生成步骤。由于监控模型生成实时待读图片对应待读文本的过程可以与运行模型生成待读图片对应待读文本的过程并行,从而用户不需要等待实时待读图片对应的待读文本的生成。在运行模型生成待读图片对应待读文本后,运行模型作为监控模型,返回执行任务监控步骤,从而能够继续监控是否完成辅助阅读指令所指向的辅助阅读任务,保证阅读的连续性,减少了用户等待时间,提升了互动的流畅性。
-
-