变体词识别方法、装置、设备和存储介质

    公开(公告)号:CN118886424B

    公开(公告)日:2025-02-18

    申请号:CN202411357321.7

    申请日:2024-09-27

    Abstract: 本发明提供一种变体词识别方法、装置、设备和存储介质,涉及人工智能技术领域,该方法包括:获取待识别文本;对所述待识别文本进行分词,得到至少一个词汇;针对各所述词汇,将包含所述词汇的目标图像和词汇列表中的至少一个目标词汇输入变体词识别模型中,得到所述变体词识别模型输出的识别结果,所述识别结果用于表征所述词汇是否为变体词;其中,所述变体词识别模型为基于所述词汇列表中的各词汇和各所述词汇对应的样本图像,对初始变体词识别模型进行训练得到的,所述样本图像包括所述词汇对应的变体词。本发明能够提高变体词的识别结果准确性。

    方言语音识别方法、装置、设备及存储介质

    公开(公告)号:CN115240640B

    公开(公告)日:2025-02-11

    申请号:CN202210852125.1

    申请日:2022-07-20

    Abstract: 本申请公开了一种方言语音识别方法、装置、设备及存储介质,本申请预先配置了方言语音识别模型,该模型为,以各类型语言(包括普通话及各类型方言)的语音样本作为训练样本,以该训练样本的识别文本经句法分析及phone级标注后的携带有句法信息的phone级标注文本作为标签训练得到,相比于现有的字级端到端模型,本申请基于音素phone级进行建模,从发音层面实现了提高各类型方言之间以及方言与普通话之间建模单元的区分性、并减少各方言之间串扰度,从而提升各方言的识别效果。进一步地,在标注上引入了句法信息,能够让模型学习到各方言的语法层面的信息,进一步提升各方言的识别效果,此外,由于添加了语法信息,还可以提升模型识别文本的可阅读性。

    一种意图识别方法、系统和相关装置

    公开(公告)号:CN119377390A

    公开(公告)日:2025-01-28

    申请号:CN202411222344.7

    申请日:2024-09-02

    Abstract: 本申请公开了一种意图识别方法、系统和相关装置,该方法包括:获取用户输入的初始意图,从意图数据库中获取与所述初始意图相关的候选意图;获取所述初始意图与各个所述候选意图之间的相对模糊度;其中,所述相对模糊度基于所述初始意图的初始要素与对应所述候选意图的候选要素之间的匹配程度确定,所述相对模糊度与所述匹配程度成反比;基于所述候选意图及其对应的所述相对模糊度,获取意图补充信息,利用所述初始意图和所述意图补充信息,得到目标意图。通过上述方式,本申请能够提高意图识别的准确性。

    一种菜单导航方法、装置、设备、存储介质及产品

    公开(公告)号:CN118468890B

    公开(公告)日:2024-12-06

    申请号:CN202410941077.2

    申请日:2024-07-15

    Abstract: 本申请提供了一种菜单导航方法、装置、设备、存储介质及产品,其中,菜单导航方法包括:获取第一导航文本;将所述第一导航文本与第一菜单节点集合中各个菜单节点的节点信息进行匹配,并根据匹配结果在所述第一菜单节点集合中确定出多个候选菜单节点;根据各个候选菜单节点对应的节点信息对所述第一导航文本进行菜单节点意图识别,在各个候选菜单节点中确定出所述第一导航文本对应的目标菜单节点。本申请提出的技术方案,不仅支持用户的自然语言输入,降低了用户的学习成本和使用难度,还通过粗排检索和意图识别精确导航定位相结合的方式,大大降低了计算复杂性和耗时,提高了菜单导航的效率和准确性。

    变体词识别方法、装置、设备和存储介质

    公开(公告)号:CN118886424A

    公开(公告)日:2024-11-01

    申请号:CN202411357321.7

    申请日:2024-09-27

    Abstract: 本发明提供一种变体词识别方法、装置、设备和存储介质,涉及人工智能技术领域,该方法包括:获取待识别文本;对所述待识别文本进行分词,得到至少一个词汇;针对各所述词汇,将包含所述词汇的目标图像和词汇列表中的至少一个目标词汇输入变体词识别模型中,得到所述变体词识别模型输出的识别结果,所述识别结果用于表征所述词汇是否为变体词;其中,所述变体词识别模型为基于所述词汇列表中的各词汇和各所述词汇对应的样本图像,对初始变体词识别模型进行训练得到的,所述样本图像包括所述词汇对应的变体词。本发明能够提高变体词的识别结果准确性。

    口语学习方法、装置、设备及存储介质

    公开(公告)号:CN118800215A

    公开(公告)日:2024-10-18

    申请号:CN202310493202.3

    申请日:2023-04-28

    Abstract: 本申请公开了一种口语学习方法、装置、设备及存储介质,本申请支持用户定义口语对话的场景,获取用户定义的情景描述信息,基于该情景描述信息、用户当前轮输入的语音以及本次口语对话过程中当前轮之前的用户与机器的历史对话语音,生成并输出机器的当前轮对话语音,实现口语学习过程中在用户定义的场景下,用户与机器进行口语对话练习的目的。本申请摒弃了传统通过用户语音识别、机器回复文本生成、语音合成的路线来生成机器回复语音的方式,实现了端到端的语音生成,保留了人机历史对话语音中用户语音的韵律信息,使得生成的机器回复更加符合用户当前的情绪状态,提升了用户与机器进行口语对话的意愿度,提升了用户口语学习的效率。

Patent Agency Ranking