一种对话问题生成方法、装置、设备及存储介质

    公开(公告)号:CN116186206A

    公开(公告)日:2023-05-30

    申请号:CN202211418251.2

    申请日:2022-11-14

    Abstract: 本发明提供了一种对话问题生成方法、装置、设备及存储介质,其中,方法包括:获取指定场景中的参考文档以及针对参考文档所展开的对话的历史对话数据;识别历史对话数据所包含的每轮对话的意图,并预测下一轮对话的意图,将识别的意图和预测的意图作为目标意图信息;基于历史对话数据、参考文档以及目标意图信息,生成下一轮对话的答案;基于历史对话数据、参考文档以及下一轮对话的答案,生成下一轮对话的问题。本发明提供的对话问题生成方法可自动生成下一轮对话的问题和答案,即下一轮对话的问答对,本发明提供的对话问题生成方法的泛化能力强,生成问答对的效果稳定。

    意图理解方法、装置、电子设备和存储介质

    公开(公告)号:CN115879478A

    公开(公告)日:2023-03-31

    申请号:CN202211679021.1

    申请日:2022-12-26

    Abstract: 本发明提供一种意图理解方法、装置、电子设备和存储介质,其中方法包括:获取待理解的文本,以及文本的语义标签树;基于文本的语义特征与语义标签树的图编码特征之间的相关性,对语义特征进行特征增强,得到文本的增强语义特征;基于文本的增强语义特征,对文本进行意图理解。本发明提供的方法、装置、电子设备和存储介质,通过构建待理解的文本的语义标签树,并基于文本的语义特征与语义标签树的图编码特征之间的相关性,对语义特征进行特征增强,达到凸显语义特征中与文本意图相关的特征表示的效果;基于由此得到的增强语义特征进行意图理解,能够保证意图理解的可靠性,尤其能够提高对长难句和多意图句子的意图理解的全面性和精确性。

    问题生成方法、问题生成设备及存储介质

    公开(公告)号:CN115080722B

    公开(公告)日:2023-02-17

    申请号:CN202210995732.3

    申请日:2022-08-19

    Abstract: 本申请提供一种问题生成方法、问题生成设备及存储介质,其中,该问题生成方法包括:获取待处理文本;将所述待处理文本进行处理,得到所述待处理文本中的至少一个实体;基于所述至少一个实体依次从数据库搜索所述至少一个实体对应的描述信息;将所述待处理文本、所述至少一个实体及其对应的所述描述信息输入问题生成模型,生成至少一个文本答案及其对应的问题。本申请提供的问题生成方法,能够基于数据库提供的辅助信息使得生成的问答对更加合理,并且与领域的相关度更高,信息更加丰富;除此之外,还能够提取超出规则以外的问答对,通用性更高。

    一种语义提取方法及装置

    公开(公告)号:CN109684640A

    公开(公告)日:2019-04-26

    申请号:CN201811602371.1

    申请日:2018-12-26

    CPC classification number: G06F17/2785

    Abstract: 本申请提供了一种语义提取方法及装置,提取表征待理解对象所属的知识点的特征、表征待理解对象的上下文信息的特征、表征待理解对象的解释信息和/或近义词信息的特征,并依据提取的特征确定语义。因为使用不同依据提取的特征,能够从不同维度表达待理解对象,因此,确定的语义更加准确。

    一种差异项判别方法及装置

    公开(公告)号:CN112528894B

    公开(公告)日:2024-05-31

    申请号:CN202011496118.X

    申请日:2020-12-17

    Abstract: 本申请公开了一种差异项判别方法及装置,该方法包括:获取第一单句的识别结果与第二单句的识别结果中的目标差异项,目标差异项包括第一差异文本和第二差异文本,第一单句包括公共项和第一差异文本,第二单句包括公共项和第二差异文本;基于语言预测模型以及公共项确定第一差异文本对应的第一概率和第二差异文本对应的第二概率;根据第一概率和第二概率,判断目标差异项是否为真正的差异项。实施本申请,能够有效判别真正的差异项,实现对因OCR识别错误导致的非真正的差异项的过滤,从而提高了单句对比的准确率。

    文档结构化方法、装置、电子设备和存储介质

    公开(公告)号:CN113641746B

    公开(公告)日:2024-02-20

    申请号:CN202110961595.7

    申请日:2021-08-20

    Abstract: 本发明提供一种文档结构化方法、装置、电子设备和存储介质,所述方法包括:提取目标文档中各文本行的视觉特征;基于各文本行的视觉特征,对各文本行逐行进行结构关系解码和基于结构关系的结构化类型解码,得到各文本行之间的结构关系,以及各文本行的结构化类型;基于各文本行之间的结构关系,以及各文本行的结构化类型,对目标文档进行结构化处理。本发明基于目标文档中各文本行的视觉特征,确定各文本行之间的结构关系以及各文本行的结构化类型,并基于各文本行之间的结构关系,以及各文本行的结构化类型,对目标文档进行结构化处理,使得结构化处理后的目标文档能够准确表征有各文本行之间的空间结构信息,鲁棒性较高。

    一种语义理解方法及装置

    公开(公告)号:CN109271637B

    公开(公告)日:2023-12-01

    申请号:CN201811158985.5

    申请日:2018-09-30

    Abstract: 本申请提供了一种语义理解方法及装置,获取语义理解对象,依据语义理解对象和语义理解对象的上下文对象,预测主题,并依据语义理解对象、语义理解对象的上下文对象以及主题,确定语义理解对象的语义理解结果。因为将主题和上下文对象均作为语义理解的依据,且主题依据语义理解对象及其上下文对象得到,因此,具有较高的准确性。

    事件抽取方法、装置、设备及存储介质

    公开(公告)号:CN114254089A

    公开(公告)日:2022-03-29

    申请号:CN202111479664.7

    申请日:2021-12-06

    Inventor: 戴瑾 宋时德

    Abstract: 本申请实施例公开了一种事件抽取方法、装置、设备及存储介质,获取目标事件类型关联的描述性问句;在源数据中查找上述描述性问句的答案;将答案与描述性问句对应的事件角色相关联。可见,本申请方案,提供了一种新的事件抽取方法,该方法不再将事件角色作为机器学习的目标,当有新的事件角色时,只需要增加事件角色与描述性问句的对应关系即可,而该对应关系的增加操作简单、即时,不会对本申请提供的事件抽取方法产生影响,从而避免事件角色作为类别对事件抽取的影响,提高了事件抽取方法对于用户使用的便利性。

Patent Agency Ranking