-
公开(公告)号:CN111814487B
公开(公告)日:2024-05-31
申请号:CN202010691064.6
申请日:2020-07-17
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/279 , G06F40/216
Abstract: 本申请提供了一种语义理解方法、装置、设备及存储介质,其中,方法包括:获取目标文本;根据目标文本以及预先针对目标文本所属领域构建的知识语义树模板,生成能够体现目标文本语义的知识语义树,作为目标知识语义树,其中,知识语义树模板包括目标文本所属领域中能够体现语义的多个实体、多个实体分别对应的实体的类型以及多个实体之间的关系,目标知识语义树包括能够体现目标文本语义的多个目标实体、多个目标实体分别对应的实体类型以及多个目标实体之间的关系;根据目标知识语义树,从标准文本集合中确定目标文本对应的标准文本。本申请提供的语义理解方法能够正确理解目标文本所表达内容的真正语义。
-
公开(公告)号:CN111144127B
公开(公告)日:2023-07-25
申请号:CN201911360687.9
申请日:2019-12-25
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/289 , G06F16/33
Abstract: 本申请公开了一种文本语义识别方法及其模型的获取方法及相关装置,其中,文本语义识别方法包括:从多个文本规则中筛选与待识别文本匹配的文本规则,其中,多个文本规则是对标注有文本语义的多个样本文本进行分析而得到的;基于匹配的文本规则和待识别文本,获取待识别文本的关键词序列;将待识别文本和关键词序列输入经训练得到的文本语义识别模型进行语义理解,获取待识别文本的文本语义;其中,文本语义识别模型是利用标注有文本语义的多个训练文本及其关键词序列训练预设神经网络得到的。上述方案,能够提高文本语义识别的准确性。
-
公开(公告)号:CN111460169B
公开(公告)日:2023-06-02
申请号:CN202010230282.X
申请日:2020-03-27
Applicant: 科大讯飞股份有限公司
IPC: G06F16/36 , G06F40/30 , G06F18/214
Abstract: 本发明公开了一种语义表达式生成方法、装置及设备。其中主要构思在于先从待处理文本中提炼出完整涵盖用户意图的各语义要素及各语义要素之间的关联关系,在此基础上,再从中梳理出能够清晰表示出文本语义的关键语义要素,并由此形成可以作为语义表达式的关键语义要素序列。本发明相比现有的语义表达生成方式,能够从整体上考虑提炼语义要素并考虑要素之间的关联关系,而在此基础上整理出的关键语义要素及形成的关键语义要素序列便更为准确、直接地表达出真实语义,并且本发明基于语义要素及相互关联关系的抽取和梳理,使得各语义要素的关键程度清晰展现,无需繁琐、冗余地进行比对、匹配等操作,便可高效地输出最终的语义表达式。
-
公开(公告)号:CN115630699A
公开(公告)日:2023-01-20
申请号:CN202211282701.X
申请日:2022-10-19
Applicant: 科大讯飞股份有限公司
IPC: G06N5/025 , G06F40/279 , G06F40/216 , G06N3/0455 , G06N3/04
Abstract: 本申请公开了一种故障知识文本的抽取方法及抽取装置、设备和介质,其中,故障知识文本的抽取方法包括:对产品说明文本依次进行主客实体预测,得到主实体第一预测结果和客实体第一预测结果,并对产品说明文本依次进行客主实体预测,得到客实体第二预测结果和主实体第二预测结果;基于主实体第一预测结果和主实体第二预测结果,在产品说明文本中抽取故障主实体,并基于客实体第一预测结果和客实体第二预测结果,在产品说明文本中抽取故障客实体;基于故障主实体和故障客实体,构建故障知识文本。上述方案,能够提升故障知识的抽取效果。
-
公开(公告)号:CN112528894A
公开(公告)日:2021-03-19
申请号:CN202011496118.X
申请日:2020-12-17
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种差异项判别方法及装置,该方法包括:获取第一单句的识别结果与第二单句的识别结果中的目标差异项,目标差异项包括第一差异文本和第二差异文本,第一单句包括公共项和第一差异文本,第二单句包括公共项和第二差异文本;基于语言预测模型以及公共项确定第一差异文本对应的第一概率和第二差异文本对应的第二概率;根据第一概率和第二概率,判断目标差异项是否为真正的差异项。实施本申请,能够有效判别真正的差异项,实现对因OCR识别错误导致的非真正的差异项的过滤,从而提高了单句对比的准确率。
-
公开(公告)号:CN112115892A
公开(公告)日:2020-12-22
申请号:CN202011016413.0
申请日:2020-09-24
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种关键要素抽取方法、装置、设备及存储介质,该方法包括:对目标图像进行识别,得到识别的文本内容,以及文本内容在所述目标图像中的位置信息;根据识别到的文本内容,以及文本内容在所述目标图像中的位置信息,生成识别到的文本内容的文本特征;根据识别到的文本内容的文本特征,从识别到的文本内容中抽取关键要素。在上述处理过程中,对目标图像中的文本内容生成的文本特征,同时包含了文本的内容特征和位置特征,当基于该文本特征进行关键要素抽取时,可以兼顾文本的内容和位置,从而能够更加准确地从目标图像的文本内容中抽取出关键要素。
-
公开(公告)号:CN111144127A
公开(公告)日:2020-05-12
申请号:CN201911360687.9
申请日:2019-12-25
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/289 , G06F16/33
Abstract: 本申请公开了一种文本语义识别方法及其模型的获取方法及相关装置,其中,文本语义识别方法包括:从多个文本规则中筛选与待识别文本匹配的文本规则,其中,多个文本规则是对标注有文本语义的多个样本文本进行分析而得到的;基于匹配的文本规则和待识别文本,获取待识别文本的关键词序列;将待识别文本和关键词序列输入经训练得到的文本语义识别模型进行语义理解,获取待识别文本的文本语义;其中,文本语义识别模型是利用标注有文本语义的多个训练文本及其关键词序列训练预设神经网络得到的。上述方案,能够提高文本语义识别的准确性。
-
-
-
-
-
-