-
公开(公告)号:CN114154497A
公开(公告)日:2022-03-08
申请号:CN202111467935.7
申请日:2021-12-03
申请人: 科大讯飞河北科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/289 , G06F40/211 , G06F40/30 , G06K9/62
摘要: 本发明提供一种语病识别方法、装置、电子设备和存储介质,所述方法包括:确定待识别语句;提取待识别语句中各分词的分词表示;基于待识别语句中各分词的分词表示,以及待识别语句的句法结构,对待识别语句进行语病识别;分词表示用于表征对应分词的上下文语义和对应分词与待识别语句中其余分词间的句法依赖关系。本发明提供的语病识别方法、装置、电子设备和存储介质,能够结合语义信息和句法信息对待识别语句中的句法结构问题和语义问题进行病句识别,进而准确得到病句识别结果。
-
公开(公告)号:CN114254623A
公开(公告)日:2022-03-29
申请号:CN202111527097.8
申请日:2021-12-14
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/211 , G06F40/30 , G06F16/35 , G06N3/04 , G06N3/08
摘要: 本申请提供了一种文本纠错方法、装置、设备及存储介质,方法包括:获取待纠错文本;获取多个位置分别对应的候选字符集合,所述位置对应的候选字符集合包括与位于待纠错文本中所述位置的字符的具有关联关系的候选字符;获取多个候选文本分别对应的关联分数,候选文本的每一位置的字符为该位置对应的候选字符集合中的候选字符;根据多个候选文本分别对应的关联分数,从多个候选文本中确定待纠错文本对应的纠正后文本。由于本申请考虑了候选文本的各位置的候选字符之间的关联关系,因此,候选文本的关联分数能够体现候选文本作为一个整体的准确程度,根据候选文本分别对应的关联分数,能够准确地确定出待纠错文本对应的纠正后文本。
-
公开(公告)号:CN112685548A
公开(公告)日:2021-04-20
申请号:CN202011627778.7
申请日:2020-12-31
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F40/151 , G06F40/242 , G06F40/284 , G06F40/289 , G06F40/30
摘要: 本申请公开了一种问题回答方法以及电子设备、存储装置,其中,问题回答方法包括:获取问题文本和篇章文本,并获取若干知识点的参考文本;其中,问题文本和篇章文本包含若干词语,若干知识点与问题文本、篇章文本中的至少一者相关;提取若干词语的个体语义表示,并提取各个参考文本的原始语义表示;利用若干词语的个体语义表示和各个参考文本的原始语义表示,从篇章文本中预测得到问题文本的回答文本。上述方案,能够提高问题回答的准确性。
-
公开(公告)号:CN112580310A
公开(公告)日:2021-03-30
申请号:CN202011582902.2
申请日:2020-12-28
申请人: 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司 , 科大讯飞股份有限公司
IPC分类号: G06F40/166 , G06F40/289 , G06F40/117 , G06N3/04 , G06N3/08
摘要: 本申请提供一种缺失字/词的补全方法,该方法包括用语言模型识别缺失句中缺失位置,其中语言模型为以伪数据作为输入而进行预训练所得到的模型,缺失句表征存在成分缺失错误的语句;用语言模型生成缺失位置处所缺失的多个候选字/词;对多个候选字/词进行排序,以确定缺失位置处所缺失的缺失字/词。本申请还提供相应的电子设备。通过上述方法,本申请能实现更加快速准确地对文本中字、词缺失问题进行纠正补全。
-
公开(公告)号:CN112685548B
公开(公告)日:2023-09-08
申请号:CN202011627778.7
申请日:2020-12-31
申请人: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F40/151 , G06F40/242 , G06F40/284 , G06F40/289 , G06F40/30
摘要: 本申请公开了一种问题回答方法以及电子设备、存储装置,其中,问题回答方法包括:获取问题文本和篇章文本,并获取若干知识点的参考文本;其中,问题文本和篇章文本包含若干词语,若干知识点与问题文本、篇章文本中的至少一者相关;提取若干词语的个体语义表示,并提取各个参考文本的原始语义表示;利用若干词语的个体语义表示和各个参考文本的原始语义表示,从篇章文本中预测得到问题文本的回答文本。上述方案,能够提高问题回答的准确性。
-
公开(公告)号:CN112580310B
公开(公告)日:2023-04-18
申请号:CN202011582902.2
申请日:2020-12-28
申请人: 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司 , 科大讯飞股份有限公司
IPC分类号: G06F40/166 , G06F40/289 , G06F40/117 , G06N3/045 , G06N3/08
摘要: 本申请提供一种缺失字/词的补全方法,该方法包括用语言模型识别缺失句中缺失位置,其中语言模型为以伪数据作为输入而进行预训练所得到的模型,缺失句表征存在成分缺失错误的语句;用语言模型生成缺失位置处所缺失的多个候选字/词;对多个候选字/词进行排序,以确定缺失位置处所缺失的缺失字/词。本申请还提供相应的电子设备。通过上述方法,本申请能实现更加快速准确地对文本中字、词缺失问题进行纠正补全。
-
公开(公告)号:CN111310447B
公开(公告)日:2024-02-02
申请号:CN202010192025.1
申请日:2020-03-18
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/253 , G06F40/232
摘要: 本发明实施例提供一种语法纠错方法、装置、电子设备和存储介质,其中方法包括:确定待纠错的文本;将文本输入至语法纠错模型,得到语法纠错模型输出的文本中每个字的检错结果和纠正结果;其中,语法纠错模型是基于样本文本、样本文本中每个样本字的样本检错结果和样本纠正结果训练得到的;语法纠错模型用于确定文本中每个字的检错结果,并基于每个字的检错结果所对应的解码方式,确定每个字的纠正结果。本发明实施例提供的方法、装置、电子设备和存储介质,无需人工校对即可实现语法纠错,在保证语法纠错效率的同时,提高了语法纠错的准确性和可靠性。
-
公开(公告)号:CN111310447A
公开(公告)日:2020-06-19
申请号:CN202010192025.1
申请日:2020-03-18
申请人: 科大讯飞股份有限公司
IPC分类号: G06F40/253 , G06F40/232
摘要: 本发明实施例提供一种语法纠错方法、装置、电子设备和存储介质,其中方法包括:确定待纠错的文本;将文本输入至语法纠错模型,得到语法纠错模型输出的文本中每个字的检错结果和纠正结果;其中,语法纠错模型是基于样本文本、样本文本中每个样本字的样本检错结果和样本纠正结果训练得到的;语法纠错模型用于确定文本中每个字的检错结果,并基于每个字的检错结果所对应的解码方式,确定每个字的纠正结果。本发明实施例提供的方法、装置、电子设备和存储介质,无需人工校对即可实现语法纠错,在保证语法纠错效率的同时,提高了语法纠错的准确性和可靠性。
-
-
-
-
-
-
-