-
公开(公告)号:CN114154497A
公开(公告)日:2022-03-08
申请号:CN202111467935.7
申请日:2021-12-03
申请人: 科大讯飞河北科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/289 , G06F40/211 , G06F40/30 , G06K9/62
摘要: 本发明提供一种语病识别方法、装置、电子设备和存储介质,所述方法包括:确定待识别语句;提取待识别语句中各分词的分词表示;基于待识别语句中各分词的分词表示,以及待识别语句的句法结构,对待识别语句进行语病识别;分词表示用于表征对应分词的上下文语义和对应分词与待识别语句中其余分词间的句法依赖关系。本发明提供的语病识别方法、装置、电子设备和存储介质,能够结合语义信息和句法信息对待识别语句中的句法结构问题和语义问题进行病句识别,进而准确得到病句识别结果。
-
公开(公告)号:CN114997161A
公开(公告)日:2022-09-02
申请号:CN202210564852.8
申请日:2022-05-23
申请人: 河北省讯飞人工智能研究院 , 科大讯飞河北科技有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/289 , G06F40/268 , G06F40/30 , G06N3/04
摘要: 本发明提供一种关键词抽取方法、装置、电子设备与存储介质,其中方法包括:确定待抽取的文本;基于所述文本中各分词的词性,以及所述各分词中至少一个分词的出现频次,对所述至少一个分词进行词组合并,得到所述文本的词组;基于各词组的语义特征进行关键词抽取,得到所述文本中的关键词。本发明提供的方法、装置、电子设备与存储介质,提升了关键词抽取的准确性,同时实现了基于词组粒度的关键词抽取,解决了词粒度关键词语义模糊、泛化等问题,使得提取出的关键词更加完整地保留语义,以便对文本内容的快速理解,有利于后续的推荐和检索。
-
公开(公告)号:CN110008327B
公开(公告)日:2022-01-14
申请号:CN201910257194.6
申请日:2019-04-01
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F40/295 , G06Q50/18
摘要: 本发明实施例提供一种法律回答生成方法及装置,属于自然语言处理技术领域。包括:获取问题数据,问题数据与法律咨询相关;将问题数据输入至强化学习模型中,输出回答数据。由于强化学习模型是基于初始模型训练得到的,而初始模型的类型为编解码模型,而不是基于历史信息检索,从而不需要依赖于历史的法律问答数据,可以针对法律提问创造出新的回答数据。因此,能够提供覆盖范围较广的回答。其次,由于初始模型的类型为编解码模型,从而不需要以三元组的形式表示训练数据,进而经初始模型训练得到的强化学习模型更适用于法律提问的回答。
-
公开(公告)号:CN110008327A
公开(公告)日:2019-07-12
申请号:CN201910257194.6
申请日:2019-04-01
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F17/27 , G06Q50/18
摘要: 本发明实施例提供一种法律回答生成方法及装置,属于自然语言处理技术领域。包括:获取问题数据,问题数据与法律咨询相关;将问题数据输入至强化学习模型中,输出回答数据。由于强化学习模型是基于初始模型训练得到的,而初始模型的类型为编解码模型,而不是基于历史信息检索,从而不需要依赖于历史的法律问答数据,可以针对法律提问创造出新的回答数据。因此,能够提供覆盖范围较广的回答。其次,由于初始模型的类型为编解码模型,从而不需要以三元组的形式表示训练数据,进而经初始模型训练得到的强化学习模型更适用于法律提问的回答。
-
公开(公告)号:CN115099222A
公开(公告)日:2022-09-23
申请号:CN202210474457.0
申请日:2022-04-29
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/226 , G06F40/216 , G06F40/232 , G06F16/35 , G06N3/08
摘要: 本申请公开了一种标点符号误用检测纠正方法、装置、设备及存储介质,该方法包括以下步骤:将获取的待检测文本输入到已训练的纠错模型中进行第一检测,以获得多个位置的第一预测纠正结果,第一预测纠正结果中包括对每一位置预测执行的修改操作类型、每一位置对应的预测纠正后的标点符号类型;基于每一位置预测执行的修改操作类型,确定每一位置所应执行的第二检测的检测方式;基于确定的检测方式进行第二检测,以获得每一位置的第二预测纠正结果;基于每一位置对应的第一预测纠正结果和/或第二预测纠正结果,确定每一位置的目标纠正结果。
-
公开(公告)号:CN110569350B
公开(公告)日:2022-08-09
申请号:CN201910728071.6
申请日:2019-08-08
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F16/335 , G06F16/35 , G06F16/36 , G06Q50/18
摘要: 本发明提供一种法条推荐方法、设备和存储介质。该方法包括:获取用户输入的法律问题的语义分析结果;根据所述法律问题的语义分析结果,获取与所述法律问题对应的多个相关的法条,并建立多个问题‑法条对;所述问题‑法条对包括:所述法律问题与各个所述相关的法条的配对;利用训练得到的法条匹配模型,对多个所述问题‑法条对进行筛选,得到匹配概率最大的前N个问题‑法条对;N为大于0的整数;向用户推荐所述前N个问题‑法条对中的法条。本发明实施例提高了法条推荐效果。
-
公开(公告)号:CN114254623A
公开(公告)日:2022-03-29
申请号:CN202111527097.8
申请日:2021-12-14
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/211 , G06F40/30 , G06F16/35 , G06N3/04 , G06N3/08
摘要: 本申请提供了一种文本纠错方法、装置、设备及存储介质,方法包括:获取待纠错文本;获取多个位置分别对应的候选字符集合,所述位置对应的候选字符集合包括与位于待纠错文本中所述位置的字符的具有关联关系的候选字符;获取多个候选文本分别对应的关联分数,候选文本的每一位置的字符为该位置对应的候选字符集合中的候选字符;根据多个候选文本分别对应的关联分数,从多个候选文本中确定待纠错文本对应的纠正后文本。由于本申请考虑了候选文本的各位置的候选字符之间的关联关系,因此,候选文本的关联分数能够体现候选文本作为一个整体的准确程度,根据候选文本分别对应的关联分数,能够准确地确定出待纠错文本对应的纠正后文本。
-
公开(公告)号:CN113947073A
公开(公告)日:2022-01-18
申请号:CN202111210946.7
申请日:2021-10-18
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/232 , G06F40/242 , G06F40/30 , G06V10/74 , G06V30/24 , G06K9/62
摘要: 本发明提供一种人名纠正方法、装置、电子设备和存储介质,所述方法包括:确定待纠错文本中的错误人名,以及错误人名对应的候选人名;将待纠错文本中的错误人名替换为候选人名,得到候选文本;基于候选文本与候选人名间的语义相似度、待纠错文本的人名预测结果与候选人名间的相似度,以及待纠错文本的人名预测位置与候选人名的位置间的一致性,确定待纠错文本的人名纠正结果。本发明提供的人名纠正方法、装置、电子设备和存储介质,能够进一步提高人名纠正结果精度。
-
公开(公告)号:CN112580310A
公开(公告)日:2021-03-30
申请号:CN202011582902.2
申请日:2020-12-28
申请人: 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司 , 科大讯飞股份有限公司
IPC分类号: G06F40/166 , G06F40/289 , G06F40/117 , G06N3/04 , G06N3/08
摘要: 本申请提供一种缺失字/词的补全方法,该方法包括用语言模型识别缺失句中缺失位置,其中语言模型为以伪数据作为输入而进行预训练所得到的模型,缺失句表征存在成分缺失错误的语句;用语言模型生成缺失位置处所缺失的多个候选字/词;对多个候选字/词进行排序,以确定缺失位置处所缺失的缺失字/词。本申请还提供相应的电子设备。通过上述方法,本申请能实现更加快速准确地对文本中字、词缺失问题进行纠正补全。
-
公开(公告)号:CN110569350A
公开(公告)日:2019-12-13
申请号:CN201910728071.6
申请日:2019-08-08
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F16/335 , G06F16/35 , G06F16/36 , G06Q50/18
摘要: 本发明提供一种法条推荐方法、设备和存储介质。该方法包括:获取用户输入的法律问题的语义分析结果;根据所述法律问题的语义分析结果,获取与所述法律问题对应的多个相关的法条,并建立多个问题-法条对;所述问题-法条对包括:所述法律问题与各个所述相关的法条的配对;利用训练得到的法条匹配模型,对多个所述问题-法条对进行筛选,得到匹配概率最大的前N个问题-法条对;N为大于0的整数;向用户推荐所述前N个问题-法条对中的法条。本发明实施例提高了法条推荐效果。
-
-
-
-
-
-
-
-
-