-
公开(公告)号:CN110569350B
公开(公告)日:2022-08-09
申请号:CN201910728071.6
申请日:2019-08-08
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC: G06F16/335 , G06F16/35 , G06F16/36 , G06Q50/18
Abstract: 本发明提供一种法条推荐方法、设备和存储介质。该方法包括:获取用户输入的法律问题的语义分析结果;根据所述法律问题的语义分析结果,获取与所述法律问题对应的多个相关的法条,并建立多个问题‑法条对;所述问题‑法条对包括:所述法律问题与各个所述相关的法条的配对;利用训练得到的法条匹配模型,对多个所述问题‑法条对进行筛选,得到匹配概率最大的前N个问题‑法条对;N为大于0的整数;向用户推荐所述前N个问题‑法条对中的法条。本发明实施例提高了法条推荐效果。
-
公开(公告)号:CN114254623A
公开(公告)日:2022-03-29
申请号:CN202111527097.8
申请日:2021-12-14
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC: G06F40/211 , G06F40/30 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种文本纠错方法、装置、设备及存储介质,方法包括:获取待纠错文本;获取多个位置分别对应的候选字符集合,所述位置对应的候选字符集合包括与位于待纠错文本中所述位置的字符的具有关联关系的候选字符;获取多个候选文本分别对应的关联分数,候选文本的每一位置的字符为该位置对应的候选字符集合中的候选字符;根据多个候选文本分别对应的关联分数,从多个候选文本中确定待纠错文本对应的纠正后文本。由于本申请考虑了候选文本的各位置的候选字符之间的关联关系,因此,候选文本的关联分数能够体现候选文本作为一个整体的准确程度,根据候选文本分别对应的关联分数,能够准确地确定出待纠错文本对应的纠正后文本。
-
公开(公告)号:CN113947073A
公开(公告)日:2022-01-18
申请号:CN202111210946.7
申请日:2021-10-18
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC: G06F40/232 , G06F40/242 , G06F40/30 , G06V10/74 , G06V30/24 , G06K9/62
Abstract: 本发明提供一种人名纠正方法、装置、电子设备和存储介质,所述方法包括:确定待纠错文本中的错误人名,以及错误人名对应的候选人名;将待纠错文本中的错误人名替换为候选人名,得到候选文本;基于候选文本与候选人名间的语义相似度、待纠错文本的人名预测结果与候选人名间的相似度,以及待纠错文本的人名预测位置与候选人名的位置间的一致性,确定待纠错文本的人名纠正结果。本发明提供的人名纠正方法、装置、电子设备和存储介质,能够进一步提高人名纠正结果精度。
-
公开(公告)号:CN112580310A
公开(公告)日:2021-03-30
申请号:CN202011582902.2
申请日:2020-12-28
Applicant: 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司 , 科大讯飞股份有限公司
IPC: G06F40/166 , G06F40/289 , G06F40/117 , G06N3/04 , G06N3/08
Abstract: 本申请提供一种缺失字/词的补全方法,该方法包括用语言模型识别缺失句中缺失位置,其中语言模型为以伪数据作为输入而进行预训练所得到的模型,缺失句表征存在成分缺失错误的语句;用语言模型生成缺失位置处所缺失的多个候选字/词;对多个候选字/词进行排序,以确定缺失位置处所缺失的缺失字/词。本申请还提供相应的电子设备。通过上述方法,本申请能实现更加快速准确地对文本中字、词缺失问题进行纠正补全。
-
公开(公告)号:CN112463925A
公开(公告)日:2021-03-09
申请号:CN202011385784.6
申请日:2020-12-01
Applicant: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司
IPC: G06F16/33 , G06F16/335 , G06Q50/18
Abstract: 本申请公开了一种案件卷宗处理方法、相关设备及可读存储介质,预先构建包含多条知识的法律法规知识库,每条知识指示一个案由、一个事实要素与至少一个法律法规的对应关系。在获取待处理案件卷宗对应的文本之后,先确定文本中包含的案由以及每个案由对应的事实要素,然后,针对每个案由对应的每个事实要素,基于预先构建的法律法规知识库即可确定与该案由对应,且与该事实要素对应的法律法规,最终,基于确定出的法律法规,确定所述待处理案件卷宗的适用法律法规。基于上述方案,在需要确定某个待处理案件卷宗的适用法律法规时,通过预先构建的法律法规知识库即可自动确定,避免了受法律专家主观情感因素的影响,保证案件判决的公平性。
-
公开(公告)号:CN111553143A
公开(公告)日:2020-08-18
申请号:CN202010362151.7
申请日:2020-04-30
Applicant: 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司 , 科大讯飞股份有限公司
IPC: G06F40/232 , G06F40/284
Abstract: 本申请公开了一种文本纠错方法、相关设备及可读存储介质,在获取待纠错文本之后,分别待纠错文本进行字级别乱序纠错和词级别乱序纠错,得到字级别乱序纠错后的文本以及词级别乱序纠错后的文本,基于字级别乱序纠错后的文本以及词级别乱序纠错后的文本,即可得到纠错后的最终文本,基于上述方案,能够实现对文本中出现的乱序进行纠错,且相对于人工纠错的方式,可以节省人力和时间,进而可以提升纠错效率。
-
公开(公告)号:CN110569350A
公开(公告)日:2019-12-13
申请号:CN201910728071.6
申请日:2019-08-08
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC: G06F16/335 , G06F16/35 , G06F16/36 , G06Q50/18
Abstract: 本发明提供一种法条推荐方法、设备和存储介质。该方法包括:获取用户输入的法律问题的语义分析结果;根据所述法律问题的语义分析结果,获取与所述法律问题对应的多个相关的法条,并建立多个问题-法条对;所述问题-法条对包括:所述法律问题与各个所述相关的法条的配对;利用训练得到的法条匹配模型,对多个所述问题-法条对进行筛选,得到匹配概率最大的前N个问题-法条对;N为大于0的整数;向用户推荐所述前N个问题-法条对中的法条。本发明实施例提高了法条推荐效果。
-
公开(公告)号:CN119066184B
公开(公告)日:2025-02-28
申请号:CN202411570789.4
申请日:2024-11-06
Applicant: 科大讯飞股份有限公司
IPC: G06F16/3329 , G06F16/334 , G06F16/335 , G06F16/35 , G06F40/289
Abstract: 本申请公开了一种查询语句推荐方法及相关装置、设备和存储介质,其中,查询语句推荐方法包括:将参考查询语句中目标分词替换所属分词类型,得到模板查询语句;基于各个模板查询语句进行聚类,得到若干语句集合;基于相同语句集合内各个模板查询语句分别所替换的目标分词,组合得到对应语句集合的分词集合;基于目标查询语句中核心实体词与各个语句集合的分词集合进行匹配,得到对应语句集合的匹配结果;其中,目标查询语句为本次查询时输入至智能对话系统的查询语句;在参考各个语句集合的匹配结果所选择的语句集合内,选择至少一个模板查询语句得到推荐查询语句。上述方案,能够提升查询语句推荐的质量,并降低查询语句推荐的成本和耗时。
-
公开(公告)号:CN117852529A
公开(公告)日:2024-04-09
申请号:CN202311823599.4
申请日:2023-12-26
Applicant: 科大讯飞股份有限公司
IPC: G06F40/253 , G06F40/30 , G06F40/242
Abstract: 本申请提供一种标点符号检测和纠错方法、装置、电子设备及存储介质,该方法基于构建的标点纠错词典,包括:调用第一函数,对输入文本进行检测,判断是否包含半角标点,并将半角标点转换为全角标点。调用第二函数,检测输入文本是否包含连续的多个相同标点符号,并对其进行纠错。调用第三函数,对输入文本进行检测,识别是否存在汉字标点字符错误,并进行相应的纠错处理。调用第四函数,检测输入文本中是否存在不匹配的成对标点符号,并对不匹配的成对标点进行纠错。本申请,能够有效地改进文本中标点符号的错误,并提高文本质量。
-
公开(公告)号:CN111310457B
公开(公告)日:2024-02-02
申请号:CN202010125461.7
申请日:2020-02-27
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司 , 科大讯飞股份有限公司
IPC: G06F40/284 , G06F40/289 , G06F40/216 , G06F40/211
Abstract: 本发明实施例提供一种词语搭配不当识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别文本中的存在搭配关系的两个待识别词;将待识别文本中的任一待识别词替换为遮盖标记,得到任一待识别词对应的输入文本;将任一待识别词对应的输入文本输入至词语预测模型,得到词语预测模型输出的任一待识别词的预测结果;其中,词语预测模型是基于样本文本训练得到的;基于两个待识别词的预测结果,确定词语搭配不当识别结果。本发明实施例提供的词语搭配不当识别方法、装置、电子设备和存储介质,能够基于待识别文本的语境,识别出语义层面上搭配不当的词语,提高了词语搭配不当识别的准确率。
-
-
-
-
-
-
-
-
-