-
公开(公告)号:CN115455193A
公开(公告)日:2022-12-09
申请号:CN202210997221.5
申请日:2022-08-18
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC分类号: G06F16/36 , G06F40/279 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本申请提出一种知识图谱补全方法、装置、电子设备及存储介质,方法包括:对待预测三元组中的头实体和尾实体进行信息交互融合,得到头实体对应的代理头实体和尾实体对应的代理尾实体;通过计算按照待预测三元组中的头尾实体关系对代理头实体进行平移变换得到的实体与代理尾实体之间的差异,确定待预测三元组成立的概率;若待预测三元组成立的概率达到预设阈值,则利用待预测三元组对知识图谱进行补全。采用本申请的技术方案,可以实现三元组中头实体和尾实体的信息交互融合,利用实体信息交互后的代理头实体和代理尾实体判断三元组是否成立,能够提高事实三元组的判定准确性和知识图谱补全的准确度。
-
公开(公告)号:CN113705240B
公开(公告)日:2024-04-19
申请号:CN202110888038.7
申请日:2021-08-03
申请人: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
摘要: 本申请公开了一种基于多语种分支模型的文本处理方法及相关装置,所述多语种分支模型包括嵌入层、多分支处理网络、第一混合器、共享网络和输出层,所述文本处理方法包括:基于所述嵌入层,获得待处理的文本对应的初始语义表示;基于所述多分支处理网络、所述第一混合器以及所述共享网络,对所述初始语义表示进行处理以获得综合语义表示;基于所述输出层,对所述综合语义表示进行变换以获得输出结果。通过上述方式,本申请能够在具备多语种处理能力的基础上,提高处理结果的精确度。
-
公开(公告)号:CN117520481A
公开(公告)日:2024-02-06
申请号:CN202311576882.1
申请日:2023-11-23
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F16/33 , G06F16/35 , G06F18/241 , G06F18/2431 , G06N3/096 , G06N3/09 , G06N3/088
摘要: 本发明提供一种信息检索方法、装置、电子设备和存储介质,涉及自然语言处理技术领域。其中方法包括:将用于检索的输入文本输入至意图识别模型,得到所述意图识别模型输出的意图识别结果;基于所述意图识别结果,确定所述输入文本对应的目标意图;输出所述目标意图对应的信息检索结果;其中,所述意图识别模型是基于第一样本文本和所述第一样本文本对应的第一意图标签,对初始识别模型进行训练得到的,所述初始识别模型包括多个子识别模型,任一所述子识别模型包括依次连接的预训练模型和分类器,所述多个子识别模型中的预训练模型不同。本发明提供的方法、装置、电子设备和存储介质可以提高意图识别的准确性,进而提高信息检索的准确性。
-
公开(公告)号:CN115169297A
公开(公告)日:2022-10-11
申请号:CN202210709307.3
申请日:2022-06-21
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/166 , G06F40/289 , G06F40/30
摘要: 本发明提供一种文本改写方法、装置、电子设备和存储介质,所述方法包括:获取第一文本;将目标改写等级以及第一文本输入至文本改写模型,得到文本改写模型输出的与目标改写等级对应的第二文本;文本改写模型基于第一样本文本、第二样本文本以及样本改写等级训练得到,样本改写等级基于第一样本文本与第二样本文本之间的字符相似度确定。本发明提供的文本改写方法、装置、电子设备和存储介质,基于第一样本文本、第二样本文本以及样本改写等级训练得到文本改写模型,使得文本改写模型能够根据不同目标改写等级对第一文本进行文本改写,得到与不同目标改写等级对应的第二文本,实现能够根据不同场景需求灵活变更改写文本。
-
公开(公告)号:CN115690455A
公开(公告)日:2023-02-03
申请号:CN202211360681.3
申请日:2022-11-02
申请人: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06V10/46 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本申请公开了一种跨模态数据转换方法、装置、设备及可读存储介质。在获取待转换的源模态的数据之后,先对该源模态的数据进行离散化处理,确定源模态的数据的离散化表示,再将该源模态的数据的离散化表示转换为目标模态的离散化表示,最后再对该目标模态的离散化表示进行解码处理,得到目标模态的数据。该过程中,将源模态的数据的离散化表示转换为目标模态的离散化表示,是由一个离散的空间转换到另一个离散的空间,转换前后空间对等,更易实现,再对目标模态的离散化表示进行解析即可得到目标模态的数据,相对于基于离散的空间到一个连续的物理空间的转换得到目标模态的数据,转换难度降低。
-
公开(公告)号:CN114492453A
公开(公告)日:2022-05-13
申请号:CN202111677576.8
申请日:2021-12-31
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/30 , G06F40/289 , G06F40/232 , G06N3/04 , G06N3/08
摘要: 本申请提供了一种文本纠错方法及装置、存储介质及电子设备,涉及文本处理技术领域。该文本纠错方法包括:利用错误检测模型,判断待纠错文本是否有误;若待纠错文本有误,利用错误修正模型,确定待纠错文本对应的修正文本,其中,错误检测模型由对抗生成网络中的判别器训练得到,错误修正模型由对抗生成网络中的生成器训练得到。该文本纠错方法只针对有误文本进行纠错任务,减少了错误修正模型的计算量,提高了文本纠错系统的运行速度。
-
公开(公告)号:CN114357985A
公开(公告)日:2022-04-15
申请号:CN202111647750.4
申请日:2021-12-29
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/253 , G06F40/289 , G06F40/30 , G06K9/62
摘要: 本申请实施例提供了一种文本数据生成方法、计算机设备及存储介质,文本数据生成方法包括:获取无语法缺陷的第三文本;将所述第三文本输入生成模型,生成所述第三文本对应的第一生成文本,和用于指示所述第一生成文本存在语法缺陷的目标概率,所述生成模型是基于无语法缺陷的第一文本和有语法缺陷的第二文本训练得到的;根据所述第一生成文本对应的目标概率,确定所述第一生成文本为目标文本。生成模型学习到第二文本对应的语法错误规律,训练后的生成模型能够发挥生成结果多样的优异特性,可以自动构建出大量包含语法缺陷的文本。
-
公开(公告)号:CN114282527A
公开(公告)日:2022-04-05
申请号:CN202111576592.8
申请日:2021-12-22
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/232 , G06F40/30 , G06F40/58 , G06F40/242 , G06F40/289 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明提供一种多语言文本检测与纠错方法、系统、电子设备及存储介质,所述方法包括获取待检测文本,并对所述待检测文本进行多语言字符识别以得到至少一个待识别语句;对所述待识别语句中的目标语言的字符进行语种检测,得到待检测语种单词,并对所述待检测语种单词进行拼写检测和语义检测;若至少一个所述待检测语种单词存在拼写错误和/或语义错误,则对存在拼写错误和/或语义错误的单词进行对应的拼写纠错和/或语义纠错。本发明可以更好地理解跨语言语境下的文本语义,对文本中的所有目标语言的字符进行检测并只对检测有错误的单词进行纠正。
-
公开(公告)号:CN114282046A
公开(公告)日:2022-04-05
申请号:CN202111601552.4
申请日:2021-12-24
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/683 , G06F16/65 , G06F16/635 , G06F16/632 , G06F40/30
摘要: 本申请提供了一种风格语料获取方法及相关方法和设备,其中,风格语料获取方法可实现风格语料的自动获取,且该风格语料获取方法可获取到质量较佳的风格语料,在本申请提供的风格语料获取方法的基础上,本申请还提供了一种风格迁移模型构建方法,该风格迁移模型构建方法可基于本申请提供的风格语料获取方法获取的风格语料集构建风格迁移模型,在本申请提供的风格迁移模型构建方法的基础上,本申请还提供了一种风格迁移方法,该风格迁移方法可将待处理文本输入利用本申请提供的风格迁移模型构建方法构建的风格迁移模型进行处理,从而得到风格迁移模型输出的风格文本。
-
公开(公告)号:CN114154497A
公开(公告)日:2022-03-08
申请号:CN202111467935.7
申请日:2021-12-03
申请人: 科大讯飞河北科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/289 , G06F40/211 , G06F40/30 , G06K9/62
摘要: 本发明提供一种语病识别方法、装置、电子设备和存储介质,所述方法包括:确定待识别语句;提取待识别语句中各分词的分词表示;基于待识别语句中各分词的分词表示,以及待识别语句的句法结构,对待识别语句进行语病识别;分词表示用于表征对应分词的上下文语义和对应分词与待识别语句中其余分词间的句法依赖关系。本发明提供的语病识别方法、装置、电子设备和存储介质,能够结合语义信息和句法信息对待识别语句中的句法结构问题和语义问题进行病句识别,进而准确得到病句识别结果。
-
-
-
-
-
-
-
-
-