-
公开(公告)号:CN112685548B
公开(公告)日:2023-09-08
申请号:CN202011627778.7
申请日:2020-12-31
申请人: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F40/151 , G06F40/242 , G06F40/284 , G06F40/289 , G06F40/30
摘要: 本申请公开了一种问题回答方法以及电子设备、存储装置,其中,问题回答方法包括:获取问题文本和篇章文本,并获取若干知识点的参考文本;其中,问题文本和篇章文本包含若干词语,若干知识点与问题文本、篇章文本中的至少一者相关;提取若干词语的个体语义表示,并提取各个参考文本的原始语义表示;利用若干词语的个体语义表示和各个参考文本的原始语义表示,从篇章文本中预测得到问题文本的回答文本。上述方案,能够提高问题回答的准确性。
-
公开(公告)号:CN112528109B
公开(公告)日:2023-10-27
申请号:CN202011389567.4
申请日:2020-12-01
申请人: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/906 , G06F18/214 , G06F18/25
摘要: 本申请提供了一种数据分类方法、装置、设备及存储介质,其中,方法包括:获取待分类数据;将待分类数据输入预先建立的第一分类模型,得到分类结果,其中,第一分类模型采用训练集中的训练数据训练得到,第一分类模型的训练目标为,使其针对训练数据预测的分类结果趋于预先建立的多个第二分类模型分别针对训练数据预测的分类结果的融合结果;根据第一分类模型针对待分类数据预测的分类结果,确定待分类数据所属的类别。本申请提供的数据分类方法通过一个第一分类模型即可实现对待分类数据的准确分类,实现数据分类所消耗的计算资源和时间资源较少。
-
公开(公告)号:CN113705240B
公开(公告)日:2024-04-19
申请号:CN202110888038.7
申请日:2021-08-03
申请人: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
摘要: 本申请公开了一种基于多语种分支模型的文本处理方法及相关装置,所述多语种分支模型包括嵌入层、多分支处理网络、第一混合器、共享网络和输出层,所述文本处理方法包括:基于所述嵌入层,获得待处理的文本对应的初始语义表示;基于所述多分支处理网络、所述第一混合器以及所述共享网络,对所述初始语义表示进行处理以获得综合语义表示;基于所述输出层,对所述综合语义表示进行变换以获得输出结果。通过上述方式,本申请能够在具备多语种处理能力的基础上,提高处理结果的精确度。
-
公开(公告)号:CN115858724A
公开(公告)日:2023-03-28
申请号:CN202211132099.1
申请日:2022-09-16
申请人: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F16/33 , G06F16/332 , G06N5/02
摘要: 本申请提供一种问答处理方法、装置、电子设备及存储介质,所述问答处理方法,包括:获取待处理问题;根据所述待处理问题,以及所述待处理问题的先验知识,确定与所述待处理问题对应的答案线索文本;所述待处理问题的先验知识至少包括所述待处理问题所属领域的知识;基于所述答案线索文本,确定对应所述待处理问题的答案。该方法还原了人面临问题时对问题的处理过程,以答案线索文本作为对待处理问题相关知识和概念的理解,答案线索文本为确定待处理问题的答案提供了强有力的保障和信息参考,从而可以提高待处理问题的答案的准确性。
-
公开(公告)号:CN115712714A
公开(公告)日:2023-02-24
申请号:CN202211506783.1
申请日:2022-11-28
申请人: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F16/332 , G06F16/35 , G06F40/30 , G06F18/2431 , G06N3/0455 , G06N3/08
摘要: 本发明公开了一种文本纠错方法、系统以及设备,文本纠错方法,包括:接收待纠错文本;对待纠错文本进行粗粒度情感分析,获得第一粗粒度情感分类结果;对待纠错文本中表示情感的短语进行细粒度情感分析,获得短语的第一细粒度情感分类结果,第一粗粒度情感分类结果和第一细粒度情感分类结果均包括正向情感和负向情感;判断第一粗粒度情感分类结果与第一细粒度情感分类结果是否一致,获得一致性检测结果;若一致性检测结果为不一致,则将短语作为待纠错短语,对待纠错短语进行纠错,获得纠错后文本,并输出一致性检测结果和纠错后文本。本发明实现了文本的深层次的纠错机制,填补了技术空白。
-
公开(公告)号:CN116127012A
公开(公告)日:2023-05-16
申请号:CN202211551967.X
申请日:2022-12-05
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC分类号: G06F16/33 , G06F40/284 , G06F40/242 , G06F40/30
摘要: 本发明涉及自然语言处理技术领域,提供一种词语推荐方法、装置、电子设备及存储介质,该方法首先获取待查询释义;然后基于反向词典模型,从候选词表中选取待查询释义对应的目标词语;最后基于目标词语,确定推荐结果。该方法利用多任务学习得到的反向词典模型对词语以及词语的词性进行预测,考虑了词语的词性,并不仅仅依赖于词库中释义的质量以及用户输入的待查询释义的质量,可以保证推荐结果的准确性,提高推荐结果的质量,进而提高用户体验感。词性的引入,可以辅助减少预测空间,对推荐结果起到约束作用,使得推荐结果更加可靠,减少了易混淆词语的干扰,避免出现推荐结果与用户输入的待查询释义相差较大的情况。
-
公开(公告)号:CN115690455A
公开(公告)日:2023-02-03
申请号:CN202211360681.3
申请日:2022-11-02
申请人: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06V10/46 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本申请公开了一种跨模态数据转换方法、装置、设备及可读存储介质。在获取待转换的源模态的数据之后,先对该源模态的数据进行离散化处理,确定源模态的数据的离散化表示,再将该源模态的数据的离散化表示转换为目标模态的离散化表示,最后再对该目标模态的离散化表示进行解码处理,得到目标模态的数据。该过程中,将源模态的数据的离散化表示转换为目标模态的离散化表示,是由一个离散的空间转换到另一个离散的空间,转换前后空间对等,更易实现,再对目标模态的离散化表示进行解析即可得到目标模态的数据,相对于基于离散的空间到一个连续的物理空间的转换得到目标模态的数据,转换难度降低。
-
公开(公告)号:CN112528109A
公开(公告)日:2021-03-19
申请号:CN202011389567.4
申请日:2020-12-01
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/906 , G06K9/62
摘要: 本申请提供了一种数据分类方法、装置、设备及存储介质,其中,方法包括:获取待分类数据;将待分类数据输入预先建立的第一分类模型,得到分类结果,其中,第一分类模型采用训练集中的训练数据训练得到,第一分类模型的训练目标为,使其针对训练数据预测的分类结果趋于预先建立的多个第二分类模型分别针对训练数据预测的分类结果的融合结果;根据第一分类模型针对待分类数据预测的分类结果,确定待分类数据所属的类别。本申请提供的数据分类方法通过一个第一分类模型即可实现对待分类数据的准确分类,实现数据分类所消耗的计算资源和时间资源较少。
-
公开(公告)号:CN114492453A
公开(公告)日:2022-05-13
申请号:CN202111677576.8
申请日:2021-12-31
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/30 , G06F40/289 , G06F40/232 , G06N3/04 , G06N3/08
摘要: 本申请提供了一种文本纠错方法及装置、存储介质及电子设备,涉及文本处理技术领域。该文本纠错方法包括:利用错误检测模型,判断待纠错文本是否有误;若待纠错文本有误,利用错误修正模型,确定待纠错文本对应的修正文本,其中,错误检测模型由对抗生成网络中的判别器训练得到,错误修正模型由对抗生成网络中的生成器训练得到。该文本纠错方法只针对有误文本进行纠错任务,减少了错误修正模型的计算量,提高了文本纠错系统的运行速度。
-
公开(公告)号:CN114282527A
公开(公告)日:2022-04-05
申请号:CN202111576592.8
申请日:2021-12-22
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/232 , G06F40/30 , G06F40/58 , G06F40/242 , G06F40/289 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明提供一种多语言文本检测与纠错方法、系统、电子设备及存储介质,所述方法包括获取待检测文本,并对所述待检测文本进行多语言字符识别以得到至少一个待识别语句;对所述待识别语句中的目标语言的字符进行语种检测,得到待检测语种单词,并对所述待检测语种单词进行拼写检测和语义检测;若至少一个所述待检测语种单词存在拼写错误和/或语义错误,则对存在拼写错误和/或语义错误的单词进行对应的拼写纠错和/或语义纠错。本发明可以更好地理解跨语言语境下的文本语义,对文本中的所有目标语言的字符进行检测并只对检测有错误的单词进行纠正。
-
-
-
-
-
-
-
-
-