-
公开(公告)号:CN117150332A
公开(公告)日:2023-12-01
申请号:CN202311139259.X
申请日:2023-09-05
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC分类号: G06F18/23213 , G06F18/231 , G06F18/24
摘要: 本申请实施例公开了一种文本处理方法、装置、设备及存储介质,获得n个文本中各个文本的主题信息;对应获得的n个主题信息的n个可能的分类数中的任一大于1且小于n的分类数k,对n个主题信息进行1次或多次聚类处理,得到分类数k对应的1个或多个聚类结果;其中,多次聚类处理采用了至少两种相似度度量方法和/或采用了从n个主题信息中选择k个主题信息作为k个初始聚类中心的多个可能结果,不同次聚类使用不同的相似度度量方法衡量主题信息间的相似度和/或不同次聚类作为k个初始聚类中心的主题信息不同;基于得到的n个分类数对应的所有聚类结果确定n个主题信息的目标聚类结果。本申请提高了文本数量较小情况下的聚类效果。
-
公开(公告)号:CN116245087A
公开(公告)日:2023-06-09
申请号:CN202211628016.8
申请日:2022-12-16
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/205 , G06F40/226 , G06F40/253 , G06F40/30
摘要: 本发明提供一种句子评分方法、装置、电子设备和存储介质,其中方法包括:确定待评分的句子;对句子进行语义特征提取得到语义特征,以及进行多个维度的语言学特征提取得到语言学特征,并基于语义特征和语言学特征确定句子的评分结果;其中,多个维度包括语句正确性、词语使用和写作技巧中的至少两种。实现在进行评分时,通过提取句子更多的特征作为评分依据,突出句子在语句正确性等的基础要求、词语使用方式和写作技巧三个维度特征,提高了句子评分的准确性。
-
公开(公告)号:CN116127012A
公开(公告)日:2023-05-16
申请号:CN202211551967.X
申请日:2022-12-05
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC分类号: G06F16/33 , G06F40/284 , G06F40/242 , G06F40/30
摘要: 本发明涉及自然语言处理技术领域,提供一种词语推荐方法、装置、电子设备及存储介质,该方法首先获取待查询释义;然后基于反向词典模型,从候选词表中选取待查询释义对应的目标词语;最后基于目标词语,确定推荐结果。该方法利用多任务学习得到的反向词典模型对词语以及词语的词性进行预测,考虑了词语的词性,并不仅仅依赖于词库中释义的质量以及用户输入的待查询释义的质量,可以保证推荐结果的准确性,提高推荐结果的质量,进而提高用户体验感。词性的引入,可以辅助减少预测空间,对推荐结果起到约束作用,使得推荐结果更加可靠,减少了易混淆词语的干扰,避免出现推荐结果与用户输入的待查询释义相差较大的情况。
-
公开(公告)号:CN112580310B
公开(公告)日:2023-04-18
申请号:CN202011582902.2
申请日:2020-12-28
申请人: 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司 , 科大讯飞股份有限公司
IPC分类号: G06F40/166 , G06F40/289 , G06F40/117 , G06N3/045 , G06N3/08
摘要: 本申请提供一种缺失字/词的补全方法,该方法包括用语言模型识别缺失句中缺失位置,其中语言模型为以伪数据作为输入而进行预训练所得到的模型,缺失句表征存在成分缺失错误的语句;用语言模型生成缺失位置处所缺失的多个候选字/词;对多个候选字/词进行排序,以确定缺失位置处所缺失的缺失字/词。本申请还提供相应的电子设备。通过上述方法,本申请能实现更加快速准确地对文本中字、词缺失问题进行纠正补全。
-
公开(公告)号:CN113158648B
公开(公告)日:2024-11-05
申请号:CN202011449650.6
申请日:2020-12-09
申请人: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/232 , G06F40/289
摘要: 本申请公开了一种文本补全方法以及电子设备、存储装置,其中文本补全方法包括:获取待补全文本,并确定待补全文本的缺失内容所源自的文本库;其中,待补全文本包括至少一个缺失位置;利用文本库对待补全文本进行补全预测,得到缺失位置的至少一个候选词语;利用各个缺失位置的候选词语,得到待补全文本的完整文本。上述方案,能够提高文本补全的效率并降低文本补全的成本。
-
公开(公告)号:CN112560476B
公开(公告)日:2024-10-15
申请号:CN202011452078.9
申请日:2020-12-09
申请人: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/289 , G06F40/232 , G06F16/33
摘要: 本申请公开了一种文本补全方法以及电子设备、存储装置,其中文本补全方法包括:获取待补全文本;其中,待补全文本包括至少一个缺失位置;确定待补全文本所缺失内容的来源情况;其中,来源情况包括以下任意一者:来源未知、源自第一文本库、源自涉及预设知识领域的第二文本库;采用与来源情况匹配的文本预测方式对待补全文本进行补全预测,得到缺失位置的至少一个候选词语;利用各个缺失位置的候选词语,得到待补全文本的完整文本。上述方案,能够提高文本补全的效率并降低文本补全的成本。
-
公开(公告)号:CN112686020B
公开(公告)日:2024-06-04
申请号:CN202011588731.4
申请日:2020-12-29
申请人: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F40/205 , G06F40/30 , G06F18/214 , G06F18/25
摘要: 本发明提供一种作文评分方法、装置、电子设备及存储介质,由于引入分差预测模型,可以预测出待评分作文与作文参考样本之间的分差,只需要通过该分差并结合作文参考样本的分数即可实现对待评分作文的评分结果的准确确定,既可以保证同场考试的评分尺度相同,也可以使用不同场考试的大规模数据进行训练。对于无定标的小规模考试/作业评分场景的应用,可以通过调整作文参考样本来拟合阅卷老师的评分尺度,从而使用分差预测模型对待评分作文进行评分。不仅可以提高大规模考试评分场景下评分结果的稳定性,还可以避免小规模考试/作业评分场景下因评分尺度不同导致的评分人机一致性不高的问题出现,使得评分结果更准确,且适用性更广泛。
-
公开(公告)号:CN112560477B
公开(公告)日:2024-04-16
申请号:CN202011452090.X
申请日:2020-12-09
申请人: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/289 , G06F40/232 , G06F16/33
摘要: 本申请公开了一种文本补全方法以及电子设备、存储装置,其中,文本补全方法包括:获取待补全文本,并确定待补全文本的缺失内容所源自的文本库;其中,待补全文本包括至少一个缺失位置,且文本库涉及预设知识领域;利用与预设知识领域对应的知识图谱和文本库,对待补全文本进行补全预测,得到缺失位置的至少一个候选词语;利用各个缺失位置的候选词语,得到待补全文本的完整文本。上述方案,能够提高文本补全的效率并降低文本补全的成本。
-
公开(公告)号:CN111310457B
公开(公告)日:2024-02-02
申请号:CN202010125461.7
申请日:2020-02-27
申请人: 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司 , 科大讯飞股份有限公司
IPC分类号: G06F40/284 , G06F40/289 , G06F40/216 , G06F40/211
摘要: 本发明实施例提供一种词语搭配不当识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别文本中的存在搭配关系的两个待识别词;将待识别文本中的任一待识别词替换为遮盖标记,得到任一待识别词对应的输入文本;将任一待识别词对应的输入文本输入至词语预测模型,得到词语预测模型输出的任一待识别词的预测结果;其中,词语预测模型是基于样本文本训练得到的;基于两个待识别词的预测结果,确定词语搭配不当识别结果。本发明实施例提供的词语搭配不当识别方法、装置、电子设备和存储介质,能够基于待识别文本的语境,识别出语义层面上搭配不当的词语,提高了词语搭配不当识别的准确率。
-
公开(公告)号:CN117435708A
公开(公告)日:2024-01-23
申请号:CN202311385924.3
申请日:2023-10-23
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06V30/10 , G09B7/02
摘要: 本发明涉及智能教学技术领域,提供一种答题方法、装置、电子设备及存储介质,该答题方法首先获取题目图像,然后识别题目图像中的题目信息,对题目图像中的题目信息进行语义识别和意图识别,得到语义特征和意图特征,并将意图特征与各知识库插件的知识库技能进行匹配,得到匹配结果,基于语义特征和匹配结果,对题目信息进行作答。该答题方法引入各知识库插件,可以利用各知识库插件的专业解答能力,实现准确、高效的题目解答过程,为用户提供更好的学习体验和服务。而且,通过题目信息的意图特征与各知识库插件的知识库技能进行匹配,可以实现对各知识库插件的快速应用,进一步提升题目解答效率。
-
-
-
-
-
-
-
-
-