-
公开(公告)号:CN111914545B
公开(公告)日:2024-07-05
申请号:CN202010833405.9
申请日:2020-08-18
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/279
摘要: 本申请提供了一种拟人句识别方法、装置、设备及存储介质,方法包括:获取目标句子;基于目标句子和外部知识库,确定目标句子中每个字对应的目标特征向量,其中,外部知识库中包括多个词和多个词分别对应的类别,一个字对应的目标特征向量能够表征该字的上下文信息以及该字的相关外部知识信息,一个字的相关外部知识信息包括外部知识库中包含该字的词所对应的类别的信息;以目标句子中每个字对应的目标特征向量为依据,确定目标句子是否为拟人句。本申请提供的拟人句识别方法可实现拟人句的识别,且能够获得较高的识别准确度。
-
公开(公告)号:CN112686020B
公开(公告)日:2024-06-04
申请号:CN202011588731.4
申请日:2020-12-29
申请人: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F40/205 , G06F40/30 , G06F18/214 , G06F18/25
摘要: 本发明提供一种作文评分方法、装置、电子设备及存储介质,由于引入分差预测模型,可以预测出待评分作文与作文参考样本之间的分差,只需要通过该分差并结合作文参考样本的分数即可实现对待评分作文的评分结果的准确确定,既可以保证同场考试的评分尺度相同,也可以使用不同场考试的大规模数据进行训练。对于无定标的小规模考试/作业评分场景的应用,可以通过调整作文参考样本来拟合阅卷老师的评分尺度,从而使用分差预测模型对待评分作文进行评分。不仅可以提高大规模考试评分场景下评分结果的稳定性,还可以避免小规模考试/作业评分场景下因评分尺度不同导致的评分人机一致性不高的问题出现,使得评分结果更准确,且适用性更广泛。
-
公开(公告)号:CN115858818A
公开(公告)日:2023-03-28
申请号:CN202211699368.2
申请日:2022-12-28
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F16/36 , G06F16/335 , G06F16/35 , G06F40/30 , G06F40/205
摘要: 本发明提供一种素材推荐、知识图谱构建方法、装置、电子设备及介质,其中方法包括:获取目标搜索词;从素材知识图谱中,确定与所述目标搜索词对应的推荐素材信息;所述素材知识图谱基于技法对应的三元组构建,所述三元组中的头实体是对素材文本进行所述技法下的头实体抽取得到,所述三元组中的尾实体是基于所述素材文本中各字分别与所述头实体之间的语义相关度确定。本发明提供的方法、装置、电子设备及存储介质,将头实体抽取和尾实体抽取进行了结合,保证了得到的推荐素材信息的准确性和可靠性,并且,素材知识图谱基于技法对应的三元组构建,从而使得推荐素材信息中具体技法和描写对象可以外显,提高了素材推荐的便捷性。
-
公开(公告)号:CN116187336A
公开(公告)日:2023-05-30
申请号:CN202211679309.9
申请日:2022-12-26
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/30 , G06F40/268 , G06F40/289 , G06F18/214 , G06F18/24
摘要: 本发明提供一种意图脉络分析方法、装置、电子设备和存储介质,其中方法包括:确定待分析的文本,以及文本的摘要信息;对文本进行片段分割得到若干片段,并识别得到若干片段中每一个片段的语义表示;根据摘要信息和每一个片段的语义表示,得到每一个片段在文本中的角色表示;根据每一个片段的语义表示和角色表示,得到片段之间的承接关系,以及得到每一个片段的意图表示;根据若干片段、角色表示、承接关系和意图表示,得到文本的脉络分析结果。提高了对篇章级文章的意图脉络信息的提取和分析的准确性,为文章评价提供更准确的依据。
-
公开(公告)号:CN115859974A
公开(公告)日:2023-03-28
申请号:CN202211714389.7
申请日:2022-12-27
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/289 , G06F40/30 , G06F18/213
摘要: 本发明涉及人工智能技术领域,提供一种成语润色方法、装置、电子设备和存储介质,其中方法包括:确定待润色文本;基于成语润色模型,应用所述待润色文本中各字符的语义特征,对所述待润色文本进行成语润色边界检测,得到文本边界,并基于所述文本边界对应文本片段的语义特征生成润色文本;所述成语润色模型是基于样本文本对、成语标签和文本边界标签训练得到的。本发明提供的成语润色方法、装置、电子设备和存储介质,通过成语润色模型,能够实现自动生成成语润色后的文本,从而可以帮助更快地构建成语使用体系。
-
公开(公告)号:CN113435179B
公开(公告)日:2024-04-30
申请号:CN202110705457.2
申请日:2021-06-24
申请人: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F40/205 , G06F40/211 , G06F40/216 , G06F40/232 , G06F40/253 , G06F40/289
摘要: 本申请提供了一种作文评阅方法、装置、设备及存储介质,其中,方法包括:检测待评阅的目标作文是否为异常作文;若否,则分别从字词级别、句子级别、篇章级别对目标作文进行批改,以得到目标作文分别在字词级别、句子级别、篇章级别上对应的批改结果;从多个评阅维度确定目标作文的评分分档,以得到目标作文在多个评阅维度上的评分分档;根据目标作文在多个评阅维度上的评分分档生成目标作文的评语。本申请提供的作文评阅方法可自动对待评阅作文进行评阅,由于不需要人工参与,因此避免了人工参与所带来的问题,并且,经由本申请提供的作文评阅方法可获得内容丰富的评阅结果,内容丰富的评阅结果能够对写作者起到很好的指导作用,用户体验较好。
-
公开(公告)号:CN115952784A
公开(公告)日:2023-04-11
申请号:CN202211652243.4
申请日:2022-12-21
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/211 , G06F40/289 , G06F40/30
摘要: 本发明公开了一种文本润色方法、装置、电子设备和存储介质,属于自然语言处理技术领域,其中,文本润色方法包括:获取待润色文本;对所述待润色文本进行编码,得到所述待润色文本对应的向量表示,并获取所述待润色文本对应的技法差异向量,基于所述待润色文本对应的向量表示和所述技法差异向量,得到所述待润色文本对应的润色文本;其中,所述技法差异向量用于控制对所述待润色文本进行技法润色的方向和程度。本发明可以对待润色文本进行多技法润色,能够自适应控制多技法润色文本生成。
-
公开(公告)号:CN116245087A
公开(公告)日:2023-06-09
申请号:CN202211628016.8
申请日:2022-12-16
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/205 , G06F40/226 , G06F40/253 , G06F40/30
摘要: 本发明提供一种句子评分方法、装置、电子设备和存储介质,其中方法包括:确定待评分的句子;对句子进行语义特征提取得到语义特征,以及进行多个维度的语言学特征提取得到语言学特征,并基于语义特征和语言学特征确定句子的评分结果;其中,多个维度包括语句正确性、词语使用和写作技巧中的至少两种。实现在进行评分时,通过提取句子更多的特征作为评分依据,突出句子在语句正确性等的基础要求、词语使用方式和写作技巧三个维度特征,提高了句子评分的准确性。
-
公开(公告)号:CN114298032A
公开(公告)日:2022-04-08
申请号:CN202111547437.3
申请日:2021-12-16
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/289 , G06F40/194 , G06K9/62
摘要: 本申请涉及语言处理技术领域,并公开了一种文本标点检测方法、计算机设备及存储介质,所述方法包括:获取待识别文本,将所述待识别文本输入预训练的目标语言模型,其中,所述目标语言模型为基于目标训练样本对预设语言模型进行训练后,得到的融合了用于分析文本中字符的上下文信息和词性的网络层,所述目标训练样本为基于回译数据增强策略对文本数据进行标点修正后,得到的文本数据;基于所述目标语言模型分析所述待识别文本中字符的上下文信息和词性,得到所述待识别文本的标点标签序列;基于所述标点标签序列对所述待识别文本进行标点检测。旨在提高对文本标点检测的准确性。
-
公开(公告)号:CN111914545A
公开(公告)日:2020-11-10
申请号:CN202010833405.9
申请日:2020-08-18
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/279
摘要: 本申请提供了一种拟人句识别方法、装置、设备及存储介质,方法包括:获取目标句子;基于目标句子和外部知识库,确定目标句子中每个字对应的目标特征向量,其中,外部知识库中包括多个词和多个词分别对应的类别,一个字对应的目标特征向量能够表征该字的上下文信息以及该字的相关外部知识信息,一个字的相关外部知识信息包括外部知识库中包含该字的词所对应的类别的信息;以目标句子中每个字对应的目标特征向量为依据,确定目标句子是否为拟人句。本申请提供的拟人句识别方法可实现拟人句的识别,且能够获得较高的识别准确度。
-
-
-
-
-
-
-
-
-