-
公开(公告)号:CN111400489B
公开(公告)日:2022-12-02
申请号:CN202010269479.4
申请日:2020-04-08
Applicant: 科大讯飞股份有限公司 , 哈尔滨工业大学
IPC: G06F16/34
Abstract: 本发明实施例提供一种对话文本摘要生成方法、装置、电子设备和存储介质,其中方法包括:确定对话文本;将所述对话文本中每一发言人对应的分句输入至对话文本摘要模型中,得到所述对话文本摘要模型输出的所述对话文本对应的摘要;所述对话文本摘要模型用于确定所述对话文本中每一发言人的先验发言人特征表示,并基于所述对话文本中每一发言人对应的分句和先验发言人特征表示,生成所述对话文本对应的摘要;所述对话文本摘要模型是基于样本对话文本中每一发言人对应的样本分句,以及所述样本对话文本的样本摘要训练得到的。本发明实施例提供的对话文本摘要生成方法、装置、电子设备和存储介质,提高了对话文本摘要生成的准确性。
-
公开(公告)号:CN114282046A
公开(公告)日:2022-04-05
申请号:CN202111601552.4
申请日:2021-12-24
Applicant: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F16/683 , G06F16/65 , G06F16/635 , G06F16/632 , G06F40/30
Abstract: 本申请提供了一种风格语料获取方法及相关方法和设备,其中,风格语料获取方法可实现风格语料的自动获取,且该风格语料获取方法可获取到质量较佳的风格语料,在本申请提供的风格语料获取方法的基础上,本申请还提供了一种风格迁移模型构建方法,该风格迁移模型构建方法可基于本申请提供的风格语料获取方法获取的风格语料集构建风格迁移模型,在本申请提供的风格迁移模型构建方法的基础上,本申请还提供了一种风格迁移方法,该风格迁移方法可将待处理文本输入利用本申请提供的风格迁移模型构建方法构建的风格迁移模型进行处理,从而得到风格迁移模型输出的风格文本。
-
公开(公告)号:CN112231458A
公开(公告)日:2021-01-15
申请号:CN202011146220.7
申请日:2020-10-23
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/31
Abstract: 本申请提供了一种对话语料库的扩容方法、装置、设备及存储介质,其中,方法包括:获取输入文本总集;从输入文本总集中滤除在当前的对话语料库中存在匹配回复文本的输入文本,剩余的输入文本组成的集合作为目标输入文本集;利用预先建立的生成式对话生成模型,生成目标输入文本集中输入文本对应的回复文本,以得到第一对话语料集;将第一对话语料集中的对话语料加入当前的对话语料库。本申请提供的对话语料库的扩容方法可利用生成式对话生成模型自动生成输入文本对应的回复文本,从而得到对话语料,由于加入对话语料的对话语料自动生成,而无需人工编写,因此,获取对话语料的效率较高,人工成本较低。
-
公开(公告)号:CN108090098A
公开(公告)日:2018-05-29
申请号:CN201611045923.4
申请日:2016-11-22
Applicant: 科大讯飞股份有限公司
IPC: G06F17/30
Abstract: 本发明实施例提供了一种文本处理方法及装置,其中方法包括:获取待处理文本数据;根据文本分类模型获取所述文本数据属于每个预设类别的概率,其中所述文本分类模型用于根据所述文本数据的标题及所述文本数据所包含的句子对所述文本数据分类;根据所述文本数据属于每个预设类别的概率确定所述文本数据的类别。在本发明实施例中,使用文本分类模型从标题+全文这种篇章角度对待分类文本进行分类,得到当前文本属于每个预设类别的概率,再在此基础上最终确定文本的类别,这样有效地提高了文本分类的效率,同时也提高了文本分类的准确性,降低了人的主观性对分类结果的影响。
-
-
公开(公告)号:CN115495567A
公开(公告)日:2022-12-20
申请号:CN202211305485.6
申请日:2022-10-24
Applicant: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/30 , G06K9/62
Abstract: 本发明提供一种问题聚类方法、装置、电子设备和存储介质,其中方法包括:获取第一问题簇,所述第一问题簇包括待聚类的第一问题;确定所述第一问题簇中的基准问题及其基准回复,以及所述第一问题簇中的第一问题以所述基准回复作为对话回复的回复概率;基于所述第一问题的回复概率,对所述第一问题进行聚类,得到第二问题簇。本发明提供的方法、装置、电子设备和存储介质,基于第一问题以基准回复作为对话回复的回复概率进行问题聚类,使得问题聚类的依据能够更加贴合实际对话场景下的问题语义,由此保证问题聚类的可靠性,优化问题聚类效果。
-
公开(公告)号:CN114118022A
公开(公告)日:2022-03-01
申请号:CN202111452650.6
申请日:2021-12-01
Applicant: 科大讯飞股份有限公司
IPC: G06F40/151 , G06F40/194 , G06F40/189 , G06F40/284 , G06F40/30
Abstract: 本发明提供一种文本表示方法、装置、电子设备与存储介质,所述方法包括:确定目标文本;将目标文本输入至跨语种文本表示模型,得到跨语种文本表示模型输出的文本表示,所述文本表示为所述目标文本的编码表示;其中,所述跨语种文本表示模型是以样本文本的文本表示与对应的样本正例的正例表示之间的一致性,以及所述样本文本的文本表示与对应的样本负例的负例表示之间的差异性为目标训练得到的,所述样本正例与所述样本文本的语种不同且语义相同,所述样本负例与所述样本文本的语种不同且语义不同。本发明提供的方法、装置、电子设备与存储介质,实现了不需要花费长时间的训练、仅需要少量的语料数据即可获得跨语种文本表示模型效果显著的提升。
-
-
-
公开(公告)号:CN110069783A
公开(公告)日:2019-07-30
申请号:CN201910360959.9
申请日:2019-04-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种答题内容评测方法及装置,本方法对于待评测答题内容确定其深度特征,基于该深度特征可自动确定待评测答题内容的评测结果,由此可见,本方案能够实现自动对待评测答题内容进行评测的目的,相比于现有的人工评测方法,具有耗时短、效率高的优点,并且大大降低了人工成本。进一步,深度特征具备相比于相同评测结果,对不同评测结果对应的答题内容的表征差异性更大的能力,和/或,具备对差别越大的评测结果对应的答题内容的表征差异性越大的能力,所以本方法充分考虑不同评测结果对应的答题内容之间的差异性,提高了评测结果的准确性。
-
-
-
-
-
-
-
-
-