对话文本摘要生成方法、装置、电子设备和存储介质

    公开(公告)号:CN111400489B

    公开(公告)日:2022-12-02

    申请号:CN202010269479.4

    申请日:2020-04-08

    Abstract: 本发明实施例提供一种对话文本摘要生成方法、装置、电子设备和存储介质,其中方法包括:确定对话文本;将所述对话文本中每一发言人对应的分句输入至对话文本摘要模型中,得到所述对话文本摘要模型输出的所述对话文本对应的摘要;所述对话文本摘要模型用于确定所述对话文本中每一发言人的先验发言人特征表示,并基于所述对话文本中每一发言人对应的分句和先验发言人特征表示,生成所述对话文本对应的摘要;所述对话文本摘要模型是基于样本对话文本中每一发言人对应的样本分句,以及所述样本对话文本的样本摘要训练得到的。本发明实施例提供的对话文本摘要生成方法、装置、电子设备和存储介质,提高了对话文本摘要生成的准确性。

    一种对话语料库的扩容方法、装置、设备及存储介质

    公开(公告)号:CN112231458A

    公开(公告)日:2021-01-15

    申请号:CN202011146220.7

    申请日:2020-10-23

    Abstract: 本申请提供了一种对话语料库的扩容方法、装置、设备及存储介质,其中,方法包括:获取输入文本总集;从输入文本总集中滤除在当前的对话语料库中存在匹配回复文本的输入文本,剩余的输入文本组成的集合作为目标输入文本集;利用预先建立的生成式对话生成模型,生成目标输入文本集中输入文本对应的回复文本,以得到第一对话语料集;将第一对话语料集中的对话语料加入当前的对话语料库。本申请提供的对话语料库的扩容方法可利用生成式对话生成模型自动生成输入文本对应的回复文本,从而得到对话语料,由于加入对话语料的对话语料自动生成,而无需人工编写,因此,获取对话语料的效率较高,人工成本较低。

    一种文本处理方法及装置

    公开(公告)号:CN108090098A

    公开(公告)日:2018-05-29

    申请号:CN201611045923.4

    申请日:2016-11-22

    Abstract: 本发明实施例提供了一种文本处理方法及装置,其中方法包括:获取待处理文本数据;根据文本分类模型获取所述文本数据属于每个预设类别的概率,其中所述文本分类模型用于根据所述文本数据的标题及所述文本数据所包含的句子对所述文本数据分类;根据所述文本数据属于每个预设类别的概率确定所述文本数据的类别。在本发明实施例中,使用文本分类模型从标题+全文这种篇章角度对待分类文本进行分类,得到当前文本属于每个预设类别的概率,再在此基础上最终确定文本的类别,这样有效地提高了文本分类的效率,同时也提高了文本分类的准确性,降低了人的主观性对分类结果的影响。

    文本表示方法、装置、电子设备与存储介质

    公开(公告)号:CN114118022A

    公开(公告)日:2022-03-01

    申请号:CN202111452650.6

    申请日:2021-12-01

    Abstract: 本发明提供一种文本表示方法、装置、电子设备与存储介质,所述方法包括:确定目标文本;将目标文本输入至跨语种文本表示模型,得到跨语种文本表示模型输出的文本表示,所述文本表示为所述目标文本的编码表示;其中,所述跨语种文本表示模型是以样本文本的文本表示与对应的样本正例的正例表示之间的一致性,以及所述样本文本的文本表示与对应的样本负例的负例表示之间的差异性为目标训练得到的,所述样本正例与所述样本文本的语种不同且语义相同,所述样本负例与所述样本文本的语种不同且语义不同。本发明提供的方法、装置、电子设备与存储介质,实现了不需要花费长时间的训练、仅需要少量的语料数据即可获得跨语种文本表示模型效果显著的提升。

    一种答题内容评测方法及装置

    公开(公告)号:CN110069783A

    公开(公告)日:2019-07-30

    申请号:CN201910360959.9

    申请日:2019-04-30

    Abstract: 本申请公开了一种答题内容评测方法及装置,本方法对于待评测答题内容确定其深度特征,基于该深度特征可自动确定待评测答题内容的评测结果,由此可见,本方案能够实现自动对待评测答题内容进行评测的目的,相比于现有的人工评测方法,具有耗时短、效率高的优点,并且大大降低了人工成本。进一步,深度特征具备相比于相同评测结果,对不同评测结果对应的答题内容的表征差异性更大的能力,和/或,具备对差别越大的评测结果对应的答题内容的表征差异性越大的能力,所以本方法充分考虑不同评测结果对应的答题内容之间的差异性,提高了评测结果的准确性。

Patent Agency Ranking