-
公开(公告)号:CN111400489A
公开(公告)日:2020-07-10
申请号:CN202010269479.4
申请日:2020-04-08
Applicant: 科大讯飞股份有限公司 , 哈尔滨工业大学
IPC: G06F16/34
Abstract: 本发明实施例提供一种对话文本摘要生成方法、装置、电子设备和存储介质,其中方法包括:确定对话文本;将所述对话文本中每一发言人对应的分句输入至对话文本摘要模型中,得到所述对话文本摘要模型输出的所述对话文本对应的摘要;所述对话文本摘要模型用于确定所述对话文本中每一发言人的先验发言人特征表示,并基于所述对话文本中每一发言人对应的分句和先验发言人特征表示,生成所述对话文本对应的摘要;所述对话文本摘要模型是基于样本对话文本中每一发言人对应的样本分句,以及所述样本对话文本的样本摘要训练得到的。本发明实施例提供的对话文本摘要生成方法、装置、电子设备和存储介质,提高了对话文本摘要生成的准确性。
-
公开(公告)号:CN110096708A
公开(公告)日:2019-08-06
申请号:CN201910361757.6
申请日:2019-04-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种定标集确定方法及装置,本方法首先获取各答题对象对目标题目的答题内容,然后根据各所述答题内容间的属性差别,对各答题内容进行聚类,通过聚类可以将属性相近的答题内容聚集到一个聚类簇中,由此得到至少两个聚类簇,其中,从属于同一聚类簇的各答题内容的属性差别更小,而从属于不同聚类簇的答题内容的属性差别更大。进一步,从每个聚类簇中抽取答题内容,由抽取的答题内容组成定标集。综上可见,本申请抽取的定标集包含了各个聚类簇中的答题内容,也即覆盖了各属性的答题内容,保证了定标集的均衡性。进一步,基于本申请抽取的定标集训练的自动评测模型,其评测准确度也会更高。
-
公开(公告)号:CN108764855A
公开(公告)日:2018-11-06
申请号:CN201810570415.0
申请日:2018-06-05
Applicant: 科大讯飞股份有限公司
IPC: G06Q10/10
CPC classification number: G06Q10/1093
Abstract: 本公开提供一种日程表生成方法及装置、存储介质、电子设备。该方法包括:获取待处理事件的初始日程表,所述初始日程表用于记录所述待处理事件对应的人员、地点、以及内容在至少两个时间单元内的局部映射关系;获取所述初始日程表对应预设规则的代价矩阵,所述代价矩阵中元素的代价值用于表示该元素对应的时间单元内的局部映射关系是否满足所述预设规则;调整所述初始日程表中的局部映射关系,直至调整得到的日程表对应的代价矩阵满足预设条件,作为新的日程表。如此方案,受日程复杂度、人为经验的影响较小,有助于提高日程表的生成效率以及生成效果。
-
公开(公告)号:CN108090099A
公开(公告)日:2018-05-29
申请号:CN201611045925.3
申请日:2016-11-22
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供了一种文本处理方法及装置,其中方法包括:获取待处理文本数据;根据第一文本分类模型和第二文本分类模型分别获取所述文本数据的一个候选类别,其中所述第一文本分类模型用于根据所述文本数据的标题及所述文本数据所包含的句子对所述文本数据分类,所述第二文本分类模型用于根据所述文本数据所包含的句子中的指定句子对所述文本数据分类;根据所获取的两个所述候选类别确定所述文本数据的类别。在本发明实施例中,从标题+全文以及指定句子两种角度对待分类文本进行分类,得到两个候选类别,在此基础上最终确定文本的类别,这样有效地提高了文本分类的效率,同时也提高了文本分类的准确性,降低了人的主观性对分类结果的影响。
-
-
-