-
公开(公告)号:CN105975466A
公开(公告)日:2016-09-28
申请号:CN201510742043.1
申请日:2015-11-04
IPC: G06F17/30
CPC classification number: G06F16/338 , G06F16/33
Abstract: 本发明公开了一种面向短新闻的机器写稿方法及装置,该方法通过利用优化算法智能选择不同的模板组合进行新闻生成,能够提高所生成新闻的生动性与灵活性。该方法的实现过程如下,基于输入的知识点与模板库进行候选模板检索;利用优化算法进行智能模板筛选,确定最终真正使用的模板;基于筛选得到的模板进行新闻文本生成;目前的中文新闻写稿系统主要基于人工定义的模板,然而通过向固定模板填充数据而生成的新闻形式比较单一,不够生动。本发明提出基于多样化模板集的智能模板筛选生成多样化的新闻文本,有效改善新闻自动生成的效果。
-
公开(公告)号:CN106874469A
公开(公告)日:2017-06-20
申请号:CN201710082757.3
申请日:2017-02-16
Applicant: 北京大学
Abstract: 本发明公开了一种新颖的基于段落进行新闻综述生成的方法与系统,涉及语言文字处理领域。目前有大量关于同一个事件的新闻报道,且新闻报道的综述都是由人工编辑的,经济成本高,且很难保证时效性。本发明提出基于段落重新分割,排序,选择并融合的新闻综述生成方法与系统,有效提高新闻综述的时效性,降低编辑成本。其包括如下步骤:针对原始新闻材料的段落重新分割构建;对新闻材料重新构建出的段落进行重要性预测;根据段落重要性进行段落选择,融合;对选择出来的段落进行重排序,构成新闻综述。本发明适用于介绍同一事件的大量新闻报道。
-
公开(公告)号:CN106874469B
公开(公告)日:2020-05-05
申请号:CN201710082757.3
申请日:2017-02-16
Applicant: 北京大学
Abstract: 本发明公开了一种新颖的基于段落进行新闻综述生成的方法与系统,涉及语言文字处理领域。目前有大量关于同一个事件的新闻报道,且新闻报道的综述都是由人工编辑的,经济成本高,且很难保证时效性。本发明提出基于段落重新分割,排序,选择并融合的新闻综述生成方法与系统,有效提高新闻综述的时效性,降低编辑成本。其包括如下步骤:针对原始新闻材料的段落重新分割构建;对新闻材料重新构建出的段落进行重要性预测;根据段落重要性进行段落选择,融合;对选择出来的段落进行重排序,构成新闻综述。本发明适用于介绍同一事件的大量新闻报道。
-
公开(公告)号:CN105912526A
公开(公告)日:2016-08-31
申请号:CN201610235671.5
申请日:2016-04-15
Applicant: 北京大学
IPC: G06F17/27
CPC classification number: G06F17/277 , G06F17/271
Abstract: 本发明公开了一种新颖的面向体育比赛直播文字的体育新闻自动构建方法及装置,涉及语言文字处理领域。目前体育比赛结束后对于比赛情况进行报道的新闻都是由人工编辑的,经济成本高,且很难保证时效性。本发明提出基于学习排序框架,通过体育比赛直播文字自动构建体育新闻的方法和装置,有效提高体育新闻的时效性,降低编辑成本。其包括如下步骤:构建针对体育直播文字的学习排序模型;应用学习排序模型预测每个直播句子的权重;选取权重最高的句子集合构建体育新闻。本发明适用于比赛过程中会产生比赛文字直播的体育比赛。
-
-
-