一种面向新闻标题的人物关系抽取方法

    公开(公告)号:CN105608070A

    公开(公告)日:2016-05-25

    申请号:CN201510965136.0

    申请日:2015-12-21

    CPC classification number: G06F17/2745 G06F17/2775

    Abstract: 本发明涉及一种面向新闻标题的人物关系抽取方法,其步骤包括:1)寻找出新闻标题中的关系指示词,用以区分不同类别的人物关系;2)根据人物与关系指示词在新闻标题中的位置特征,建立描述句子的句式模板;利用训练数据统计每个模板的正/负例个数,根据正负模板的比例判定新闻标题中人物间关系的正确性;3)从新闻标题与人物属性知识库中提取特征,通过特征分类的方法并结合步骤2)得到的句式模板的正/负例个数,判定给定的人物关系是否正确。本发明在保证准确率的同时,降低了特征维度,提高了判定效率,可用于挖掘新闻标题中的人物关系,进而发现社会中的焦点人物、热点事件等,便于及时掌握社会动态,监控舆情。

    一种面向新闻标题的人物关系抽取方法

    公开(公告)号:CN105608070B

    公开(公告)日:2019-01-25

    申请号:CN201510965136.0

    申请日:2015-12-21

    Abstract: 本发明涉及一种面向新闻标题的人物关系抽取方法,其步骤包括:1)寻找出新闻标题中的关系指示词,用以区分不同类别的人物关系;2)根据人物与关系指示词在新闻标题中的位置特征,建立描述句子的句式模板;利用训练数据统计每个模板的正/负例个数,根据正负模板的比例判定新闻标题中人物间关系的正确性;3)从新闻标题与人物属性知识库中提取特征,通过特征分类的方法并结合步骤2)得到的句式模板的正/负例个数,判定给定的人物关系是否正确。本发明在保证准确率的同时,降低了特征维度,提高了判定效率,可用于挖掘新闻标题中的人物关系,进而发现社会中的焦点人物、热点事件等,便于及时掌握社会动态,监控舆情。

    基于图的最大紧密度划分的复合短语无监督识别方法

    公开(公告)号:CN106649265A

    公开(公告)日:2017-05-10

    申请号:CN201611053116.7

    申请日:2016-11-25

    CPC classification number: G06F17/277 G06F17/2705

    Abstract: 本发明涉及一种基于图的最大紧密度划分的复合短语无监督识别方法。该方法包括以下步骤:1)采用词性标注工具对输入语料进行词性标注和分词;2)将分词后的输入序列映射到有序的图结构中,将语义紧密度高的词语划分到一个分段内,并使得整个图的紧密度之和最大;3)通过验证各分段是否包含特征词,实现候选复合短语的最终识别。本发明能够自动识别科技类复合短语,省时省力,相比于传统的有监督方法,不需要大量标注语料,便于在线部署应用,是一种高效的科技类复合短语识别方法。

Patent Agency Ranking