从新闻文档中抽取社会网络的方法和系统

    公开(公告)号:CN102508830A

    公开(公告)日:2012-06-20

    申请号:CN201110384750.X

    申请日:2011-11-28

    Abstract: 本发明公开一种基于语义分析的网络新闻信息中社会网络自动抽取方法,包括:文档预处理;把经过预处理的新闻文档根据句义完整性进行语篇划分,形成话语片段;对划分之后的各个话语片断进行主动词识别;对于每个话语片段中的主动词识别其施事论元和受事论元;把施事论元和受事论元之间进行有向连接,并进行关系动词的标注,形成实体关系;将所有实体关系进行合并,得到整个事件的社会网络;输出抽取的社会网络。本发明提供的方法实现了对网络新闻中社会网络更加有效的抽取和表示,可用于网络新闻的社会网络抽取、网络新闻的监控等方面,也可用于新闻热点的发现、以及建立新闻热点索引等方面。

Patent Agency Ranking