-
公开(公告)号:CN113849628A
公开(公告)日:2021-12-28
申请号:CN202111075709.4
申请日:2021-09-14
Applicant: 中国科学院软件研究所
IPC: G06F16/335 , G06F16/36 , G06F40/205 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向热点话题的渐进式观点抽取方法和系统。该方法为:提供先验知识;基于先验知识构建种子事件结构图,图中包含观点信息结点以及代表观点元素间关系的边;结合当前阶段的事件结构图和数据进行观点抽取模型的训练和预测,训练结束后给出当前阶段数据的预测结果;去掉已经存在于事件结构图中的观点,将新观点提交给专家进行确认;将专家返回的确认结果进行筛选,去掉不合格的观点,将合格观点添加到事件结构图中;再次返回至观点抽取步骤,如此循环进行直至观点抽取模型达到收敛。本发明将历史信息用于同一话题下新文本观点抽取,能有效减缓不均衡热点话题数据集带给神经模型的影响,在少量标注数据下就能获得高质量的观点信息。