-
公开(公告)号:CN115700583A
公开(公告)日:2023-02-07
申请号:CN202110806934.4
申请日:2021-07-16
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC分类号: G06F40/284 , G06F18/2411
摘要: 本发明公开了一种基于语义网络词表示与注意力图的事件检测方法及装置,包括:拼接每个词的词内容向量、词结构向量与位置特征向量,生成各句子的特征图;结合各词的POS向量进行注意力机制的计算,生成各句子的新特征图;基于新特征图生成句层面特征向量;利用句层面特征向量与词内容向量的拼接结果,获取事件检测结果。本发明综合利用了外部语料库、语义网络、词性和注意力图,并通过优化特征,更准确地抽取触发词,引入了更多信息,解决了一词多义问题,表达了同义词之间的关联信息,得到更精确地事件检测结果。
-
公开(公告)号:CN112069312A
公开(公告)日:2020-12-11
申请号:CN202010806716.6
申请日:2020-08-12
申请人: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/35 , G06F40/295 , G06F40/30 , G06F16/9535
摘要: 本发明提供一种基于实体识别的文本分类方法,包括:对待检测文本进行切词,得到情感词与实体词,并通过一实体及情感类别已标注数据集判断实体词的情感类别;对待检测文本进行断句,通过情感词与标注情感类别的实体词在每一句子中的词性、否定词及标点符号内容,获取各句子的情感类别;依据各句子的情感类别,得到待检测文本的情感类别。本发明利用半监督学习的方式,通过协同训练加主动学习的方式,结合学习加情感规则的方式,确定指向性实体集;通过识别指定方向实体,结合情感词进行倾向性判断;生成指定类别实体集,结合情感规则,实现对文本更深层次的分析。
-
公开(公告)号:CN112069312B
公开(公告)日:2023-06-20
申请号:CN202010806716.6
申请日:2020-08-12
申请人: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/35 , G06F40/295 , G06F40/30 , G06F16/9535
摘要: 本发明提供一种基于实体识别的文本分类方法,包括:对待检测文本进行切词,得到情感词与实体词,并通过一实体及情感类别已标注数据集判断实体词的情感类别;对待检测文本进行断句,通过情感词与标注情感类别的实体词在每一句子中的词性、否定词及标点符号内容,获取各句子的情感类别;依据各句子的情感类别,得到待检测文本的情感类别。本发明利用半监督学习的方式,通过协同训练加主动学习的方式,结合学习加情感规则的方式,确定指向性实体集;通过识别指定方向实体,结合情感词进行倾向性判断;生成指定类别实体集,结合情感规则,实现对文本更深层次的分析。
-
-