-
公开(公告)号:CN116702746A
公开(公告)日:2023-09-05
申请号:CN202310594620.1
申请日:2023-05-24
Applicant: 中国科学院自动化研究所
IPC: G06F40/205 , G06F40/211 , G06F40/30 , G06N3/045 , G06N3/047 , G06N3/048 , G06N5/022
Abstract: 本申请涉及一种跨平台多主题的讽刺及动因识别方法、装置、设备及介质,其中,方法包括:获取跨平台的待识别文本,并根据待识别文本及其发布平台获得预设格式的目标数据;利用预设语言表征模型分别对预设跨平台标签集以及目标数据进行编码表示,得到文本表征向量以及标签表征向量,其中,预设跨平台标签集包括多个主题标签;对文本表征向量以及标签表征向量进行计算,得到与待识别文本对应的讽刺识别结果,其中,讽刺识别结果包括主题识别结果、讽刺判定结果以及讽刺动因。解决了无法结合跨平台下文本多维度数据同时识别文本主题、是否讽刺以及讽刺动因的问题。
-
公开(公告)号:CN114818733B
公开(公告)日:2025-01-03
申请号:CN202210555613.6
申请日:2022-05-20
Applicant: 中国科学院自动化研究所
IPC: G06F40/30 , G06F40/253 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种媒体转引类型的识别方法、装置、电子设备及存储介质,属于自然语言处理领域。其中,该方法包括:将源媒体发布的源信息和转引媒体发布的转引信息输入预训练语言模型,分别得到源信息和转引信息的篇章表示向量以及句子表示向量;对源信息和转引信息的各句子表示向量进行双向交互式语义信息学习,得到双向的交互语义篇章表示向量;将基于预训练语言模型得到篇章表示向量和交互语义篇章表示向量进行融合,得到增强语义表示向量;根据所述增强语义表示向量进行媒体转引类型识别,得到媒体转引类型。通过本发明,实现了多层级、细粒度地增强篇章的语义表征能力,有效提升媒体转引类型的识别性能。
-
公开(公告)号:CN114818733A
公开(公告)日:2022-07-29
申请号:CN202210555613.6
申请日:2022-05-20
Applicant: 中国科学院自动化研究所
IPC: G06F40/30 , G06F40/253 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种媒体转引类型的识别方法、装置、电子设备及存储介质,属于自然语言处理领域。其中,该方法包括:将源媒体发布的源信息和转引媒体发布的转引信息输入预训练语言模型,分别得到源信息和转引信息的篇章表示向量以及句子表示向量;对源信息和转引信息的各句子表示向量进行双向交互式语义信息学习,得到双向的交互语义篇章表示向量;将基于预训练语言模型得到篇章表示向量和交互语义篇章表示向量进行融合,得到增强语义表示向量;根据所述增强语义表示向量进行媒体转引类型识别,得到媒体转引类型。通过本发明,实现了多层级、细粒度地增强篇章的语义表征能力,有效提升媒体转引类型的识别性能。
-
-