一种基于对比学习的文本情感四元组生成式方法

    公开(公告)号:CN116484860A

    公开(公告)日:2023-07-25

    申请号:CN202310505239.3

    申请日:2023-05-06

    Inventor: 夏睿 刘世杰 许凤

    Abstract: 本发明公开了一种基于对比学习的文本情感四元组生成式方法,该方法包括:将观点持有者和情感目标互换;对真实标签中情感表达式进行随机替换;将真实标签中的情感极性替换为其情感极性空间中的补集;利用构造的反例进行对比学习训练BERT编码器;提取评论文本特征,利用T5编码器提取文本特征向量[t1,…tn];利用Teacher‑Forcing技术对T5解码器生成的内容计算损失并训练得到模型;组合两种模型获得自纠正生成式四元组抽取模型。本发明提出的该模型,能够有效地纠正T5模型在生成时对候选句子的选择错误,超越了现有的针对细粒度情感四元组抽取任务的模型。

    面向产品评论的跨领域对偶情感分析方法

    公开(公告)号:CN108694165B

    公开(公告)日:2021-11-09

    申请号:CN201710229726.6

    申请日:2017-04-10

    Inventor: 夏睿 王乐义

    Abstract: 本发明公开了一种面向产品评论的跨领域对偶情感分析方法,该方法包括:对于给定目标领域的产品评论数据,获取源领域标注语料资源,随后对源领域和目标领域的样本数据预处理;借助英文本体库为语料中的特征词构建具有一对多关系的带权反义词典;结合改进的知识规则和带权反义词典为源领域和目标领域的样本构造翻转数据集,扩充语料;采用“词袋”模型对数据集中的原样本及翻转样本进行文本表示,并对翻转样本中引入的带权情感词进行加权表示;采用对偶学习方法训练基分类器,并使用基于置信度的集成策略进行基分类器集成。本发明能较好地解决情感分析任务中产品评论等短文本的数据稀疏问题、极性转移问题,并在领域适应问题上表现良好。

    一种基于常识知识增强的对话情绪原因识别系统

    公开(公告)号:CN117808004A

    公开(公告)日:2024-04-02

    申请号:CN202410003119.8

    申请日:2024-01-02

    Inventor: 夏睿 李可

    Abstract: 本发明公开了一种基于常识知识增强的对话情绪原因识别系统,系统将情绪原因抽取转化为情绪原因生成,利用以事件为中心的常识知识图谱,为每个话语抽取相关的常识知识信息;基于Seq2Seq架构,编码器对对话内容和常识知识进行编码;情绪感知的注意力模块筛选与情绪相关的常识知识信息;常识知识增强的图注意力模块建模情绪和原因之间的因果关联,进行有效的因果推理;将学习到的知识增强的对话特征送入解码器,生成目标情绪的原因片段序列。本发明的方法超越了现有的对话情绪原因识别方法,性能有明显提升。

    基于时序切分与融合的谣言早期检测算法

    公开(公告)号:CN111460144B

    公开(公告)日:2022-11-22

    申请号:CN202010172672.6

    申请日:2020-03-12

    Inventor: 夏睿 宣凯洲

    Abstract: 本发明公开了一种基于时序切分与融合的谣言早期检测算法,包括以下步骤:对微博谣言传播的时间线按发展规律切分为多个时间窗;预处理每一个时间窗内的微博或评论文本;为每个时间窗内的数据独立训练编码器;沿时间线将每个时间窗所得的编码与上一个时间窗的编码进行拼接,形成增量式的训练网络;在每个时间窗下进行独立地分类,即可方便地在不同时间点对谣言事件进行真实性检测。本发明将谣言检测任务从一体化的文本分类任务转化为基于时序的增量式分类任务,并有效解决了谣言早期检测精度低的问题。

    基于多智能体的信息传播与舆情演化仿真方法

    公开(公告)号:CN109064347B

    公开(公告)日:2022-05-17

    申请号:CN201710435528.5

    申请日:2017-06-11

    Inventor: 夏睿 李银波

    Abstract: 本发明公开了一种基于多智能体的信息传播与舆情演化的仿真方法,包括以下步骤:选取无标度网络作为仿真的媒介;构建网民个体的传播意愿负指数模型;定义网民的属性以及网民群体之间的交互规则,基于交互规则构建网民的连续观点演化模型;信息传播与网民舆情观点演化过程相结合,对信息的传播、观点的演化进行仿真,模型运行到预设的时间步停止。本发明通过引入信息的传播、网民的交互规则以及多样的属性定义,能更好的反应出真实社会中舆情与信息一起传播的规律,体现网民之间的差异性,发现信息传播与舆情演化的规律。

    基于规则和神经网络的商品评论属性级情感分类方法

    公开(公告)号:CN107862343B

    公开(公告)日:2021-07-13

    申请号:CN201711217412.0

    申请日:2017-11-28

    Inventor: 夏睿 郑士梁

    Abstract: 本发明公开了一种基于规则和神经网络的商品评论属性级情感分类方法,首先获取评论数据,对评论文本进行中文分词及停用词过滤;然后利用规则模板筛选出商品属性集,构造 样本集,对每一条评论的属性标注情感,构造 训练集;再构建基于双边注意力的神经网络情感分类模型,使用训练集对模型进行训练;最后对测试数据进行中文分词及停用词过滤,筛选出商品属性集,构造 测试集,并使用情感分类模型进行情感分类。本发明能更好地利用评论中属性的上下文信息,极大地提高了预测属性情感类别的准确性。

    基于无向图与单层神经网络的中文分词方法

    公开(公告)号:CN107832307B

    公开(公告)日:2021-02-23

    申请号:CN201711218709.9

    申请日:2017-11-28

    Inventor: 夏睿 何声欢

    Abstract: 本发明公开了一种基于无向图与单层神经网络的中文分词方法,首先根据标注集,对给定的训练中文文本进行标注,统计其初始状态系数和状态转移系数;然后根据字典资源文件,对中文文本的每个字符依据其上下文进行特征抽取,得到文本特征;根据所有文本特征,构建特征函数集合,将文本特征转换特征向量;接着将特征向量送给单层神经网络训练分类器模型进行训练,直至模型收敛;再使用单层神经网络模型,对测试数据进行分类,根据统计的初始状态系数、状态转移系数,使用维特比算法进行最优标注序列的求解;最后将最优标注序列与测试原始文本结合,生成分词文本。本发明训练速度更快,消耗资源更少,泛化能力更强。

    基于文本、语音和视频融合的多模态情感分类方法

    公开(公告)号:CN110287389A

    公开(公告)日:2019-09-27

    申请号:CN201910472457.5

    申请日:2019-05-31

    Inventor: 夏睿 李晟华

    Abstract: 本发明公开了一种基于文本、语音和视频融合的多模态情感分类方法,包括:获取多模态数据进行预处理,划分为训练集与测试集;构建基于张量融合的端对端多模态情感分类模型,并使用训练集对模型进行训练;对测试集进行步骤1的预处理操作,使用步骤2得到的张量融合情感分类模型进行情感分类。本发明通过多模态情感分类模型能更好地捕捉模糊的深层情感信息。

    对话情绪分析方法、装置和计算机可读存储介质

    公开(公告)号:CN116090474A

    公开(公告)日:2023-05-09

    申请号:CN202111295920.7

    申请日:2021-11-03

    Abstract: 本发明实施例提供了话情绪分析方法、装置和计算机可读存储介质;其中方法包括:获取目标对话的文本数据和语音数据;将文本数据和语音数据输入至基于图结构的分类模型进行情绪分类,图结构包括多个节点和节点特征,节点和话语对应,节点特征包括文本特征和语音特征;能够结合多人对话的文本数据和语音数据双模态信息进行情绪分类,分别对双模态信息捕抓各自的序列特征,采用图注意力网络捕捉全局的语义特征,使分类模型同时关注两个模态的序列特征和语义特征;加强了多模态学习的有效性,提升了针对多人对话的情绪分类的准确性。

Patent Agency Ranking