-
公开(公告)号:CN116680414A
公开(公告)日:2023-09-01
申请号:CN202310721138.X
申请日:2023-06-19
Applicant: 吉林大学
IPC: G06F16/36 , G06F18/25 , G06N3/0455 , G06N3/084
Abstract: 本发明适用于知识图谱技术领域,提供了一种基于注意力机制的知识图谱预测方法,包括以下步骤:加载训练集三元组数据,获取小样本关系及其对应的头尾实体对;生成小样本关系的头尾实体的邻居集合;利用图注意力网络聚合小样本关系的半邻域表示;通过Transformer融合邻域信息,生成小样本关系表示;计算评分函数;计算损失函数;通过梯度下降方法最小化损失函数训练模型参数。该方法通过图注意网络融合实体的一跳邻域信息,从而获得实体的邻域表示,并从相关实体的邻域表示中获取长尾关系的有效表示,减少了稀疏邻域带来的噪声影响。使用Transformer关系聚集器获取融合邻域信息的小样本关系表示,实现小样本关系更为准确的表达。
-
公开(公告)号:CN118673931A
公开(公告)日:2024-09-20
申请号:CN202410878872.1
申请日:2024-07-02
Applicant: 吉林大学
IPC: G06F40/30 , G06F40/284 , G06F16/35 , G06F18/213 , G06F18/2415 , G06F18/243 , G06N3/0442 , G06N3/045
Abstract: 本发明适用于自然语言处理技术领域,提供了一种面向隐式情感语句的特征提取方法,包括以下步骤:步骤S1、嵌入层;采用RoBERTa模型进行单词的嵌入,步骤S2、语义交互层;采用12层的Transformer双向编码器提取隐式情感语句中的全局特征;步骤S3、BiGRU层;采用双向门控循环单元来提取情感语句中的局部特征;步骤S4、输出层;采用Softmax进行分类预测并对得到的标签结果进行输出。本发明将RoBERTa与BiGRU融合以捕捉隐式情感语句中的语义特征,不仅提高了分类的准确率,还简化了模型架构,使得训练速度更快,效率更高,整体性能得到了有效的提升。
-
公开(公告)号:CN118013374A
公开(公告)日:2024-05-10
申请号:CN202410270428.1
申请日:2024-03-11
Applicant: 吉林大学
IPC: G06F18/241 , G06F16/35
Abstract: 本发明适用于关系分类技术领域,提供了一种面向噪声场景的小样本关系分类方法和装置,方法包括:获取标注后的支持集和查询集;按照一定比例把支持集中表达同类关系的句子实例替换为表达不同关系的句子实例;对查询集和支持集中的句子样本进行实例级别的交互式匹配,并获取相应的匹配分数;对匹配分数进行归一化加权,获取加权后的各类别原型表示;将原型表示和查询集中的样本实例进行拼接,使用全连接层进一步整合;削弱受噪声影响的特征维度;完成最终的分类。本发明极大程度上提高了分类的准确率;扩展了关系类别数量和句子实例数量,破除了以往模型在分类过程中其数量固定的局限性。
-
公开(公告)号:CN118013373A
公开(公告)日:2024-05-10
申请号:CN202410270426.2
申请日:2024-03-11
Applicant: 吉林大学
IPC: G06F18/241 , G06F40/30 , G06F16/35
Abstract: 本发明适用于关系分类技术领域,提供了一种面向混淆场景的少样本关系分类方法和装置,分类方法包括:获取标注后的支持集和查询集;分别对支持集和查询集中的实例进行编码,获取编码后实例对应的语义向量并对向量进行特征提取;对支持实例特征和查询实例特征进行交互,利用查询实例的向量特征计算各支持实例对原型的贡献度,获取融合查询实例中的隐藏特征的各类别原型;使用信息门控机制整合各类别原型和查询实例的特征,获取最终的原型;设计自适应混淆目标函数,完成对查询实例的分类。本发明不仅极大程度上提高了分类的准确率,同时在效率层面使模型实现了更快的收敛速度,提高了效率。
-
公开(公告)号:CN116756337A
公开(公告)日:2023-09-15
申请号:CN202310721070.5
申请日:2023-06-19
Applicant: 吉林大学
IPC: G06F16/36 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/0985
Abstract: 本发明涉及知识图谱补全技术领域,具体是基于Reptile的元学习开放世界知识图谱补全方法,所述方法包括:S1、获取待补全的开放知识图谱以及其中的实体和关系的文本描述;S2、将待补全的开放知识图谱按照任务关系的不同,按照比例划分为元训练集、元验证集和元测试集;S3、经过若干批次的训练获得少样本开放世界知识图谱补全模型;S4、通过任务关系的少量样本,对步骤S3得到的少样本开放世界知识图谱补全模型的参数进行快速更新,得到能够适应新任务的模型;S5、采用步骤S4得到的少样本开放世界知识图谱补全模型,对元测试任务进行补全,本发明能够建立可见实体与可见实体、不可见实体与可见实体之间的链接的目的。
-
公开(公告)号:CN118760880A
公开(公告)日:2024-10-11
申请号:CN202410878678.3
申请日:2024-07-02
Applicant: 吉林大学
IPC: G06F18/213 , G06F18/214 , G06F18/241 , G06F40/284 , G06F40/30 , G06N3/0442 , G06N3/045 , G06N3/0464
Abstract: 本发明适用于虚假新闻检测技术领域,提供了一种面向不平衡样本的假新闻检测方法,包括以下步骤:单词嵌入;使用RoBERTa模型进行单词的嵌入,RoBERTa包括三种嵌入编码,分别是标记嵌入、分割嵌入和位置嵌入;语义交互模块;由RoBERTa嵌入编码、Transformer编码器和Bi‑GRU组成,用于提取全局特征;门控机制模块;由ConvID、BatchNorm、CGU、sigmoid激活函数和Dropout层组成,用于提取局部特征;权重重采样模块;设置权重和采样倍率。本发明针对数据集不平衡现象提出了权重重采样方法,不仅能够同时捕获全局特征和局部特征,还提高了分类的准确率。
-
公开(公告)号:CN116737956A
公开(公告)日:2023-09-12
申请号:CN202310713623.2
申请日:2023-06-16
Applicant: 吉林大学
IPC: G06F16/36 , G06F40/30 , G06F18/22 , G06F18/25 , G06F18/214 , G06N3/0499 , G06N3/08
Abstract: 本发明适用于知识图谱技术领域,提供了一种面向多模态知识图谱的实体对齐方法及装置,该方法包括以下步骤:将两个待对齐的多模态知识图谱作为模型的输入;使用GCN对知识图谱结构进行建模,生成知识图谱的结构嵌入;还生成语义嵌入;根据结构嵌入计算余弦相似度得到结构相似性矩阵,通过计算语义嵌入的余弦相似度得到语义相似性矩阵;通过可以动态调整权重的自适应特征融合策略将结构相似性矩阵和语义相似性矩阵融合成最终的实体相似性矩阵,根据实体相似性矩阵得到对齐结果;在得到的对齐结果中挑选可靠的对齐实体,重复迭代过程直至模型收敛,本发明解决了目前知识图谱实体对齐任务缺乏训练数据的问题。
-
公开(公告)号:CN116680616A
公开(公告)日:2023-09-01
申请号:CN202310721323.9
申请日:2023-06-19
Applicant: 吉林大学
IPC: G06F18/241 , G06F18/214 , G06F18/2131 , G06F18/25 , G06N3/0464 , G06N3/08 , G06F123/02
Abstract: 本发明涉及时间序列分类技术领域,具体是一种基于小波变换和卷积神经网络的时序分类方法,所述方法包括以下步骤:S1、对多维时间序列进行降维,得到一维时间序列;S2、将一维输入时间序列,经过小波变换变为近似分量cA和细节分量cD;S3、通过卷积神经网络CNN分析模型,得到CNN‑cA卷积和CNN‑cD卷积;S4、对两组特征矩阵进行融合,得到一个特征矩阵;S5、将融合得到的特征矩阵输入线性岭回归分类器进行分类,得到原始时间序列的分类标签,本发明基于小波变换和卷积神经网络的时序分类方法,大大降低了算法的训练时间和成本,对不同领域的时间序列数据都有良好的泛化性能,能适应各种领域的时间序列分类任务。
-
公开(公告)号:CN118673926A
公开(公告)日:2024-09-20
申请号:CN202410567011.1
申请日:2024-05-09
Applicant: 吉林大学
IPC: G06F40/30 , G06F40/211 , G06N3/045 , G06F40/151 , G06F40/205 , G06F16/35 , G06N3/0464 , G06N3/048
Abstract: 本发明适用于文本情感分析技术领域,提供了基于跨层双向保留机制的三元组提取方法,包括以下步骤:步骤S1、输入一个句子;步骤S2、通过BERT预训练语言模型学习输入句子的单词级上下文表示,对上下文表示进行二维建模,转化为填充表里的词向量进行交互;步骤S3、将词向量分别输入到词级语义解析和词对级提取两个子模块;步骤S4、将步骤S3的输出输入情感识别增强模块中进行重点提炼方面项与意见项以及识别重叠情感类型;步骤S5、将步骤S3和步骤S4的输出结合后预测表填充结果;步骤S6、预测结束,显示最终预测三元组结果。本发明能够提升三元组提取精度,并且可大大增强长段落中重叠三元组的识别效率。
-
公开(公告)号:CN116737957A
公开(公告)日:2023-09-12
申请号:CN202310720797.1
申请日:2023-06-19
Applicant: 吉林大学
IPC: G06F16/36 , G06N3/0464 , G06N3/048 , G06F16/35 , G06N3/08
Abstract: 本发明适用于知识图谱技术领域,提供了一种基于噪声优化与属性融合的实体对齐方法,包括以下步骤:对实体种子集合进行噪声初始化,获得准确的噪声实体对;注入噪声感知优化生成器,在真实种子实体对的相关分布周围获取更多的噪声实体对;产生噪声实体对后,送入噪声感知优化鉴别器,鉴别出真实的种子实体对以及噪声实体对;噪声感知优化生成器与噪声感知优化鉴别器相互迭代,得到信任分数并与阈值θ进行比较得到纯净的标记数据;将获得的真实种子实体对,通过GCN进行结构嵌入,最终获取结构对齐模型。该方法利用噪声优化与属性结合的方式不仅降低了复杂程度,且提高了实体对齐的效果,在减少实验开销的基础上,获得具有优秀的实体对齐效果。
-
-
-
-
-
-
-
-
-