-
公开(公告)号:CN115063799B
公开(公告)日:2023-04-07
申请号:CN202210935737.7
申请日:2022-08-05
Applicant: 中南大学
IPC: G06V30/10 , G06N3/0464 , G06V10/82 , G06V30/148 , G06V30/18
Abstract: 本发明公开了一种印刷体数学公式识别方法、装置及存储介质,其中方法包括:获取印刷体数学公式图片并进行预处理;基于编码器提取印刷体数学公式图片的第一特征矩阵;提取第一特征矩阵的上下文语义特征,得到第二特征矩阵;使用相对位置编码技术对第二特征矩阵进行相对位置编码,得到第三特征矩阵;将第三特征矩阵输入解码器中,得到印刷体数学公式的Latex格式序列。第三特征矩阵是第一特征矩阵的基础上依次进行了上下文语义特征和元素间相对位置特征的再次提取,提取的特征更加能准确反映印刷体数学公式的特性,提高了最终印刷体数学公式识别的准确率。
-
公开(公告)号:CN116304061A
公开(公告)日:2023-06-23
申请号:CN202310551919.9
申请日:2023-05-17
Applicant: 中南大学
IPC: G06F16/35 , G06F18/2415 , G06N3/0464 , G06N3/042
Abstract: 本发明公开了基于层次文本图结构学习的文本分类方法、装置及介质,所述方法包括如下步骤:步骤S1:将训练集文本按照三种语言学特征进行预处理,得到三种图结构矩阵;步骤S2:进行边级别图结构学习,得到三种边向量;步骤S3:去冗余,得到三种文本边向量;步骤S4:加权求和,得到文本图结构表示;步骤S5:采用图卷积神经网络进行处理,再经过图池化层生成图级别文本表示;步骤S6:进行softmax分类,概率最大的类别为最终分类结果。优点是,本发明采用三种语言学特征对训练集文本进行预处理,将文本分类问题转化为图分类问题;本发明通过多粒度的图结构学习,将不同的图结构进行了整合,防止后续学习过程中出现图结构语义丢失。
-
公开(公告)号:CN115658862A
公开(公告)日:2023-01-31
申请号:CN202211291535.X
申请日:2022-10-19
Applicant: 中南大学
IPC: G06F16/332 , G06F16/335 , G06F16/36 , G06F40/295
Abstract: 本发明提供了一种科技文献推荐方法通过采集科技文献相关数据构建科技文献知识图谱,同时收集并处理用户在系统产生的交互数据,设计融合用户行为特征与知识表示的推荐模型。相较于现有推荐模型,一方面基于用户面向科技文献资源提出的自然语言查询,分析用户偏好对科技文献知识图谱产生的语义影响,提取隐含在用户信息中的关系语义特征,建立融入关系语义的知识表示学习模型,用以提高科技文献等知识的语义表征;另一方面基于用户的历史行为交互数据,结合知识表示学习模型深入分析关系与实体对用户偏好的语义影响,建立多层次偏好感知的推荐模型,用以提高用户与科技文献之间的语义关联。
-
公开(公告)号:CN116415005A
公开(公告)日:2023-07-11
申请号:CN202310684297.7
申请日:2023-06-12
Applicant: 中南大学
IPC: G06F16/36 , G06N3/048 , G06N3/096 , G06F16/35 , G06F18/241
Abstract: 本发明公开了一种面向学者学术网络构建的关系抽取方法,包括如下步骤:步骤S1:构建包括至少两个教师模型的多教师模型,计算教师模型权重;步骤S2:构建学生模型,根据灵活温度计算蒸馏目标分布,计算知识蒸馏损失,结合知识蒸馏损失和远程监督损失计算总损失;步骤S3,进行关系抽取,学生模型进行训练,得到关系抽取模型,利用关系抽取模型对输入的数据集进行关系抽取。优点是,本发明考虑到样本的差异而设置灵活温度,使用样本在隐藏层和分类层的信息熵相对差值,尽可能保留样本的有效信息,并降低样本标签软化的不确定性;另外,本发明将多教师的思想引入到了关系抽取之中,通过构建不同教师的全局关系,以传播更丰富且有效的知识。
-
公开(公告)号:CN115063799A
公开(公告)日:2022-09-16
申请号:CN202210935737.7
申请日:2022-08-05
Applicant: 中南大学
IPC: G06V30/10 , G06N3/04 , G06V10/82 , G06V30/148 , G06V30/18
Abstract: 本发明公开了一种印刷体数学公式识别方法、装置及存储介质,其中方法包括:获取印刷体数学公式图片并进行预处理;基于编码器提取印刷体数学公式图片的第一特征矩阵;提取第一特征矩阵的上下文语义特征,得到第二特征矩阵;使用相对位置编码技术对第二特征矩阵进行相对位置编码,得到第三特征矩阵;将第三特征矩阵输入解码器中,得到印刷体数学公式的Latex格式序列。第三特征矩阵是第一特征矩阵的基础上依次进行了上下文语义特征和元素间相对位置特征的再次提取,提取的特征更加能准确反映印刷体数学公式的特性,提高了最终印刷体数学公式识别的准确率。
-
公开(公告)号:CN118916714B
公开(公告)日:2024-12-10
申请号:CN202411396576.4
申请日:2024-10-09
Applicant: 中南大学
IPC: G06F18/22 , G06F40/253 , G06F40/284 , G06N3/042 , G06N3/045 , G06N3/08
Abstract: 本发明涉及代码相似性检测技术领域,具体涉及一种基于图神经网络的代码相似性检测方法、设备及介质,所述方法包括如下步骤:调用控制流图转换模块,将待检测代码转换为控制流图,对所述控制流图进行拓扑结构编码,得到节点特征向量;构建图编辑距离计算模型;采用模型损失函数对图编辑距离计算模型进行训练,调用训练后的图编辑距离计算模型同时预测两个控制流图之间的图编辑距离和节点匹配置信度矩阵,其中图编辑距离作为代码相似性的量化指标,节点匹配置信度矩阵可生成图编辑路径。本发明采用控制流图捕获代码的逻辑和语义,利用基于图神经网络的深度学习模型来对控制流图进行分析,进而达到检测代码相似性的目的。
-
公开(公告)号:CN118916714A
公开(公告)日:2024-11-08
申请号:CN202411396576.4
申请日:2024-10-09
Applicant: 中南大学
IPC: G06F18/22 , G06F40/253 , G06F40/284 , G06N3/042 , G06N3/045 , G06N3/08
Abstract: 本发明涉及代码相似性检测技术领域,具体涉及一种基于图神经网络的代码相似性检测方法、设备及介质,所述方法包括如下步骤:调用控制流图转换模块,将待检测代码转换为控制流图,对所述控制流图进行拓扑结构编码,得到节点特征向量;构建图编辑距离计算模型;采用模型损失函数对图编辑距离计算模型进行训练,调用训练后的图编辑距离计算模型同时预测两个控制流图之间的图编辑距离和节点匹配置信度矩阵,其中图编辑距离作为代码相似性的量化指标,节点匹配置信度矩阵可生成图编辑路径。本发明采用控制流图捕获代码的逻辑和语义,利用基于图神经网络的深度学习模型来对控制流图进行分析,进而达到检测代码相似性的目的。
-
公开(公告)号:CN116860918A
公开(公告)日:2023-10-10
申请号:CN202310858312.5
申请日:2023-07-13
Applicant: 中南大学
IPC: G06F16/33 , G06N3/0464 , G06N3/049 , G06N3/0442 , G06F16/36 , G06F40/295 , G06N5/04
Abstract: 本发明公开一种基于强化学习的学术主题发现方法,步骤包括:步骤S1:构建包括实体、关系、时间的学术主题查询表示;步骤S2:建模推理路径和动作表示;步骤S3:计算查询表示与动作的相关性并筛选动作,进一步基于推理路径的状态对动作打分,结合相关性和打分计算动作被选取的概率;步骤S4:基于概率选择执行动作,更新推理路径,到达答案实体或最大步骤则停止,通过最大化累计奖励期望优化参数,得到学术主题发现模型,实现学术主题发现。优点是,本发明构建融合了实体、关系、时间的查询表示,将实体、关系、时间看作关联的整体,使查询表示具有更完备的语义;另外,本发明结合动作邻域事实构建动作表示,减少对动作认知的片面性。
-
公开(公告)号:CN115827948B
公开(公告)日:2023-05-02
申请号:CN202310086593.7
申请日:2023-02-09
Applicant: 中南大学
IPC: G06F16/951 , G06F16/31 , G06F16/335
Abstract: 本发明公开了一种爬取文献数据的单反射性智能体和文献数据爬取方法,所述单反射性智能体包括性能模块、环境模块、感知模块和执行器模块;所述性能模块用于构建性能目标函数;所述环境模块构建单反射性智能体的环境集合;所述感知模块监测系统时间以及期刊数量是否变化;所述执行器模块基于所述性能目标函数设定目标,并自动化爬取文献数据。优点是,本发明通过构建用于爬取文献数据的单反射性智能体实现文献数据爬取,所述单反射性智能体通过构建衡量自动化爬取文献数据的性能目标函数,执行器模块基于所述目标性能函数设定目标,实现全面准确的文献数据爬取。
-
公开(公告)号:CN116415005B
公开(公告)日:2023-08-18
申请号:CN202310684297.7
申请日:2023-06-12
Applicant: 中南大学
IPC: G06F16/36 , G06N3/048 , G06N3/096 , G06F16/35 , G06F18/241
Abstract: 本发明公开了一种面向学者学术网络构建的关系抽取方法,包括如下步骤:步骤S1:构建包括至少两个教师模型的多教师模型,计算教师模型权重;步骤S2:构建学生模型,根据灵活温度计算蒸馏目标分布,计算知识蒸馏损失,结合知识蒸馏损失和远程监督损失计算总损失;步骤S3,进行关系抽取,学生模型进行训练,得到关系抽取模型,利用关系抽取模型对输入的数据集进行关系抽取。优点是,本发明考虑到样本的差异而设置灵活温度,使用样本在隐藏层和分类层的信息熵相对差值,尽可能保留样本的有效信息,并降低样本标签软化的不确定性;另外,本发明将多教师的思想引入到了关系抽取之中,通过构建不同教师的全局关系,以传播更丰富且有效的知识。
-
-
-
-
-
-
-
-
-