-
公开(公告)号:CN119623614A
公开(公告)日:2025-03-14
申请号:CN202510148309.3
申请日:2025-02-11
Applicant: 南京信息工程大学
IPC: G06N5/025 , G06F40/295 , G06N3/0499 , G06N3/084
Abstract: 本发明提供了一种基于空间感知依赖图和无损解码的联合信息抽取方法,包括:步骤1,利用预训练的语言模型对输入文本序列进行编码;步骤2,识别出实体和事件触发器;步骤3,将位置信息添加到实体和事件触发器表示中;步骤4,将信息抽取任务构造为图预测模型,实体和事件触发器为图的节点,关系和事件论元为图的边;步骤5,计算节点和边的联合概率分布;步骤6,得到节点和边的标签;步骤7,输入文本,输出文本所含实体、关系、事件触发器、事件论元类别。本发明改进了现有的局部解码策略,采取随机梯度变分推断避免解码过程中同一任务标签之间依赖性的损失,以实现更好的实例标签的全局最优分配。有效提升联合信息抽取的准确性和鲁棒性。
-
公开(公告)号:CN119739857B
公开(公告)日:2025-05-09
申请号:CN202510260828.9
申请日:2025-03-06
Applicant: 南京信息工程大学
IPC: G06F16/34 , G06F16/31 , G06F40/289 , G06F40/30 , G06N3/045 , G06F18/25 , G06N3/0464
Abstract: 本发明提供了一种基于多粒度特征融合的代码摘要生成方法,包括:步骤1,对数据集中样本进行预处理操作,获取代码整体语义信息;步骤2,搭建源代码多粒度特征编码器,基于词元序列、抽象语法树和控制流图三种粒度特征的数据规模和数据结构差异,获得各个粒度特征的上下文向量;步骤3,对不同粒度特征编码器的输出实现粒度特征融合;步骤4,将融合后所得到的词元序列融合特征与控制流图融合特征输入到基于Transformer的解码器中,输出当前时间步预测单词,并最终组成摘要。本发明所公开的基于多粒度特征融合的代码摘要生成方法,能有效提取源代码关键特征并尽量减少计算开销,并且有效缓解特征序列的长距离依赖问题。
-
公开(公告)号:CN119166214B
公开(公告)日:2025-03-25
申请号:CN202411672757.5
申请日:2024-11-21
Applicant: 南京信息工程大学
IPC: G06F8/73 , G06F8/71 , G06F8/30 , G06F18/214 , G06F8/41 , G06F18/25 , G06N3/042 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于跨模态信息融合的代码摘要生成方法及系统,方法包括:由公共数据集中获取训练源代码,通过解析单元对训练源代码进行解析获得标记序列特征、AST节点特征和CFG节点特征;将标记序列特征、AST节点特征和CFG节点特征输入编码单元和解码单元获得训练代码摘要;将训练源代码中实际摘要作为真实标签,根据训练代码摘要和真实标签计算训练损失,根据训练损失对代码摘要生成器的参数进行优化,重复迭代直至达到训练终止条件输出训练后的代码摘要生成器;本发明获取源代码特征序列的长距离依赖关系,提取特征间的深层次关联,从而生成更加准确、自然的代码摘要。
-
公开(公告)号:CN119180329A
公开(公告)日:2024-12-24
申请号:CN202411700303.4
申请日:2024-11-26
Applicant: 南京信息工程大学
IPC: G06N5/022 , G06F40/30 , G06F40/194 , G06F40/117 , G06F18/24
Abstract: 本发明公开了一种地质知识图谱构建方法、装置、存储介质及设备,属于知识图谱构建技术领域,方法包括获取包含地质信息的地质文本和关系标签;将地质文本中的句子和关系标签编码成嵌入向量形式,将关系标签嵌入向量嵌入句子嵌入向量中得到文本嵌入向量;将文本嵌入向量和关系标签输入到神经网络分类器中,据此构建空白三维矩阵,通过预设的标记规则对空白三维矩阵中的各项进行标记得到三维标记矩阵;利用预设的分类器筛选出包含最佳地质三元组的三维标记矩阵;将最佳地质三元组提取出来输入到知识图谱构建数据库中构建地质知识图谱;本发明通过对句子增强提高信息多样性;通过标记方案和分类器设计解决了三元组重叠问题,提高效率。
-
公开(公告)号:CN119829745A
公开(公告)日:2025-04-15
申请号:CN202510300734.X
申请日:2025-03-14
Applicant: 南京信息工程大学
IPC: G06F16/334 , G06F16/36 , G06F40/194 , G06F40/30 , G06N3/042 , G06N3/08 , G06N5/022
Abstract: 本发明提供了一种基于混合提示调优的文档级关系抽取方法,包括:利用历史文档构建文档级知识图谱模块,获取并处理实体、关系结构信息;设计句子级语义检索增强机制,基于语义相关度匹配并检索上下文信息;提出混合提示调优方法,对大语言模型进行高效参数微调;最后聚合文档级知识图谱和句子级语义检索增强生成SetRAG机制的输出结果进行文档级关系预测。本发明通过将基于图谱的领域知识和基于检索的语义知识相结合,可以有效解决现有文档级关系抽取中难以捕获实体、关系交互信息以及跨句子关系推理困难的问题,同时实现了高效、准确的文档级关系抽取,并在公开测试数据集上取得了显著的性能提升。
-
公开(公告)号:CN119255301B
公开(公告)日:2025-04-01
申请号:CN202411775215.0
申请日:2024-12-05
Applicant: 南京信息工程大学
IPC: H04W28/084 , H04W28/08 , H04W72/50 , H04W72/0453 , H04W72/54 , H04W72/541 , H04B7/185 , H04W84/06
Abstract: 本发明提供一种考虑多性能指标的计算任务卸载优化方法,属于边缘计算技术领域,方法混合采用正交多址接入技术与非正交多址接入技术实现同时为多个用户提供服务,方法包括:计算出每个计算任务在预设的计算路径下的时间成本;将每个计算任务的时间成本输入预先建立的计算任务分配模型,生成初步分配方案;建立计算任务卸载优化问题的MINLP模型;以初步分配方案为起点,采用拉格朗日松弛方法和对偶分解方法求解所述MINLP模型,获得最优计算任务卸载优化方案。本发明在使用拉格朗日松弛和对偶分解方法求解MINLP模型时,采用计算任务分配模型提供初步分配方案,减少了搜索范围,降低计算复杂度,提升系统的实时性。
-
公开(公告)号:CN119255301A
公开(公告)日:2025-01-03
申请号:CN202411775215.0
申请日:2024-12-05
Applicant: 南京信息工程大学
IPC: H04W28/084 , H04W28/08 , H04W72/50 , H04W72/0453 , H04W72/54 , H04W72/541 , H04B7/185 , H04W84/06
Abstract: 本发明提供一种考虑多性能指标的计算任务卸载优化方法,属于边缘计算技术领域,方法混合采用正交多址接入技术与非正交多址接入技术实现同时为多个用户提供服务,方法包括:计算出每个计算任务在预设的计算路径下的时间成本;将每个计算任务的时间成本输入预先建立的计算任务分配模型,生成初步分配方案;建立计算任务卸载优化问题的MINLP模型;以初步分配方案为起点,采用拉格朗日松弛方法和对偶分解方法求解所述MINLP模型,获得最优计算任务卸载优化方案。本发明在使用拉格朗日松弛和对偶分解方法求解MINLP模型时,采用计算任务分配模型提供初步分配方案,减少了搜索范围,降低计算复杂度,提升系统的实时性。
-
公开(公告)号:CN119623614B
公开(公告)日:2025-04-18
申请号:CN202510148309.3
申请日:2025-02-11
Applicant: 南京信息工程大学
IPC: G06N5/025 , G06F40/295 , G06N3/0499 , G06N3/084
Abstract: 本发明提供了一种基于空间感知依赖图和无损解码的联合信息抽取方法,包括:步骤1,利用预训练的语言模型对输入文本序列进行编码;步骤2,识别出实体和事件触发器;步骤3,将位置信息添加到实体和事件触发器表示中;步骤4,将信息抽取任务构造为图预测模型,实体和事件触发器为图的节点,关系和事件论元为图的边;步骤5,计算节点和边的联合概率分布;步骤6,得到节点和边的标签;步骤7,输入文本,输出文本所含实体、关系、事件触发器、事件论元类别。本发明改进了现有的局部解码策略,采取随机梯度变分推断避免解码过程中同一任务标签之间依赖性的损失,以实现更好的实例标签的全局最优分配。有效提升联合信息抽取的准确性和鲁棒性。
-
公开(公告)号:CN119739857A
公开(公告)日:2025-04-01
申请号:CN202510260828.9
申请日:2025-03-06
Applicant: 南京信息工程大学
IPC: G06F16/34 , G06F16/31 , G06F40/289 , G06F40/30 , G06N3/045 , G06F18/25 , G06N3/0464
Abstract: 本发明提供了一种基于多粒度特征融合的代码摘要生成方法,包括:步骤1,对数据集中样本进行预处理操作,获取代码整体语义信息;步骤2,搭建源代码多粒度特征编码器,基于词元序列、抽象语法树和控制流图三种粒度特征的数据规模和数据结构差异,获得各个粒度特征的上下文向量;步骤3,对不同粒度特征编码器的输出实现粒度特征融合;步骤4,将融合后所得到的词元序列融合特征与控制流图融合特征输入到基于Transformer的解码器中,输出当前时间步预测单词,并最终组成摘要。本发明所公开的基于多粒度特征融合的代码摘要生成方法,能有效提取源代码关键特征并尽量减少计算开销,并且有效缓解特征序列的长距离依赖问题。
-
公开(公告)号:CN119166214A
公开(公告)日:2024-12-20
申请号:CN202411672757.5
申请日:2024-11-21
Applicant: 南京信息工程大学
IPC: G06F8/73 , G06F8/71 , G06F8/30 , G06F18/214 , G06F8/41 , G06F18/25 , G06N3/042 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于跨模态信息融合的代码摘要生成方法及系统,方法包括:由公共数据集中获取训练源代码,通过解析单元对训练源代码进行解析获得标记序列特征、AST节点特征和CFG节点特征;将标记序列特征、AST节点特征和CFG节点特征输入编码单元和解码单元获得训练代码摘要;将训练源代码中实际摘要作为真实标签,根据训练代码摘要和真实标签计算训练损失,根据训练损失对代码摘要生成器的参数进行优化,重复迭代直至达到训练终止条件输出训练后的代码摘要生成器;本发明获取源代码特征序列的长距离依赖关系,提取特征间的深层次关联,从而生成更加准确、自然的代码摘要。
-
-
-
-
-
-
-
-
-