一种提取论文标题中的问题方法对的方法

    公开(公告)号:CN108460021A

    公开(公告)日:2018-08-28

    申请号:CN201810219012.1

    申请日:2018-03-16

    Applicant: 安徽大学

    Abstract: 本发明公开了一种提取论文标题中的问题方法对的方法,包括:对论文标题进行标准化处理,在论文标题中进行论文关键词匹配`,得到初步问题方法概念集合;利用黑名单、白名单对初步问题方法概念集合进行调整,得到有效问题方法概念集合;构建用于分隔问题和方法的目标语法模式集合;根据目标语法模式集合和有效问题方法概念集合从论文标题中提取出问题概念集合和方法概念集合;利用笛卡尔积搭配问题概念集合和方法概念集合,得到论文标题中的问题方法对。

    一种面向词典集的复杂从属结构网页信息抽取方法及系统

    公开(公告)号:CN108416048A

    公开(公告)日:2018-08-17

    申请号:CN201810220100.3

    申请日:2018-03-16

    Applicant: 安徽大学

    Abstract: 本发明公开了一种面向词典集的复杂从属结构网页信息抽取方法:根据页面标识判断页面是否完整并返回目标完整html页面;根据语义相关性将预设语种主标题挂接至定义的规则表示词典集中对应的规则表示中,生成全表示词典集;从复杂从属结构页面下提取全文本内容并最终形成目标文本内容,并用规则表示词典集中的规则表示替换全表示词典集分割目标文本内容得到包含每个规则表示子集的全分割复杂从属文本集;合并全分割复杂从属文本集中相同规则表示的子集内容并将其作为每个规则表示的全内容;基于新发布页面重新抽取主标题内容动态扩充全表示词典集。本发明解决了传统的网页的信息解析方法中不同站点之间内容主题相同但页面结构不统一而导致的解析困难的问题。

    一种网页学术报告信息抽取方法和系统

    公开(公告)号:CN107122403A

    公开(公告)日:2017-09-01

    申请号:CN201710174575.9

    申请日:2017-03-22

    Applicant: 安徽大学

    Abstract: 本发明公开了一种网页学术报告信息抽取方法和系统,包括:将学术报告网页html标签和学术报告的内容开头替换为对应的固定表示标记,根据相邻两个固定表示标记对学术报告进行分割,得到初步分割结果集合;删除初步分割结果集合中匹配预设黑名单的初步分割结果,得到有效分割结果集合;获取有效分割结果集合中各有效分割结果的开头位置和结尾位置,根据所述开头位置和结尾位置合并提取各有效分割结果对应的属性内容;当属性出现重复,根据属性排列方式将不同属性对应的属性内容分配到相应的学术报告中,并将多个报告中出现且仅出现一次的属性添加到本网页其他报告中;获取学术报告的报告人信息和时间并匹配到学术报告中报告人信息和时间中。

    一种分层递阶的多粒度社团发现方法

    公开(公告)号:CN105260415A

    公开(公告)日:2016-01-20

    申请号:CN201510621622.0

    申请日:2015-09-24

    Applicant: 安徽大学

    CPC classification number: G06F16/958 G06Q50/01

    Abstract: 本发明公开了一种分层递阶的多粒度社团发现方法,其特征是按如下步骤进行:1计算所述网络中任意两个节点的相似度;2构建截距集合;3找出最大相容类集合;4近似获得等价类集合;5根据截距集合,并重复步骤3和4,从而获得不同截距下的社团结构。本发明能在原始网络结构特性的基础上发现所有节点之间的层次关系以及不同粒度的社团结构,从而确保社团划分结果的准确性和层次的唯一性。

    基于GLM-4的无标注课程知识点图谱构建方法及系统

    公开(公告)号:CN119474406B

    公开(公告)日:2025-04-08

    申请号:CN202510052674.4

    申请日:2025-01-14

    Applicant: 安徽大学

    Abstract: 本发明提供基于GLM‑4的无标注课程知识点图谱构建方法及系统,方法包括:生成知识点图谱的第一层次结构;根据第一层次结构,对章节及下属各级标题进行文档分割操作,得到章节独立单元、分级标题独立单元;进行数据清洗操作,得到预处理章节独立单元、预处理标题独立单元;进行知识点获取操作,调用GLM‑4模型的应用程序编程接口API,并给定prompt指令,据以利用GLM‑4模型,从预处理章节独立单元、预处理标题独立单元中,提取得到符合大纲知识点;利用GLM‑4模型进行噪声去除操作,得到去噪数据;通过余弦相似度算法进行比对;构建知识图谱。本发明解决了知识点图谱在粒度上过于细化,导致知识难以理解的技术问题。

    多课程融合知识图谱构建及真题解析方法及系统

    公开(公告)号:CN119474348B

    公开(公告)日:2025-04-08

    申请号:CN202510058933.4

    申请日:2025-01-15

    Applicant: 安徽大学

    Abstract: 本发明提供多课程融合知识图谱构建及真题解析方法及系统,方法包括:进行知识点对齐操作,对跨课程的知识点进行整合操作,利用余弦相似度计算方法,对知识点进行量化分析,识别并对齐不同课程中的同义知识点;进行知识点消歧操作,处理知识点同名不同义的情形,得到整合知识点、整合知识图谱;对整合知识点进行知识点规范化操作,对整合知识图谱进行标准化处理,得到规范化知识点、标准化知识图谱;对规范化知识点进行转换、提取得到关键特征,根据关键特征处理得到语义特征序列向量;匹配得到匹配结果、适用知识点;对匹配结果进行验证和评估,将题目挂载至对应的知识点。本发明解决了知识点抽取结果片面化、结果准确率不高的技术问题。

    一种基于目标子图划分的节点注入攻击方法及装置

    公开(公告)号:CN119323234A

    公开(公告)日:2025-01-17

    申请号:CN202411875946.2

    申请日:2024-12-19

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于目标子图划分的节点注入攻击方法及装置,本发明的方法包括将包含实体节点的图结构数据集作为原始图数据;通过社区检测算法将原始图数据划分为多个子图,并根据攻击目标实体节点的位置和局部结构从多个子图中选取最相关的目标子图;基于对目标子图的攻击生成注入实体节点与目标实体节点邻域特征相匹配的特征,并对注入实体节点的特征进行优化;将优化后的注入实体节点映射至原始图数据中,并根据攻击目标实体节点的邻域结构建立与原始图数据中实体节点的连接关系,以基于连接关系完成对图神经网络的对抗性攻击。本发明解决了现有图注入攻击方法在处理大规模图数据时的效率和隐蔽性问题,并且该方法具有更高的攻击成功率。

    一种Logisim电路图的查重方法及系统

    公开(公告)号:CN113836863B

    公开(公告)日:2024-05-28

    申请号:CN202111157834.X

    申请日:2021-09-30

    Applicant: 安徽大学

    Abstract: 一种Logisim电路图的查重方法及系统,属于数据处理技术领域,解决如何有效地捕捉到Logisim电路图的关键信息,减少拖拽电路图的部分元件或部分最大连通子图对查重的干扰的问题,包括以下步骤:将Logisim电路图视作以元件为节点、以导线为边的无向图,然后将无向图划分为若干最大连通子图,得到最大连通子图集合,从而创建最大连通子图集合数据集;通过计算最大连通子图的相似度,从而计算最大连通子图集合的重复率;根据计算的重复率采用阈值过滤或聚类的方法从Logisim电路图数据集找到重复的Logisim电路图;本发明的技术方案将Logisim电路图表示为最大连通子图集合,有效地捕捉到Logisim电路图的关键信息,减少多种作弊手段对查重的干扰,从而提高查重的效果。

    基于序列级前缀提示的生成式文本摘要方法和装置

    公开(公告)号:CN115965033B

    公开(公告)日:2023-07-11

    申请号:CN202310253057.1

    申请日:2023-03-16

    Applicant: 安徽大学

    Abstract: 本申请提出一种基于序列级前缀提示的生成式文本摘要方法和装置,该方法包括:获取文本和文本的参考摘要进行预处理;将经过预处理的文本输入第一预训练模型生成多条候选摘要,根据参考摘要使用Rouge指标对生成的候选摘要进行评估得到Rouge分值,并对多条候选摘要进行排序;对排序后的多条候选摘要进行预处理,根据经过预处理的文本、参考摘要和多条候选摘要利用多损失联合调优方式对摘要生成模型进行训练,得到具有序列级前缀提示的摘要生成模型;获取待处理文本进行预处理,并输入具有序列级前缀提示的摘要生成模型,通过序列级前缀提示以自回归方式生成待处理文本的摘要。本申请能够加快摘要生成模型训练过程并大大降低计算量,同时更准确生成摘要。

Patent Agency Ranking