一种主题约束表示的关键词抽取方法及装置

    公开(公告)号:CN115687576A

    公开(公告)日:2023-02-03

    申请号:CN202211706894.7

    申请日:2022-12-29

    Applicant: 安徽大学

    Abstract: 本发明提出一种主题约束表示的关键词抽取方法,包括,获取目标文本并对目标文本进行预处理,获得字序列;将所述字序列输入到预训练语言模型,获得目标文本中每个字的向量和文本主题向量;计算所述每次字向量与文本主题向量的相似度,得到相似性权重,根据相似性权重获得每个字的主题约束表示向量;将主题约束表示向量输入到序列标注分类器,得到每个字对应各个标签的概率;对目标文本进行滑动窗口采样,获取所有的候选词语,根据每个字对应各个标签的概率对候选词语进行排序,选择排序后的候选词语获得目标关键词。通过本发明提出的主题约束表示的关键词抽取方法,解决了如何从文本中抽取多个关键词问题。

    基于专利异构信息网络挖掘竞争者的方法及装置

    公开(公告)号:CN115641009A

    公开(公告)日:2023-01-24

    申请号:CN202211421320.5

    申请日:2022-11-14

    Applicant: 安徽大学

    Abstract: 本申请提出了一种基于专利异构信息网络挖掘竞争者的方法及装置,涉及网络表示学习领域,包括:获取竞争对真值,根据竞争对真值从专利数据库中抽取并清洗专利数据以构建专利数据集;根据专利数据集确定专利语义相似度,根据专利语义相似度构建专利语义连边,根据专利语义连边构建专利异构信息网络;通过图嵌入获取专利异构信息网络内公司节点以及公司节点所处的结构特征;筛选公司节点,通过注意力机制综合公司节点的向量表示,得到公司节点的嵌入矩阵;根据嵌入矩阵计算公司节点间的余弦相似度,其中,将余弦相似度最高的结果作为目标公司的候选竞争者。本申请通过专利数据构建网络,引入图嵌入方法与注意力机制用于竞争者挖掘,提高挖掘效率。

    文档层次结构联合全局局部信息抽取关键短语方法及系统

    公开(公告)号:CN115017903A

    公开(公告)日:2022-09-06

    申请号:CN202210697632.2

    申请日:2022-06-20

    Applicant: 安徽大学

    Abstract: 本发明提供文档层次结构联合全局局部信息抽取关键短语方法及系统,方法包括:分词和磁性标注,NP分块;判断文档长度,根据文档长度使用BERT模型进行文档和单词的嵌入;全局相似性度量,本发明创新性地使用文档标题和结尾来对候选关键短语进行全局相似度评估,解决因为向量空间对齐造成的对较长候选短语的偏爱;局部相似度评估,采用全新的主题中心度,对全文的候选关键短语进行主题划分和聚类,充分捕获到局部显著信息;结合位置信息、全局相似度、局部相似度对候选短语进行综合评估并打分,然后根据得分进行排名;进行后处理操作,以选择关键短语。本发明解决了语义丢失、偏爱长短语、主体信息挖掘不充分导致关键短语抽取准确率低的技术问题。

    融合用户情感倾向的社交网络评论文本情感分析方法及系统

    公开(公告)号:CN114443844A

    公开(公告)日:2022-05-06

    申请号:CN202210054262.0

    申请日:2022-01-18

    Applicant: 安徽大学

    Abstract: 本发明提供了一种融合用户情感倾向的社交网络评论文本情感分析方法和系统,通过用户的历史评论的情感极性分布以及社交关系计算用户的情感倾向分值;以用户的情感倾向分值作为用户的属性信息,用户与用户之间的社交关系为边信息构建用户社交关系网络;提取用户情感倾向特征表示;提取评论文本的特征表示;通过联合策略融合评论文本特征和评论对应的用户情感倾向特征得到评论联合特征表示,构建逻辑回归模型对社交网络评论文本的情感极性进行预测分析。本发明结合了用户心理干预因素,在技术上把用户情感倾向特征和文本特征相融合得到特征增强的联合特征用于社交网络文本情感分析,相比传统的仅基于文本特征的情感分析方法有更高的精确度。

    一种Logisim电路图的查重方法及系统

    公开(公告)号:CN113836863A

    公开(公告)日:2021-12-24

    申请号:CN202111157834.X

    申请日:2021-09-30

    Applicant: 安徽大学

    Abstract: 一种Logisim电路图的查重方法及系统,属于数据处理技术领域,解决如何有效地捕捉到Logisim电路图的关键信息,减少拖拽电路图的部分元件或部分最大连通子图对查重的干扰的问题,包括以下步骤:将Logisim电路图视作以元件为节点、以导线为边的无向图,然后将无向图划分为若干最大连通子图,得到最大连通子图集合,从而创建最大连通子图集合数据集;通过计算最大连通子图的相似度,从而计算最大连通子图集合的重复率;根据计算的重复率采用阈值过滤或聚类的方法从Logisim电路图数据集找到重复的Logisim电路图;本发明的技术方案将Logisim电路图表示为最大连通子图集合,有效地捕捉到Logisim电路图的关键信息,减少多种作弊手段对查重的干扰,从而提高查重的效果。

    一种提取论文标题中的问题方法对的方法

    公开(公告)号:CN108460021B

    公开(公告)日:2021-10-12

    申请号:CN201810219012.1

    申请日:2018-03-16

    Applicant: 安徽大学

    Abstract: 本发明公开了一种提取论文标题中的问题方法对的方法,包括:对论文标题进行标准化处理,在论文标题中进行论文关键词匹配`,得到初步问题方法概念集合;利用黑名单、白名单对初步问题方法概念集合进行调整,得到有效问题方法概念集合;构建用于分隔问题和方法的目标语法模式集合;根据目标语法模式集合和有效问题方法概念集合从论文标题中提取出问题概念集合和方法概念集合;利用笛卡尔积搭配问题概念集合和方法概念集合,得到论文标题中的问题方法对。

    基于网络表示学习和社团结构的矩阵分解推荐方法及系统

    公开(公告)号:CN111814059A

    公开(公告)日:2020-10-23

    申请号:CN202010856899.2

    申请日:2020-08-24

    Applicant: 安徽大学

    Abstract: 本发明公开了基于网络表示学习和社团结构的矩阵分解推荐方法及系统,所述方法包括:构建评级矩阵和社交抽象网络;获取用户之间隐性信任值;获取每个用户节点的全局特征向量;获取社交抽象网络的社团结构;获取用户之间的显性信任值;融合隐性信任值与显性信任值得到融合信任值,融合信任值超过阈值的信任值作为用户之间的细粒度信任值;结合用户之间的细粒度信任值得到用户的潜在特征向量,根据用户的潜在特征向量获取用户对未交互商品的预测评分,对用户进行商品推荐;本发明的优点在于:挖掘可以表达用户之间信任程度的细粒度信任值并据此最终获取用户对未交互商品的预测评分,提高推荐系统的准确性。

    基于随机游走边界域处理的三支决策社团划分方法及装置

    公开(公告)号:CN109242713A

    公开(公告)日:2019-01-18

    申请号:CN201811045237.6

    申请日:2018-09-07

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于随机游走边界域处理的三支决策社团划分方法,方法包括:1)、获取抽象网络;2)、对抽象网络初始粒化后进行聚类粒化,将抽象网络划分成多个划分后社团,并将划分后社团的结构关系作为第一划分结果;3)、获取重叠社团模块度最大值对应的抽象网络的第一划分结果;4)、利用随机游走算法对边界域中的所有节点进行划分;5)、针对更新后的边界域中的每一个节点,使用三支决策法进行处理,获得第二划分结果,并将第二划分结果作为目标划分结果。本发明公开了一种基于随机游走边界域处理的三支决策社团划分装置。应用本发明,可以提高社团划分的精度,从而有助于分析和了解网络结构,便于对网络进行优化和管理。

    一种基于神经机器翻译技术的局部引文推荐方法及系统

    公开(公告)号:CN109145190A

    公开(公告)日:2019-01-04

    申请号:CN201810994562.0

    申请日:2018-08-27

    Applicant: 安徽大学

    CPC classification number: G06F17/289 G06F17/2715

    Abstract: 本发明公开基于神经机器翻译技术的局部引文推荐方法及系统,对原始数据集进行引文提取、词形还原、词频统计数据清洗操作,得到引文上下文与被引文章标题的平行语料并构建初始待被引文章列表库;通过词向量模型中的跳字模型结合负采样的方法将引文上下文与被引文章标题中出现的词嵌入到低维语义空间得到词向量,构建一个带有注意力机制的双向门控循环单元的编码器和门控循环单元的解码器框架,将平行语料中的引文上下文通过词向量模型转换为词向量后作为模型的输入,被引文章标题作为输出来训练模型;将编码器‑解码器框架输出的种子标题与待被引文章列表中的所有文章标题逐条进行余弦相似度计算;依据文章年份,选取符合要求的文章作为推荐列表。

    一种计算机组成与系统结构的虚拟实验平台及其实现方法

    公开(公告)号:CN105930584A

    公开(公告)日:2016-09-07

    申请号:CN201610249082.2

    申请日:2016-04-19

    Applicant: 安徽大学

    CPC classification number: G06F17/5009

    Abstract: 本发明公开了本发明提出的一种计算机组成与系统结构的虚拟实验平台,包括:仿真芯片工具箱模块、功能部件设计管理模块、仿真功能部件器件库模块、整机设计管理模块和仿真模型机任务管理模块;仿真芯片工具箱模块用于实现对芯片的设计,其中芯片管理模块可创建、可修改、可添加芯片工具箱配置文件;芯片存储模块可根据芯片工具箱配置文件生成芯片并存储到芯片器件库中。功能部件设计管理模块中包含的生成功能部件设计管理模块可从芯片器件库中调用m个芯片,并根据计算机组成与体系结构把芯片拼接生成功能部件设计配置文件;仿真功能部件器件库模块用于存储通过加载功能部件设计配置文件生成的仿真功能部件。本发明从最小的功能单元芯片着手,实现了虚拟仿真实验平台的逻辑器件库及系统的仿真引擎构建。

Patent Agency Ranking