面向段落级文本的中英文语义相似度计算方法

    公开(公告)号:CN115828931B

    公开(公告)日:2023-05-02

    申请号:CN202310085688.7

    申请日:2023-02-09

    Applicant: 中南大学

    Abstract: 本发明公开了一种面向段落级文本的中英文语义相似度计算方法,其分别对中文段落和英文段落进行段落表征向量提取,从主题词、句子和段落三个层次对段落文本进行建模,并基于图注意力网络在各个层次内部和各个层次信息之间进行信息交互,然后融合主题词、句子和段落三个层次的信息得到段落表征向量,通过计算段落表征向量的距离得到中文段落和英文段落的语义相似度。该方法通过融合主题词、句子和段落三个层次的信息得到高质量的段落表征向量,能实现中英跨语言段落语义相似度的高精度计算。

    一种爬取文献数据的单反射性智能体和文献数据爬取方法

    公开(公告)号:CN115827948B

    公开(公告)日:2023-05-02

    申请号:CN202310086593.7

    申请日:2023-02-09

    Applicant: 中南大学

    Abstract: 本发明公开了一种爬取文献数据的单反射性智能体和文献数据爬取方法,所述单反射性智能体包括性能模块、环境模块、感知模块和执行器模块;所述性能模块用于构建性能目标函数;所述环境模块构建单反射性智能体的环境集合;所述感知模块监测系统时间以及期刊数量是否变化;所述执行器模块基于所述性能目标函数设定目标,并自动化爬取文献数据。优点是,本发明通过构建用于爬取文献数据的单反射性智能体实现文献数据爬取,所述单反射性智能体通过构建衡量自动化爬取文献数据的性能目标函数,执行器模块基于所述目标性能函数设定目标,实现全面准确的文献数据爬取。

    基于开源软件包依赖特征的标签推荐方法、装置及系统

    公开(公告)号:CN110795134B

    公开(公告)日:2021-10-15

    申请号:CN201911045711.X

    申请日:2019-10-30

    Abstract: 本发明公开了一种基于开源软件包依赖特征的标签推荐方法、装置及系统,该方法包括:从软件的README描述文本中提取长度固定的主题分布特征向量;提取软件依赖包的标签信息,并输出为长度固定的标签独热向量;利用神经网络对特征的整合能力,将主题分布特征向量和标签独热向量拼接组合成开源软件的特征向量,将开源软件的特征向量作为输入特征,建立基于神经网络的标签预测模型,输出预测的软件标签分布分数;根据软件标签及其对应的软件标签分布分数,通过机器学习方法,按照软件标签分布分数的数值大小将软件标签降序排列后,对开源软件的标签进行推荐或对开源软件自动加标签。本发明引入包依赖信息,构建开源软件特征提取模型,利用神经网络预测标签,性能表现良好。

    动态图卷积交通速度预测方法

    公开(公告)号:CN111696355A

    公开(公告)日:2020-09-22

    申请号:CN202010608161.4

    申请日:2020-06-29

    Applicant: 中南大学

    Abstract: 本发明提供了一种动态图卷积交通速度预测方法,包括:步骤1,将车辆GPS轨迹数据匹配到城市道路网络中,获取每条路段的交通速度时间序列;步骤2,将城市道路网络的路段视为图节点,将城市道路网络的交叉口视为图的连接边,构建路网图,获取路段间的邻接矩阵;步骤3,根据每条路段的交通速度时间序列,计算邻接路段间交通速度相似性,获得实时邻接路段相似矩阵;步骤4,将每条路段的交通速度时间序列和邻接路段相似矩阵输入图卷积网络中训练,获得未来路段交通速度预测结果。本发明可以实时的学习路段间的空间依赖性和时间依赖性,捕获交通速度的变化规律,更精准的预测未来城市道路的速度,可应用于智能交通、智慧城市建设。

    基于图卷积的建筑物模式识别方法

    公开(公告)号:CN111027574A

    公开(公告)日:2020-04-17

    申请号:CN201911251240.8

    申请日:2019-12-09

    Applicant: 中南大学

    Abstract: 本发明提供了一种基于图卷积的建筑物模式识别方法,包括:将建筑物数据划分为预设街区,在所述预设街区内利用德洛内三角网创建邻接关系;计算建筑物特征描述指标集合,得到建筑物特征描述指标值集合矩阵;分别对描述指标特征降维,获得建筑物特征值向量;标记建筑物模式标签,并采用半监督图卷积网络识别模式获得结果。本发明所提供的基于图卷积的建筑物模式识别方法仅需要较少的标注数据即可准确发现建筑物群组模式,有效改善了当前建筑物群组识别方法参数设置困难、识别结果不稳定、精度低的缺陷,可以推广应用于地图综合、空间数据更新、城市规划与景观设计等领域。

    基于深度图卷积网络的点云目标提取方法及装置

    公开(公告)号:CN110827302A

    公开(公告)日:2020-02-21

    申请号:CN201911114195.1

    申请日:2019-11-14

    Applicant: 中南大学

    Abstract: 本发明提供了一种基于深度图卷积网络的点云目标提取方法及装置,其中该方法包括:将城市场景点云数据划分为多个超点;获取所述多个超点中每个超点的局部特征;根据所述多个超点之间的拓扑连接关系,构建空间拓扑图;基于所述空间拓扑图,构建深度图卷积网络;根据所述深度图卷积网络和所述多个超点中每个超点的局部特征,得到每个超点内各点的标签。本发明能提高目标提取的效率和准确度。

    一种非结构化云数据管理系统的动态布局方法

    公开(公告)号:CN110166279A

    公开(公告)日:2019-08-23

    申请号:CN201910282178.2

    申请日:2019-04-09

    Applicant: 中南大学

    Abstract: 本发明涉及大数据管理领域,公开了一种非结构化云数据管理系统的动态布局方法,以降低非结构化数据管理系统中由于数据频繁移动导致的数据传输开销,本发明的方法包括确定客户端提交的任务所需的数据集,采用Master节点中的元数据管理器对数据集进行分区,得到第一数据分区集;建立第一数据分区集中每个数据分区的云模型,根据云模型将第一数据分区集中的所有数据分区划分为稳定数据分区组和不稳定数据分区组;采用数据布局算法将不稳定数据分区组中的各数据分区调入Slave存储节点。

    一种基于谓词关联的SPARQL查询优化方法及系统

    公开(公告)号:CN110032676A

    公开(公告)日:2019-07-19

    申请号:CN201910196896.8

    申请日:2019-03-15

    Applicant: 中南大学

    Abstract: 本发明涉及面向大数据关联的存储和查询技术领域,公开了一种基于谓词关联的SPARQL查询优化方法及系统,更快速且有效地实现分布式SPARQL查询,本发明的方法包括获取历史查询的SPARQL中的RDF三元组,使用谓词命名RDF三元组,得到原始RDF数据集;对RDF数据集进行划分得到VP表,根据VP表统计RDF数据中谓词连接的主词和宾词数量,定义谓词的四种连通特性,并根据连通特性强弱对谓词进行优先级排序;构建谓词之间的关联性,并根据该关联性将历史SPARQL查询图转化为树状谓词图,优化树状谓词图,根据优化后的树状谓词图生成相关表并将SPARQL转化成查询指令;采用查询指令查询待查表。

    有向无环图的可达性查询方法、系统及可读存储介质

    公开(公告)号:CN109241355A

    公开(公告)日:2019-01-18

    申请号:CN201810638160.7

    申请日:2018-06-20

    Applicant: 中南大学

    Abstract: 本发明涉及计算机处理技术领域,公开了一种有向无环图的可达性查询方法、系统及可读存储介质,以提高查询效率和可扩展性。本发明方法包括:将DAG图转换为最小森林和非森林边集;为最小森林的每一个节点分配一个间隔标签(X,Y);以及根据所述非森林边集得到每个节点所对应的被删入边源点的集合和相应的关键祖先节点;然后在查询任意两节点是否可达的过程中,先根据所述最小森林的间隔标签进行可达性分析,如果不可达,再根据所查询节点所对应被删入边源点的集合和/或关键祖先节点进行可达性分析。本发明可在大数据计算和处理平台下实现,如:Spark平台,用Scala语言实现,对比目前最优算法,能够将查询时间降低4到5个数量级。

    一种云模型数据布局方法和系统

    公开(公告)号:CN107609138A

    公开(公告)日:2018-01-19

    申请号:CN201710852493.5

    申请日:2017-09-19

    Applicant: 中南大学

    Abstract: 本发明涉及分布式计算领域,公开了一种云模型数据布局方法和系统,以减少跨数据中心传输所产生的时间开销和移动次数,提高任务执行效率,为用户提供更方便更快捷的服务;本发明首先选取第一批数据集和第二批数据集建立云滴组,然后基于云滴组确定虚拟数据代理并计算虚拟数据代理的特征,进而确定虚拟数据代理的云模型,然后计算云滴组中包括的数据集以外的其余数据集相对于每个虚拟数据代理的隶属度,将其根据最大隶属度划分到相应的虚拟数据代理中;最后将虚拟数据代理映射到对其包括的数据集请求次数之和最多的数据中心。

Patent Agency Ranking