一种面向农业气象领域的知识图谱构建方法

    公开(公告)号:CN116010531A

    公开(公告)日:2023-04-25

    申请号:CN202211663797.4

    申请日:2022-12-23

    Abstract: 本发明公开了一种面向农业气象领域的知识图谱构建方法。该构建方法采用自顶向下的方式,包括步骤如下:对农业气象数据预处理,然后是基于专家经验的核心农业气象知识构建知识图谱的本体层;其次是信息抽取,包括根据不同模式层的类型对实体、关系、属性以及事件的抽取;之后是农业气象知识融合,对该些问题进行完实体对齐、模式匹配等操作后存入知识库,为之后的下游应用任务作辅助;然后是知识体系构建,对融合后的知识进行体系构建;接着是知识验证,对后加入验证步骤,即在原知识图上加入新外源知识后,验查与原图中的一致性;最后是知识推理,对知识图谱进行补全。最终解决了知识图谱与农业气象背景结合不紧密的问题。

    一种基于知识驱动的多路筛选融合对话生成方法

    公开(公告)号:CN115422329A

    公开(公告)日:2022-12-02

    申请号:CN202210429373.5

    申请日:2022-04-22

    Inventor: 马廷淮 张峥

    Abstract: 本发明公开了一种知识驱动的多路筛选融合对话生成方法,包括:对当前对话的上下文进行预处理,由双向GRU组成的话语编码器中对上下文信息进行编码,获取相应的语义向量;基于多路知识筛选机制,通过计算语义向量信息与知识集合中每条知识的相似度,选择与当前对话最相关的知识信息,融合得到筛选后的知识信息;采用知识融合模块将知识信息与上下文的语义信息融合,借助注意力机制计算得到中间语义向量;将中间语义向量和知识信息一同送入解码器中进行响应的生成。本发明能充分利用上下文的语义信息,筛选与之高度相关的背景知识信息,将所筛选的知识信息融入对话生成的过程,提高了对话生成的质量。

    一种基于多阶段迁移学习策略综合的众包文本集成方法

    公开(公告)号:CN114662659A

    公开(公告)日:2022-06-24

    申请号:CN202210237867.3

    申请日:2022-03-11

    Inventor: 荣欢 于信 马廷淮

    Abstract: 本发明提供一种基于多阶段迁移学习策略综合的众包文本集成方法,具体为1、构建迁移式生成型众包文本集成模型TTGCIF;2、获得源域文本数据集和目标域文本数据集的语义原型;3、对语义原型进行词嵌入处理;4、根据最大均值差异做数据分布对齐;5、对TTGCIF进行语义原型转导模型训练;6、将源域文本数据集处理为训练任务集;7、将训练任务集输入到TTGCIF中进行领域快速适应模型训练;8、将部分目标域文本数据集输入到TTGCIF中进行模型微调训练。通过以上过程,实现文本集成。本发明能够摒弃传统方法中对数据标签的需求,减少人力物力的浪费,对数据稀缺场景下进行众包文本集成的有着极大的促进作用。

    一种基于子结构组装网络的图分类方法和系统

    公开(公告)号:CN109784423A

    公开(公告)日:2019-05-21

    申请号:CN201910104483.2

    申请日:2019-02-01

    Inventor: 马廷淮 王红妹

    Abstract: 本发明公开了一种基于子结构组装网络的图分类方法和系统,所述子结构组装网络包括:子结构组装单元层、池化层和全连接层;子结构组装单元层将任意大小的图结构作为输入,在每个节点上对与其相连的边通过概率方法做渐进边选择,从而组成以每个节点为中心的判别局部子结构,多个子结构组装单元层级联最终组装成较大的判别性子结构;将最后一个子结构组装单元层得到的以每个节点为中心节点的各种子结构通过池化层聚合成固定长度的特征向量以便于后续的分类;全连接层对池化层的输出进行预测得到类标签。本发明充分结合了模式搜索和深度学习提取判别性子结构,能有效减少分类误差。

    一种基于网络结构优化的节点属性划分朋友圈的方法

    公开(公告)号:CN104391887B

    公开(公告)日:2018-01-12

    申请号:CN201410629873.9

    申请日:2014-11-10

    Abstract: 本发明公开了一种基于网络结构优化的节点属性划分朋友圈的方法,包括:建立特征向量步骤;计算朋友之间的曼哈顿距离步骤;选定核心朋友步骤;划分社团步骤;社团优化调整步骤。本发明先使用节点属性进行初步的社团划分,然后利用网络结构信息对于划分结果进一步优化调整,充分利用在线社交网络中可以获取到的信息,能够获得更加准确的社团划分结果,从而实现对用户的朋友圈自动分组,能够有效完善社交网络平台功能,适用于社交网络平台功能的应用和优化。

    一种基于海量气象数据的存储与检索方法

    公开(公告)号:CN104376053B

    公开(公告)日:2017-12-22

    申请号:CN201410611227.X

    申请日:2014-11-04

    Abstract: 本发明针对传统的数据集中存储单点查询的问题,公开了一种基于海量气象数据的存储与检索方法,利用Hadoop平台,通过对分布式非关系型数据库Hbase建立二级索引,并且将数据通过转换、迁移导入到云平台,实现海量数据的可靠存储与快速检索。本发明包括如下步骤:数据过滤;在Hbase中定义对应的表格式;建立二级索引;分情况进行数据导入;分情况进行数据检索。本发明既能实现数据的实时查询,也避免以往存储和维护大量数据所产生的高昂成本,在保证敏感数据安全的前提下能够更经济高效地实时查询海量气象数据。

    一种基于术语频率和卡方统计的文本分类特征选择方法

    公开(公告)号:CN104346459B

    公开(公告)日:2017-10-27

    申请号:CN201410629761.3

    申请日:2014-11-10

    Abstract: 本发明提供一种基于术语频率和卡方统计的文本分类特征选择方法,包括如下步骤:对数据集预处理;把每一个数据对象转换为特征空间的向量;分别计算每个术语在每个文本分类中的最大术语频率和平均术语频率;根据平均术语频率计算术语在每个类中的分布差异度;将每个术语的最大术语频率和分布差异度与传统的卡方统计公式相结合,计算每个术语在每个类中的权重,并取最大值为术语权重;将每个术语权重降序排序,选出权重值最大的前N个术语作为特征。本发明通过对传统的卡方统计进行改进,使在某类出现频率较高的或类内分布均匀的特征项对类别区分的贡献度得到体现,并修正了传统卡方统计方法偏向于低频词的不足。

    一种基于特征图的非精确子图匹配方法

    公开(公告)号:CN106997377A

    公开(公告)日:2017-08-01

    申请号:CN201710128034.2

    申请日:2017-03-06

    CPC classification number: G06F16/903 G06F16/9024

    Abstract: 本发明公开了一种基于特征图的非精确子图匹配方法,根据点的标签找到查询图中的每个点的匹配候选集,然后对查询图及候选集中的每个点根据特征图建立索引。根据索引计算差异向量后得到查询图中的点与它的每个候选匹配结点之间的差异值,选取差异值最小的点对作为初始匹配映射,然后通过迭代得到最终的匹配映射。本发明在匹配时强化了结构信息对匹配结果的影响,大大提高了非精确匹配的精度,同时有效地减少子图匹配所需的时间,提高子图匹配的效率。

    一种基于图集重构与图核降维的图分类方法

    公开(公告)号:CN106991132A

    公开(公告)日:2017-07-28

    申请号:CN201710135123.X

    申请日:2017-03-08

    CPC classification number: G06F16/9024

    Abstract: 本发明提供公开了一种基于图集重构与图核降维的图分类方法,包括如下步骤:1)对用于训练的图数据集进行频繁子图挖掘,对找出的频繁子图,以其在正负两类中出现的频度差的大小作为判别性指标,进行判别性子图筛选;2)用筛选出的具有判别性的频繁子图重构原图集;3)对重构好的新图集,采用Weisfeiler‑Lehman最短路径核方法获得用于描述图集中每两个图之间相似性的核矩阵,并利用训练图的类标签信息,采用KFDA方法对高维核矩阵降维;4)基于极限学习机对投影到低维向量空间的图数据进行训练,构建出分类器;5)规范化需要进行分类的图数据,将其投影到训练得到的低维空间,并把投影后的数据输入到分类器中,得到分类结果。本发明可直接对无类标签的图数据进行分类,且分类的准确性较高。

Patent Agency Ranking