-
公开(公告)号:CN116028528A
公开(公告)日:2023-04-28
申请号:CN202210324703.4
申请日:2022-03-29
Applicant: 郑州大学
IPC: G06F16/2453 , G06F16/26 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种数据库查询优化方法、系统、电子设备及存储介质,旨在解决现有的查询方法效率低、计算量大、精确度低的技术问题。本发明采用动态双DQN连接顺序优化方法(Dynamic Double DQN order select,DDOS),首先把连接查询建模为马尔科夫决策过程(MDP),使用加权的双深度Q网络训练神经网络模型,来提高训练网络的预测精度。通过动态渐进搜索策略来选择动作,提高探索的随机性和深度以积累更高信息增益的探索。再对每一个查询计划进行代价估计之后,选择出符合数据分布且查询负载均衡的连接计划。本发明的有益技术效果在于:能够有效提升查询性能,并具备良好的泛化能力和鲁棒性。
-
公开(公告)号:CN118133826A
公开(公告)日:2024-06-04
申请号:CN202410229590.9
申请日:2024-02-29
Applicant: 郑州大学 , 河南众诚信息科技股份有限公司
IPC: G06F40/295 , G06F40/289 , G06F40/253 , G06F18/25 , G06F18/24 , G06N3/0455
Abstract: 本发明公开了一种用于中文金融领域的基于异构图网络的嵌套NER方法、装置及其计算机可读存储介质,以解决现有的方法多针对英文通用领域,不适用于中文金融领域问题、嵌套实体内部结构表示问题和实体间依赖关系表示问题。本发明先通过候选实体边界划分模型划分出文本中所包含的实体,同时,对文本进行分词;然后通过过滤算法,将可能包含嵌套实体的候选实体及其中包含的候选跨度筛选出来;接着,通过候选跨度与候选实体之间的位置关系来构建候选实体内部结构关系异构图,并引入词性关系的异构图;最后,使用GNN‑FiLM学习候选实体的开始节点和结束节点之间迭代传播信息,完成内嵌套实体识别。
-
公开(公告)号:CN116776888A
公开(公告)日:2023-09-19
申请号:CN202211718873.7
申请日:2022-12-30
Applicant: 郑州大学
IPC: G06F40/30 , G06F40/289 , G06F40/205 , G06N3/08 , G06N3/0442
Abstract: 本发明公开了一种多任务的针对中文金融文本的ESG分类方法及模型,以解决现有的文本分类针对性差,精确性不足的技术问题。本发明先将文本按照字向量作为输入进行共同潜在学习表示,将共同潜在学习表示输出,先经过全连接层,然后输入到文本分类和情感词检测任务进行自注意力机制。同时文本分类任务中将文本按句号进行分割,生产句子向量,结合标签、上一轮情感词检测任务的特征向量,交入Transformer和线性层中,结合自注意力机制输出进行文本分类。情感词检测任务中利用自注意力机制的输出以及文本分类任务产生的特征向量进行情感词分类。两个任务联合训练以及以句子为分割,解决了中文金融文本较长以及情感极词难以分类等问题。
-
公开(公告)号:CN116775423A
公开(公告)日:2023-09-19
申请号:CN202211104811.7
申请日:2022-09-09
Applicant: 郑州大学
IPC: G06F11/34 , G06N3/0442 , G06N3/049 , G06N3/084
Abstract: 本发明公开了一种用于集群故障预测的方法,以解决现有故障预测中长时间序列预测精度低的技术问题。本发明包括:数据预处理,获取集群系统的系统日志作为原始数据,将该原始数据的多元特征映射到初始向量序列;将所述初始向量序列输入BiGRU模型,输出特征向量序列;将BiGRU模型输出的特征向量序列输入Transformer模型进行二次提取,输出状态序列;故障预测,将Transformer模型生成的状态序列输入到全连接神经网络,并转换为需要预测的时间长度的状态序列,最终得到预测结果。本发明的有益技术效果在于:提取特征全面,预测故障精确。
-
公开(公告)号:CN119578519A
公开(公告)日:2025-03-07
申请号:CN202411325532.2
申请日:2024-09-23
Applicant: 郑州大学
IPC: G06N5/022 , G06N3/0455 , G06N3/084 , G06N3/0985 , G06N3/048 , G06F16/35
Abstract: 本发明公开了一种基于元学习的少样本中文网络安全事件检测方法。该方法首先设计了动态维度变换机制,优化了多词复合触发词的几何特征提取;其次,通过多级知识蒸馏技术,结合类内特征与类间特征对比损失,提升了事件检测的精度和泛化能力;最后,采用了少样本学习中的元学习训练框架,在有限数据条件下进行高效学习。本发明通过结合元学习和知识蒸馏,有效解决了中文网络安全事件检测中触发词复杂、数据稀缺等难题,显著提升了少样本场景下的事件检测性能。
-
公开(公告)号:CN118734900A
公开(公告)日:2024-10-01
申请号:CN202410741534.3
申请日:2024-06-07
Applicant: 郑州大学
IPC: G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于扰动估计和去噪的对抗样本检测方法,以解决现有的领域检测方法泛用性不足,精度较低的问题。本发明先通过扰动强度估计自编码器,精确地评估对抗样本中的扰动程度,并据此添加适当的噪声。在去噪过程中结合估计扰动和已知噪声信息,以最大程度上消除噪声和对抗性扰动,从而有效地提升了对抗样本检测的效果。
-
公开(公告)号:CN118410802A
公开(公告)日:2024-07-30
申请号:CN202410493738.X
申请日:2024-04-23
Applicant: 郑州大学
IPC: G06F40/295 , G06F16/35 , G06N3/0442 , G06F40/30
Abstract: 本发明公开了一种混合提示学习与规则的领域命名实体识别方法,以解决现有的领域命名实体识别需要批注数据量大、分类精确性不足的技术问题。本发明先将利用少样本标注数据集获取到规则模式集合,然后通过快速匹配算法DAAC_BM,对句子中的具有相同前后缀的未标记实例标记类别。然后筛选本体中的规则,将其作为提示信息来标注句子中不能通过规则模式匹配而获取类别的实体。它将前一个组件提出的标注实体类别作为输入,将本体中所有包含了及其关系的三元组提取出来。接下来,将所有的规则与输入句子转化为谓词逻辑形式并进行对比,提取其中可信度最高的规则作为提示信息,与句子一同交给预训练模型进行NER。把模型分类出的结果返回给第二部分,通过自监督训练模型。混合提示学习与规则,解决了中文领域命名实体识别中缺乏批注数据集、提示学习中模板需要手工构造以及提示模板过长的问题。
-
公开(公告)号:CN115935998A
公开(公告)日:2023-04-07
申请号:CN202211679883.4
申请日:2022-12-26
Applicant: 郑州大学
IPC: G06F40/295 , G06N3/08 , G06N3/0455 , G06N3/0442
Abstract: 本发明针对中文金融领域中一些长度较长,难以划定边界和表达形式多样的命名实体,提出了一种多特征金融领域命名实体识别方法。首先,该方法将实体边界划分和实体分类作为两个独立任务,引入基于门控的多通道注意机制,在预训练语言模型的基础上划分金融实体边界,学习增强的汉字特征。然后,将边界划分结果以MASK的形式输入到预训练语言模型中,以进行数据增强。随后,引入了基于文档级实体的增强特征来构建金融实体分类模型。通过实验从几个最先进的模型中确定了表现最好的中文预训练语言模型,然后将其嵌入到本发明的方法中,并与其他基准模型进行比较。实验结果表明,所提模型在金融领域的命名实体识别任务上优于其他基准模型。
-
公开(公告)号:CN113695085B
公开(公告)日:2023-03-21
申请号:CN202110752069.X
申请日:2021-06-29
Applicant: 郑州大学
IPC: B03D1/018 , B03D1/02 , B03D101/02
Abstract: 本发明提供了一种磷石膏脱硅除碳组合捕收剂及其溶液制备方法、应用,属于磷石膏反浮选除杂技术领域,用以解决现有捕收剂捕收效果差、浮选泡沫量大、粘度大、流动性差以及制备原料成本高的技术问题。该组合捕收剂的制备原料包括主捕收剂、辅助捕收剂;其中,主捕收剂包括苄基季铵盐;辅助捕收剂包括非极性油和/或醇类。本发明的组合捕收剂溶液的制备方法包括:步骤1、将组合捕收剂的制备原料按配比要求混合,记为混合物A;步骤2、向混合物A中加入19~99倍体积的水,并进行搅拌、水浴或超声直至捕收剂原料完全溶解,配制得到质量浓度为1‑5%的组合捕收剂溶液。本发明的组合捕收剂配制简单,浮选泡沫稳定,选择性好,捕收能力强,能低温稳定储存。
-
公开(公告)号:CN114968737A
公开(公告)日:2022-08-30
申请号:CN202210322993.9
申请日:2022-03-29
Applicant: 郑州大学
Abstract: 本发明公开了一种数据库负载预测方法、系统、电子设备、计算机可读存储介质,以解决现有技术预测不准确,稳定性不足的技术问题。本发明增加数据库基准规范内部指标,解决因物理资源改变而导致的传统指标预测失效问题;然后建立多个孤立树整合为孤立森林,评估样本异常分数并筛出异常数据进行热卡填充;最后结合注意力机制与双向长短期记忆网络,计算隐层状态以及注意力权值,学习工作负载的形态、周期以及规律性。本发明的有益效果在于:检测精度高,稳定性好,适用性强。
-
-
-
-
-
-
-
-
-