-
公开(公告)号:CN117076517A
公开(公告)日:2023-11-17
申请号:CN202310670806.0
申请日:2023-06-07
Applicant: 河海大学
IPC: G06F16/2458 , G06F16/22
Abstract: 本发明公开了一种基于子序列扩展的时间序列变长模体挖掘方法,步骤为:(1)对时间序列按照窗口长度和步长提取子序列;(2)对提取出的子序列经过SAX符号表示将子序列变成符号序列;(3)合并相邻的且符号表示相同的子序列,构成符号子序列链;(4)将符号子序列链中符号表示相同的子序列归到一个集合中,以符号为键,子序列集合为值,构建初始符号字典;(5)对符号字典中的键值对进行扩展,不断将其与后继节点进行合并,形成新的符号字典;(6)从扩展出的最后一个非空符号字典中提取用户感兴趣的模体。本发明通过序列扩展的方式,降低长模体匹配的难度,有助于发现较长的模体,同时可以提高所发现模体的准确度。
-
公开(公告)号:CN110362606B
公开(公告)日:2022-11-08
申请号:CN201910496208.X
申请日:2019-06-10
Applicant: 河海大学
IPC: G06F16/2458
Abstract: 本发明公开了一种时间序列变长模体挖掘方法,步骤为:1.模体提取:本发明使用基于Matrix Profile的模体挖掘算法STOMP作为子程序,并引入结合增量距离的下界距离计算加速策略,加速找到所有可能长度的模体。2.模体分组:加入模体重叠和长度相似性条件进行模体分组。3.模体分组等价类划分:加入模体分组重叠条件对模体分组进行等价类划分。4.变长模体提取:提取每个分组等价类中的模体代表,模体代表集合即为变长模体。本发明能够剔除过短、过长和存在平凡匹配的模体,提取时间序列中变长模体,在准确率、效率和可扩展性方面有了提升。
-
公开(公告)号:CN114004154A
公开(公告)日:2022-02-01
申请号:CN202111281357.8
申请日:2021-11-01
Applicant: 河海大学
Abstract: 本发明公开了一种基于多分区模型集成的侵彻深度预测方法,划分对工程算法进行评价的评价区间;选择若干较优的工程算法;采用选取的工程算法进行批量样本计算,得到工程计算仿真数据;在每个评价区间,采用试验数据和工程计算仿真数据,建立基于随机森林和BP神经网络的无量纲侵彻深度预测模型;采用K邻近分区模型融合输出进行加权集成,构成融合模型;输入特征经过多个预测模型产生分区预测结果,最后经过融合模型产生无量纲侵彻深度预测输出。本发明本发明保证数据的准确性,同时避免了实验数据缺少对深度学习模型的影响;分区间建立模型,缩小建模范围,保证模型能够体现局部区域的物理特征和规律,产生较小的预测误差,得到准确度更高的预测模型。
-
公开(公告)号:CN113836269A
公开(公告)日:2021-12-24
申请号:CN202111133607.3
申请日:2021-09-27
Applicant: 河海大学
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于问答系统的篇章级核心事件抽取方法,包括如下步骤:使用现有的BiLSTM‑CRF模型对文章进行事件检测,设计问题模板构建问答系统的先验问题;跨句子构造待抽取文本,将触发词来源的事件句子和文档中的其余句子结合,以产生多个待抽取文本;构造问题,将问题与文本组合起来,从文本中找出问题的答案;基于BERT预训练模型和双向LSTM模型的问答系统对文档内事件元素进行提取;对事件进行共指融合,使用TextRank算法对同个文档内多个事件的重要性进行排序,从多个事件中选取核心事件。本发明通过基于问答系统的篇章级事件抽取方法可以提取出分布在不同句子中的事件元素,可以从多事件、无标题的文本中提取出核心事件,提高了核心事件抽取的效果。
-
公开(公告)号:CN113722374A
公开(公告)日:2021-11-30
申请号:CN202110870995.7
申请日:2021-07-30
Applicant: 河海大学
IPC: G06F16/2458
Abstract: 本申请涉及一种基于后缀树的时间序列变长模体挖掘方法。该方法包括:通过基于斜率进行模式表示,设定变化率阈值,提取所有的边缘点,获得边缘点集合;利用所述边缘点集合的边缘点构建后缀树,利用所述后缀树统计边缘点子序列频率,频率最大的边缘点子序列即为频繁模式;将所述频繁模式映射回原时间序列,记录变长模体位置;根据所述变长模体位置,计算变长模体之间的Matrix Profile值,所述Matrix Profile值最小的即为有效模体,加入有效模体的提取,解决了符号化隐藏极值点信息而引发的模体发现精度低的问题,提高了时间序列变长模体挖掘精度。
-
公开(公告)号:CN109272146B
公开(公告)日:2021-10-19
申请号:CN201810965624.5
申请日:2018-08-23
Applicant: 河海大学
Abstract: 本发明公开了一种基于深度学习模型和BP神经网络校正的洪水预测方法,步骤为:1、对历史洪水过程数据进行归一化处理;2、对归一化后的历史洪水过程数据分析得到各监测点对出口流量的影响时间;3、利用滑动窗口从历史场次洪水数据中建立预测模型的输入和输出值,建立模型训练数据集TRSet1;4、利用TRSet1训练并建立深度学习的洪水预测模型CNNFM;5、建立实时误差校正模型训练数据集TRSet2;6、利用TRSet2训练并建立基于BP神经网络的误差校正模型BPCM;7、对实时监测的流量和雨量,利用模型CNNFM对实时数据进行预测,利用实时误差校正模型BPCM进行校正,获得最终的预测值。本发明通过深度学习自动提取数据特征的特点对训练数据进行建模,并通过BP神经网络进行实时校正,以提高模型预测的准确率。
-
公开(公告)号:CN109143408B
公开(公告)日:2020-12-11
申请号:CN201810902495.5
申请日:2018-08-09
Applicant: 河海大学
IPC: G01W1/10
Abstract: 本发明公开了一种基于MLP的动态区域联合短时降水预报方法,该方法包括如下步骤:数据预处理,主要包括离差标准化和PCA;MLP的结构选择和参数训练,通过贪心算法确定MLP的广度和宽度,再调整MLP的权重和偏置;范围参数确定和模型优化,不同的感知范围意味着不同的MLP个数,通过动态改变范围来优化模型,MLP的个数在预报过程中是动态变化的。本发明第一个步骤是数据预处理,目的是对物理因子标准化,提取这些因子中的有用信息,节省软硬件资源。第二个步骤在两个地区之间建立MLP,并选择最优MLP。第三个步骤确定模型中使用的MLP的个数,并通过动态调整MLP个数来优化模型。
-
公开(公告)号:CN110362740A
公开(公告)日:2019-10-22
申请号:CN201910496474.2
申请日:2019-06-10
Applicant: 河海大学
IPC: G06F16/9535 , G06F16/35 , G06Q50/06
Abstract: 本发明公开了一种水利门户信息混合推荐方法,步骤为:事先定义水利门户信息分类体系,然后利用网络爬虫从各大水利门户网站爬取水利门户信息,并按照水利门户信息分类进行手工标注,建立水利门户信息分类器,对推荐数据集中的大量水利门户信息进行自动分类;利用推荐数据集以及用户行为数据分别构建基于时空敏感的热点信息推荐模型、基于信息内容的推荐模型以及基于用户和信息类别的协同过滤推荐模型三种推荐模型,将三种模型按照一定比例线性混合为老用户推荐信息,用基于时空敏感的热点信息推荐模型为新用户推荐信息。本发明提高水利信息推荐的准确性和专业性,实现推荐技术在水利门户网站上的创新应用。
-
公开(公告)号:CN110362606A
公开(公告)日:2019-10-22
申请号:CN201910496208.X
申请日:2019-06-10
Applicant: 河海大学
IPC: G06F16/2458
Abstract: 本发明公开了一种时间序列变长模体挖掘方法,步骤为:1.模体提取:本发明使用基于Matrix Profile的模体挖掘算法STOMP作为子程序,并引入结合增量距离的下界距离计算加速策略,加速找到所有可能长度的模体。2.模体分组:加入模体重叠和长度相似性条件进行模体分组。3.模体分组等价类划分:加入模体分组重叠条件对模体分组进行等价类划分。4.变长模体提取:提取每个分组等价类中的模体代表,模体代表集合即为变长模体。本发明能够剔除过短、过长和存在平凡匹配的模体,提取时间序列中变长模体,在准确率、效率和可扩展性方面有了提升。
-
公开(公告)号:CN109257217A
公开(公告)日:2019-01-22
申请号:CN201811091441.1
申请日:2018-09-19
Applicant: 河海大学
Abstract: 本发明公开了一种移动边缘环境下基于隐私保护的Web服务QoS预测方法收集用户信息和Web服务的QoS属性数据,对其进行数据预处理后得到符合边缘环境特性的数据集,并结合差分隐私实现边缘环境下保护隐私的QoS预测方法。在进行数据预处理时,根据用户的纬度和经度将其分为位于同一边缘服务器中、同一边缘区域和不同边缘区域内;对划分后的边缘服务器中的服务进行处理,删除无属性值和位于同一边缘端属性值却相差很大的服务,得到近似边缘环境下的服务集;在预测过程中,为保护用户隐私,对原始数据集加入拉普拉斯噪声,得到伪装后的数据集,并将其作为历史数据进行预测。
-
-
-
-
-
-
-
-
-