-
公开(公告)号:CN117033941A
公开(公告)日:2023-11-10
申请号:CN202311056107.3
申请日:2023-08-22
Applicant: 哈尔滨工程大学 , 哈尔滨工程大学三亚南海创新发展基地 , 价值链技术(深圳)有限公司
Inventor: 王巍 , 韩子屹 , 蔡成涛 , 陆蓓婷 , 蒋文创 , 杨玉东 , 曲晓威 , 杨东梅 , 张海涛 , 王小芳 , 张万松 , 张越 , 庄园 , 苘大鹏 , 李伟 , 玄世昌 , 郭方方
Abstract: 本发明公开一种基于HMM和降噪自编码器的中文对抗样本恢复方法,涉及对抗文本处理技术领域,包括,获取对抗文本,对对抗文本进行符号清洗;基于隐马尔可夫模型将所述对抗文本中的拼音串转换为汉字序列,并将汉字序列拼接为汉字串;通过降噪自编码器对所述对抗文本中的汉字字符及汉字串进行噪声去除,得到候选词序列;通过置信度‑相似度解码器对所述候选词序列进行解码,得到修正文本;通过双向机器翻译对所述修正文本进行处理,生成恢复汉字文本。本发明能够实现中文对抗样本的高效恢复。
-
公开(公告)号:CN114547303B
公开(公告)日:2024-10-29
申请号:CN202210165299.0
申请日:2022-02-18
Applicant: 哈尔滨工程大学
IPC: G06F16/35 , G06N3/0442 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于Bert‑LSTM的文本多特征分类方法及装置,属于文本分类技术领域,其中,该方法包括:确定待分类文本数据集,并划分为训练集和测试集;构建基于Bert‑LSTM的文本多特征分类模型;利用训练集对文本多特征分类模型进行训练,得到最优文本多特征分类模型;将待分类文本数据输入最优文本多特征分类模型中,计算待分类文本数据的得分,根据得分将其划分到预设对应类别中。该方法使用BERT以及双向长短期记忆网络等构建基于Bert‑LSTM的文本多特征分类模型,利用挖掘文本多方面的词特征信息和词义潜在语义表示特征信息,融入文本向量,模型在训练过程中充分利用多特征信息,提升了文本分类的性能。
-
公开(公告)号:CN114529081B
公开(公告)日:2024-06-11
申请号:CN202210150863.1
申请日:2022-02-18
Applicant: 哈尔滨工程大学
IPC: G06Q10/04 , G06Q10/067 , G06Q50/26
Abstract: 本发明公开了一种时空联合的交通流量预测方法及装置,属于交通流量预测技术领域,其中,该方法包括:获取各个监测点的监测数据,将数据按照时间周期性规律进行分类并建立数据集,根据数据集构建监测站点无向图,同时将数据集划分训练集、测试集和验证集;基于监测站点无向图,构建时空联合的交通流量预测模型;利用训练集对时空联合的交通流量预测模型进行训练,得到最优时空联合的交通流量预测模型;将验证集输入到最优时空联合的交通流量预测模型中,计算未来交通流量预测值。该方法通过对时空注意力进行解耦,将数据进行更加细粒性的特征划分,充分考虑到每个监测点和每个时刻的特征,更高效的提取数据中的空间相关性和时间。
-
公开(公告)号:CN110991156B
公开(公告)日:2023-05-23
申请号:CN201911142359.1
申请日:2019-11-20
Applicant: 哈尔滨工程大学
IPC: G06F40/186 , G06F8/30
Abstract: 本发明是一种基于船舶数值虚拟试验的报告自动生成方法。本发明本发明主要包括:框架设计、数据处理、后处理、数据替换和框架集成。本发明提出的基于船舶数值虚拟试验的报告自动生成方法,可以将在网页进行虚拟试验时所生成的json文件或相关的数据文件通过智能抽取,自动将其转换成对应的图像、表格、文本,并生成试验报告。这种试验报告自动生成的方法不但可以准确的表达数据之间的关系,还可以展现出各种试验结果。使试验结果具有更好的通用性和一致性,并且提高了生成试验报告的效率。
-
公开(公告)号:CN114529077A
公开(公告)日:2022-05-24
申请号:CN202210137611.5
申请日:2022-02-15
Applicant: 哈尔滨工程大学
Abstract: 本发明提出了一种基于会话内异构行为的点击率预测方法,获得用户信息数据集、项目信息数据集和用户行为序列数据集,分别对三种数据集进行预处理,并分为训练集和测试集;构建基于会话内异构行为的点击率预测模型;训练构建的基于会话内异构行为的点击率预测模型;将待推荐用户的个人信息、待推荐项目信息和待推荐用户行为序列输入到训练后的基于会话内异构行为的点击率预测模型,计算用户对目标项目的点击率,根据点击率将项目进行排序,并将排序后的项目列表推荐给用户;本发明同时考虑了用户与项目之间的多种异构行为对用户兴趣的影响,利用注意力机制计算不同类型的行为对兴趣的影响权重,更加精准地提取用户的兴趣。
-
公开(公告)号:CN110909057A
公开(公告)日:2020-03-24
申请号:CN201911154837.0
申请日:2019-11-22
Applicant: 哈尔滨工程大学
Abstract: 本发明公开了一种数值水池虚拟试验数据中间件的设计方法。数值水池虚拟试验应用系统(200)通过API模块(112)和通信模块(113)与主中间件(120)的通信模块(122)双向传输信号,通信模块(122)通过任务处理模块(124)与数值水池虚拟试验底层分布式NoSQL数据库(300)双向传输信号。由于数值水池虚拟试验的数据包括数值型数据、字符串、数组和图像等各种异构数据,而且属于大规模数据,用户对数据的安全和并发任务处理要求比较高;因此需要在底层配置分布式NoSQL数据库集群模式,满足对多用户、多任务的高并发需求。
-
公开(公告)号:CN110659513A
公开(公告)日:2020-01-07
申请号:CN201910933708.5
申请日:2019-09-29
Applicant: 哈尔滨工程大学
IPC: G06F21/62
Abstract: 本发明公开了一种面向多敏感属性数据发布的匿名隐私保护方法。步骤1:计算原始数据表中各属性间的相关性,定义属性类别;步骤2:根据属性间的相关性,将所有属性进行分组;步骤3:将每个分组按照属性间相关性大小,由高到低排序;步骤4:计算每组内,敏感属性值出现频率,判断属性值是否需要保护;步骤5:将需要保护的敏感属性值及其关联属性与无需保护的敏感属性值进行交换;步骤6:对相关属性进行频繁项集挖掘;步骤7:使用聚类技术生成匿名等价组,匿名等价组内每个敏感属性满足L多样性。本发明通过降低匿名率,关联属性共同置换,在保证隐私保护强度的同时,提高数据的可用性。
-
公开(公告)号:CN110598953A
公开(公告)日:2019-12-20
申请号:CN201910900378.X
申请日:2019-09-23
Applicant: 哈尔滨工程大学
IPC: G06Q10/04 , G06N3/04 , G06N3/08 , G06F16/951
Abstract: 本发明是一种时空相关的空气质量预测方法。本发明将城市划分成大小相同的网格,每个网格受相邻区域网格影响,按照网格内是否有空气监测站分为预测区域和估计区域;获取影响空气质量数据相关时序数据,对时序数据采用循环神经网络和空间深度学习进行特征提取,进行时序模型训练。获取影响空气质量数据相关非时序数据,对非时序数据采用卷积神经网络进行特征提取,进行空间模型训练;将时序模型训练和空间训练模型进行协同训练,得到预测模型;利用训练好的协同训练模型进行预测区域的训练,得到预测区域空气质量数据;利用训练好的协同训练模型进行估计网格区域的训练,得到估计区域空气质量数据。
-
公开(公告)号:CN114529077B
公开(公告)日:2024-10-29
申请号:CN202210137611.5
申请日:2022-02-15
Applicant: 哈尔滨工程大学
IPC: G06Q10/04 , G06Q30/0202 , G06Q30/0241 , G06N3/0442 , G06N3/08 , G06N3/0455
Abstract: 本发明提出了一种基于会话内异构行为的点击率预测方法,获得用户信息数据集、项目信息数据集和用户行为序列数据集,分别对三种数据集进行预处理,并分为训练集和测试集;构建基于会话内异构行为的点击率预测模型;训练构建的基于会话内异构行为的点击率预测模型;将待推荐用户的个人信息、待推荐项目信息和待推荐用户行为序列输入到训练后的基于会话内异构行为的点击率预测模型,计算用户对目标项目的点击率,根据点击率将项目进行排序,并将排序后的项目列表推荐给用户;本发明同时考虑了用户与项目之间的多种异构行为对用户兴趣的影响,利用注意力机制计算不同类型的行为对兴趣的影响权重,更加精准地提取用户的兴趣。
-
公开(公告)号:CN114492978B
公开(公告)日:2024-10-29
申请号:CN202210067402.8
申请日:2022-01-20
Applicant: 哈尔滨工程大学
IPC: G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/08 , G06N3/049 , G06F18/25 , G06F18/213 , G06F123/02
Abstract: 本发明提出了一种基于多层注意力机制的时空序列预测方法及设备,本发明基于注意力机制,根据跨领域数据的交叉影响,逐时间步融合多维特征构建历史数据特征,在不引入噪声的前提下,充分利用邻域数据丰富目标区域的特征信息,捕获不同区域时空序列的空间依赖关系。采用LSTM编码器分别捕获时间序列的长期、中期发展模式及短期突变信息,逐步利用注意力机制动态捕获多重时序关系对未来的影响,逐时间步计算相应历史信息的影响权重,最终使用LSTM解码器充分融合多跨度的历史数据,对时空序列进行预测。本发明可以在不引入噪声的前提下,充分利用邻域数据丰富目标区域的特征信息,捕获不同区域时空序列的空间依赖关系。
-
-
-
-
-
-
-
-
-