-
公开(公告)号:CN115310430A
公开(公告)日:2022-11-08
申请号:CN202210974549.5
申请日:2022-08-15
Applicant: 哈尔滨工程大学
IPC: G06F40/226 , G06F40/242 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种结合五笔与拼音特征的中文拼写纠错方法,本发明为解决中文文本自动校对技术粒度过于细化,导致下游任务完成较困难,完成时间长的问题,先获取中文字及五笔全码;根据发音易混方式对每个中文字的拼音进行映射;将每个中文字的五笔全码和映射后的拼音进行合并作为每个中文字的标识;获取文本进行预处理,利用Bi‑GRU模型提取文本特征,结合每个标识得到中文字拼音与五笔全码融合的表达方式,并将所述表达方式作为发音与形状的嵌入;计算中文字的字符嵌入和位置嵌入;根据发音与形状的嵌入、字符嵌入和位置嵌入利用BERT‑WWM模型得到纠错目标。属于文本分析技术领域。
-
公开(公告)号:CN110134803A
公开(公告)日:2019-08-16
申请号:CN201910415146.5
申请日:2019-05-17
Applicant: 哈尔滨工程大学
IPC: G06F16/51 , G06F16/583
Abstract: 基于哈希学习的图像数据快速检索方法,涉及图像数据快速检索方法,属于数据检索技术领域。为了解决现有模型在哈希码生成阶段使用多次松弛会使模型在训练阶段负反馈过程出现偏差的问题。本发明的深度哈希模型包含五个卷积-池化层、两个全连接层、特征层、哈希层和输出层;并基于三元组约束进行训练,得到训练好的深度哈希模型后,利用深度哈希模型建立样本库,样本库由图像样本及对应的哈希码构成;针对查询图像,利用训练好的深度哈希模型生成查询图像的哈希码;利用查询图像的哈希码与图像样本库进行检索。本发明适用于图像数据检索。
-
公开(公告)号:CN112541547B
公开(公告)日:2022-09-02
申请号:CN202011466539.8
申请日:2020-12-14
Applicant: 哈尔滨工程大学
Abstract: 支持水下快速目标识别的加权融合权重确定方法,本发明涉及加权融合权重确定方法。本发明涉及加权融合权重确定方法。过程为:1:n个传感器收集声音数据,将每个传感器收集的声音数据均分成m段;2:计算传感器间的传感器支持度和传感器相似性;3:计算传感器内的局部稳定性和局部支持度;4:基于熵权法计算熵权系数;5:计算准则指标的累积贡献率;6:确定各个声音信号段的准则指标;7:确定各个声音信号段对应的权重;8:将原始声音信号数据分为加速和匀速;分别给加速和匀速各一个权重,将加速和匀速的权重分别乘上声音信号段对应的权重,作为二阶权重;9:确定水下快速目标的类别。本发明用于水下快速目标识别领域。
-
公开(公告)号:CN112488180A
公开(公告)日:2021-03-12
申请号:CN202011356846.0
申请日:2020-11-27
Applicant: 哈尔滨工程大学
Abstract: 基于RealifF的特征选择方法,涉及数据挖掘技术领域,针对传统的去冗余方法是将一组冗余特征保留一个,这样会造成损失信息的问题,本申请通过距离相关性系数找出冗余特征,解决冗余问题。传统的简单去冗余方法是将一组冗余特征保留一个,本申请通过自编码器融合这些冗余特征而不是直接丢掉,解决了损失信息的问题。自编码器是一种黑盒的结构,无法保证最后可以得到想要的特征,本申请通过多任务的方式,加上一路分类的任务,可以迫使自编码器学到这一组冗余信息中更利于分类的特征,提升自编码器学习到特征的质量。
-
公开(公告)号:CN111930946A
公开(公告)日:2020-11-13
申请号:CN202010832816.6
申请日:2020-08-18
Applicant: 哈尔滨工程大学
IPC: G06F16/35 , G06K9/62 , G06F40/205
Abstract: 一种基于相似性度量的专利分类方法,它属于文本分类技术领域。本发明解决了采用现有的专利分类方法对专利分类的准确率低的问题。本发明考虑专利说明书摘要的特征,将CHI统计量和余弦相似度相结合后,再结合IPC分类号的相似性,提出一种基于混合相似度的专利分类方法。针对权利要求书,提出一种基于权利要求书相似度的专利分类方法。根据抽取出来的SAO-x多维结构,计算权利要求书相似度,基于相似度结果采用KNN分类算法对专利进行分类。与现有的专利分类方法相比,本发明进行专利自动分类的准确率达到70%以上,降低了人工分类在主观层面上产生的分类误差。本发明可以应用于文本分类技术领域。
-
公开(公告)号:CN110147843A
公开(公告)日:2019-08-20
申请号:CN201910430437.1
申请日:2019-05-22
Applicant: 哈尔滨工程大学
IPC: G06K9/62
Abstract: 本发明提供基于度量学习的语音时序数据相似性度量方法,属于数据分类技术领域。本发明首先获取语音时序数据;结合马氏距离和斯皮尔曼线性相关性系数计算语音时序数据的局部距离,然后使用动态时间弯曲算法得到动态时间弯曲距离的表达式;再根据PGDM度量学习框架建立以马氏矩阵为参数的损失函数;求解损失函数计算出针对当前训练集样本的马氏矩阵;最后将步骤四中求得的马氏矩阵代入动态时间弯曲距离的表达式,得到每两个语音时序数据样本的相似性度量。本发明解决了现有语音时序数据相似性度量不准确的问题。本发明可用于语音时序数据的相似性度量。
-
公开(公告)号:CN114139984B
公开(公告)日:2024-08-20
申请号:CN202111470417.0
申请日:2021-12-03
Applicant: 哈尔滨工程大学
IPC: G06Q10/0635 , G08G1/01 , G06F18/2433 , G06N3/0464 , G06N3/042
Abstract: 一种基于流量与事故协同感知的城市交通事故风险预测方法,属于交通事故预警技术领域。本发明针对现有交通事故风险预测中没有深度结合交通流量信息,使用静态图邻接矩阵构建图神经网络预测效果不够好的问题。包括由节点时变特征输入模块获得节点时变特征矩阵;分别由事件动态图神经网络和异常流量动态图神经网络对节点时变特征矩阵进行特征提取,获得事故风险特征和流量风险特征;再由时间依赖模块进行时间依赖信息的捕捉,获得时空混合特征;由协同感知模块对时空混合特征和全局时变特征矩阵进行特征融合,获得事故风险预测值,结合事故风险替换值进行计算,获得损失函数用于模型训练。本发明用于交通事故风险预测。
-
公开(公告)号:CN111626343B
公开(公告)日:2022-05-03
申请号:CN202010403756.6
申请日:2020-05-13
Applicant: 哈尔滨工程大学
IPC: G06K9/62 , G06F40/295
Abstract: 一种基于PGM与PSO聚类的船舰数据关系抽取方法,涉及数据处理技术领域,针对现有技术中在构建面向知识图谱过程中关系抽取存在的船舰数据抽取准确率低以及效率低的问题,本发明用一个概率图模型来计算相似度分数,依据这个分数对不同候选对象之间的相似程度进行划分,以使实体对更好的进行匹配,使用灵活的相似度准则来消除实体匹配的歧义,可以抽取更多关系。对现有的聚类算法中的适应度函数进行了优化,增加了两个准则,不易局部最优解的情况,使其能够加速收敛,从而获得最优解,在构建面向知识图谱过程中关系抽取准确率以及效率高。
-
公开(公告)号:CN110110796B
公开(公告)日:2020-12-18
申请号:CN201910392625.X
申请日:2019-05-13
Applicant: 哈尔滨工程大学
Abstract: 一种基于深度学习的海上船舶时序数据的分析方法,它属于时序信息分析技术领域。本发明解决了传统方法对海洋环境下船舶目标时序数据分析结果的准确率低的问题。通过信息融合方式使LSTM模型在迭代中获得更多样化的时序信息,对数据的表征能力更强;根据相邻音频分帧输入特征的相似度对dropout的参数进行调整,达到一种动态反馈的效果,避免过度学习;对音频时序数据的处理和特征提取采用了划分频段分解的思想,先通过二维小波变换进行分解,再通过四组反卷积网络训练卷积核,再按比例抽取卷积核构建新的反卷积神经网络做待测时序数据的特征提取。采用本发明方法对海上船舶的音频时序数据分析结果准确率达到87.8%。本发明可以应用于时序信息分析技术领域。
-
公开(公告)号:CN110147393A
公开(公告)日:2019-08-20
申请号:CN201910435269.5
申请日:2019-05-23
Applicant: 哈尔滨工程大学
IPC: G06F16/2458
Abstract: 面向数据空间的实体解析方法,本发明涉及实体解析方法。本发明的目的是为了解决现有在数据空间中进行实体解析时,要对记录进行对比,对于不同领域的记录对,匹配概率很小,成对对比会浪费资源的问题。过程为:步骤一、构建记录图:步骤二、采用剪枝方法简化记录图;步骤三、对剪化后的记录图进行分块处理;步骤四、建立属性映射集群;步骤五、计算属性映射集的优度;步骤六、得到属性映射集群中各个映射集的优度后,在块内进行实体解析。本发明用于数据实体解析领域。
-
-
-
-
-
-
-
-
-