-
公开(公告)号:CN107154258A
公开(公告)日:2017-09-12
申请号:CN201710229138.2
申请日:2017-04-10
Applicant: 哈尔滨工程大学
CPC classification number: G10L15/02 , G10L15/063 , G10L17/02 , G10L17/04 , G10L19/032 , G10L25/30
Abstract: 本发明提供的是一种基于负相关增量学习的声纹识别方法。一、对输入的语音信号进行预处理和特征提取;二、初始化网络集成,如果之前已存在网络集成,则复制当前所有网络;三、对网络集成进行训练;四、对网络集成中的每个网络进行结构调整;五、对当前网络进行筛选,选出其中最优的一部分网络;六、将当前得到的网络进行应用,如果有新数据到来,则从步骤一开始循环执行。本发明是以增量学习的方法对声纹识别进行研究,提高其在数据增量到来场景下的效率和识别准确率;基于负相关学习的增量学习算法能有效地解决增量问题。本发明分别从模型训练和模型选择两个方面进行改进,提出了一种新的算法以解决上述的问题,然后将其应用到增量学习中。
-
公开(公告)号:CN106951524A
公开(公告)日:2017-07-14
申请号:CN201710168151.1
申请日:2017-03-21
Applicant: 哈尔滨工程大学
CPC classification number: G06F16/9024 , G06F2216/03 , G06Q50/01
Abstract: 本发明提供的是一种基于节点影响力的重叠社区发现方法。在k‑shell分解算法的基础上,通过综合并全面考虑节点的全局影响力、局部影响力以及邻居节点的贡献度共三类因素而提出。依据影响力降序顺序更新节点,符合社会网络信息传播特性,降低算法的随机性,并在计算归属系数的时候,不仅仅考虑了邻居节点影响力的影响,还将节点本身的归属倾向及节点本身影响力考虑在内。在设定重叠阈值等方面,融合了节点影响力,为每个节点设置了合理的阈值。能够降低原算法的随机性,挖据出高质量的社区结构。
-
公开(公告)号:CN106095951A
公开(公告)日:2016-11-09
申请号:CN201610422994.5
申请日:2016-06-13
Applicant: 哈尔滨工程大学
IPC: G06F17/30
CPC classification number: G06F17/30333
Abstract: 基于负载均衡和查询日志的数据空间多维索引方法,涉及数据空间索引技术领域。旨在把倒排索引分布到不同的索引节点中,使得各个索引节点保持负载均衡,同时最小化查询处理涉及的通信开销和减少搜索空间。在垂直划分中,首先利用查询日志和实体中频繁出现的词,聚合索引token词,使用超图表示用户查询与倒排列表间的访问模式;在水平划分中,通过超图刻画用户查询与实体间的访问模式信息,把水平划分问题归约为超图划分问题,使得不同索引节点的负载保持均衡,并降低查询涉及的通信开销。结合垂直划分和水平划分策略,构建二维混合索引并扩展为三维索引。通过在公开数据集DBLP上进行实验表明本发明方法在吞吐量、查询响应时间及扩展性优于已有方法。
-
公开(公告)号:CN105975488A
公开(公告)日:2016-09-28
申请号:CN201610264735.4
申请日:2016-04-25
Applicant: 哈尔滨工程大学
IPC: G06F17/30
CPC classification number: G06F16/285 , G06F16/2471
Abstract: 一种关系数据库中基于主题类簇单元的关键词查询方法,涉及信息检索领域,尤其涉及一种关系数据库中基于主题类簇单元的关键词查询方法。本发明要为解决现有关键词在线查询方法存在查询过程中频繁的表连接所带来巨大时间开销的问题,而现有关键词离线查询方法对于内部结构复杂、数据量庞大的大规模数据库上的查询存在查询效率低的问题。一种关系数据库中基于主题类簇单元的关键词查询方法按以下步骤进行:1、主题类簇单元构建过程;①、基于数据表特性和查询日志垂直分组;②、提出主题类簇中表连接顺序优化方案;③、基于主题类簇元组关联图水平分组;2、建立基于关联规则的索引优化机制;3、将查询结果返回给用户。本发明应用于信息检索领域。
-
公开(公告)号:CN105808739A
公开(公告)日:2016-07-27
申请号:CN201610136924.3
申请日:2016-03-10
Applicant: 哈尔滨工程大学
IPC: G06F17/30
CPC classification number: G06F16/90348
Abstract: 基于Borda算法的搜索结果排序方法,属于搜索引擎结果排序领域。现有的Borda排序算法对于结果相关分值的计算时,所用的位置关系并不能完全代表相关度的变化,导致搜索结果排序不准确。一种基于Borda算法的搜索结果排序方法,先是对返回结果的位置得分统一规范化处理,并且结合进了检索词串与搜索结果的相似度,对相似度的计算方法也进行了改进。本发明利用标题和摘要进行相似度的计算时,结合了查询词与结果的匹配权重,使得相似度的计算更加准确;且提高搜索效率。
-
公开(公告)号:CN114510945B
公开(公告)日:2024-10-22
申请号:CN202210157121.1
申请日:2022-02-21
Applicant: 哈尔滨工程大学
IPC: G06F40/295 , G06N3/0442 , G06N3/045
Abstract: 基于偏旁特征嵌入的中文命名实体识别网络模型,涉及自然语言处理与中文命名实体识别领域。解决了现有中文命名实体识别算法的语义识别的准确率和F值低的问题。将字符拆分成其偏旁构成的形式,将其映射为偏旁特征向量、并与单词特征向量和字符特征向量,组合后输入到Bi‑LSTM编码层中进行编码中,编码后的特征经CRF解码层解码后得到输入文本的命名实体标签,从而实现对中文命名实体的识别。本发明主要用于对中文命名实体进行识别。
-
公开(公告)号:CN118053064A
公开(公告)日:2024-05-17
申请号:CN202410169717.2
申请日:2024-02-06
Applicant: 哈尔滨工程大学
IPC: G06V10/82 , G06V10/774 , G06V10/26 , G06V20/70 , G06V10/42 , G06V10/80 , G06V10/766 , G06N3/0464 , G06N3/09
Abstract: 基于深度学习的法兰中心点识别方法,本发明涉及法兰中心点识别方法。本发明的目的是为了解决现有传统视觉识别系统对法兰中心点的识别准确性低、效率低下、以及适应性不足的问题。过程为:步骤一、随机采样带法兰中心点坐标标签的法兰图片,作为训练集;步骤二、构建神经网络模型;具体过程为:神经网络模型包括:语义分割网络、全局特征提取网络和关键点识别网络;步骤三、基于训练集训练构建的神经网络模型,获得训练好的神经网络模型;步骤四、采集待测法兰图片,将待测法兰图片输入训练好的神经网络模型,训练好的神经网络模型输出待测法兰图片的法兰中心点。本发明用于法兰中心点的识别领域。
-
公开(公告)号:CN116913317A
公开(公告)日:2023-10-20
申请号:CN202310859687.3
申请日:2023-07-13
IPC: G10L25/51 , G06N3/084 , G06N3/0464 , G10L25/90 , G10L25/30 , G10L21/0208
Abstract: 基于声重组特征网络的水面航行器声信号基频提取方法,属于基频提取领域。本发明解决了现有基频提取任务的声信号特征提取方法存在处理方式复杂、鲁棒性差的问题。本发明将待进行基频提取的声信号按照LHS算法产生的最小帧长切割成等长的音频段;采用LHS算法对所述等长的音频段的基频进行标记;采用声重组特征网络提取音频段的声信号的基频特征;采用基频提取网络利用基频特征对对应的音频段进行基频提取。本发明适用于基频提取。
-
公开(公告)号:CN112464673B
公开(公告)日:2023-05-26
申请号:CN202011431776.0
申请日:2020-12-09
Applicant: 哈尔滨工程大学
IPC: G06F40/30 , G06F40/216
Abstract: 融合义原信息的语言含义理解方法,属于语言信息处理技术领域。为了解决现有的语言建模方法存在复杂度较高的问题和不能兼顾效果的问题。本发明所述方法首先将语言以每个单词为单位,按照两条路径进行处理;左路径:单词编码器+RNN+单词解码器,左路径输出记为wl;右路径:义原编码器+RNN+义原解码器+词语解码器+sigmoid,右路径输出记为wr;然后将两个路径的输出进行融合。主要用于语言含义理解。
-
公开(公告)号:CN115861660A
公开(公告)日:2023-03-28
申请号:CN202211689077.5
申请日:2022-12-27
Applicant: 哈尔滨工程大学
IPC: G06V10/74 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 一种基于混合度量的特征分布度量方法,为解决在图像分类时深度迁移学习方法的迁移学习模型无法对目标域数据准确标注的问题。将图片分为源域和目标域;利用源域中的图片对迁移学习模型进行训练,得到模型;计算分类损失;计算域间特征边缘分布差异的一、二、三阶统计量距离,再加权组合得到域间特征边缘分布的混合度量;获取目标域软标签,利用软标签计算目标域特征的初始软质心,再使用余弦相似度得目标域特征的伪标签;计算域间特征的条件分布差异的一、二、三阶统计量距离,再加权组合得到域间特征条件分布的混合度量;将二者混合度量相加得域间特征统计量距离;计算迁移学习模型总体损失函数,更新模型;预测测试样本,得到种类预测概率。
-
-
-
-
-
-
-
-
-