-
公开(公告)号:CN112613561B
公开(公告)日:2022-06-03
申请号:CN202011554134.X
申请日:2020-12-24
Applicant: 哈尔滨理工大学
Abstract: 本发明属于自然场景文本检测算法技术领域,特别涉及一种EAST算法优化方法,步骤1:图像预处理;步骤2:输入特征提取网络进行特征提取;步骤3:特征融合;步骤4:输入BLSTM网络;步骤5:输出结果;通过优化混合特征金字塔结构,将自上而下的四层合并,改进为只合并前两层,然后再与自上而下路径进行融合。然后利用优化后的混合特征金字塔结构代替原来的EAST算法的特征提取和特征合并结构。解决EAST算法对小感受野文本关注不够,小感受野特征图处理较少不利于后续处理等问题。EAST算法预测误差大大减小,提升EAST算法预测精度。
-
公开(公告)号:CN112613561A
公开(公告)日:2021-04-06
申请号:CN202011554134.X
申请日:2020-12-24
Applicant: 哈尔滨理工大学
Abstract: 本发明属于自然场景文本检测算法技术领域,特别涉及一种EAST算法优化方法,步骤1:图像预处理;步骤2:输入特征提取网络进行特征提取;步骤3:特征融合;步骤4:输入BLSTM网络;步骤5:输出结果;通过优化混合特征金字塔结构,将自上而下的四层合并,改进为只合并前两层,然后再与自上而下路径进行融合。然后利用优化后的混合特征金字塔结构代替原来的EAST算法的特征提取和特征合并结构。解决EAST算法对小感受野文本关注不够,小感受野特征图处理较少不利于后续处理等问题。EAST算法预测误差大大减小,提升EAST算法预测精度。
-
公开(公告)号:CN116386076A
公开(公告)日:2023-07-04
申请号:CN202211659848.6
申请日:2022-12-23
Applicant: 哈尔滨理工大学
IPC: G06V40/10 , G06V20/52 , G06V10/44 , G06V10/80 , G06V10/82 , G06V10/74 , G06V10/75 , G06N3/0464 , G06N3/045 , G06N3/048 , G06N3/08
Abstract: 一种基于轻量型CNN的行人检测与跟踪方法,属于识别检测方法领域。为了提升检测和跟踪技术融合下的动态行人图像的处理速度和跟踪的连续性,提出本发明的一种基于轻量型CNN的行人检测与跟踪方法,包括针对Shufflenetv2引入CrossOver的卷积块Shuffle Block结构,以最大池化和Shuffle Block为基础组成BackBone,在BackBone底层与高层间,在Neck部分引入多尺度融合模型,在Head部分引入1*1卷积;在PANet网络上下采样中引入AugShuffle Block以及注意力机制SimAM,加入多尺度的特征融合器和特定的损失函数CIOU_loss;利用基于交并比的运动距离度量来替换DeepSort的马氏距离度量方式。本发明利用改进后的Shufflenetv2网络对视频中的行人进行特征提取,使用改进后的DeepSort对所提取的特征进行跟踪,使得跟踪实时性以及准确性得到一定提升。
-
公开(公告)号:CN116311348A
公开(公告)日:2023-06-23
申请号:CN202310043434.9
申请日:2023-01-29
Applicant: 哈尔滨理工大学
Abstract: 本发明公开了视频图像中的行人检测技术领域的基于特征融合的鱼眼镜头视角下行人检测与跟踪方法,输入图像,编码网络通过多尺度特征融合模块分别采用自下而上、自上而下和横向连接这3种路径提取底层、高层特征进行融合,多尺度特征融合模块提取的每一层特征图都将通过通道注意力机制,使得重要的通道能够被分配到更高的权重;最终的特性图传入解码网络,解码网络负责预测中心热力图中每个网格是检测目标中心点的概率、中心点的偏移量以及对应的长和宽、旋转偏移量。在CenterNet的网络结构上将标准卷积替换为多尺度特征融合并引入角度敏感的空间注意力机制,同时改进损失函数,提升边界框回归效果。
-
公开(公告)号:CN110334776A
公开(公告)日:2019-10-15
申请号:CN201910632952.8
申请日:2019-07-15
Applicant: 哈尔滨理工大学
Abstract: 一种基于区域双三次插值技术的图像分类识别方法,属于图像处理领域。现有的图像处理方法存在因尺度变换造成图像失真使图像分类识别率降低的问题。一种基于区域双三次插值技术的图像分类识别方法,利用训练样本经过SIFT提取特征、K-means聚类统计词频、分类的步骤得到训练数据后,训练分类器模型;将测试样本图像通过区域双三次插值来对图像进行相同的放大与缩小的改变,再经过BOF算法进行检索与分类。本发明能够提高经缩放引起的失真图像的分类识别准确率。
-
公开(公告)号:CN110059595A
公开(公告)日:2019-07-26
申请号:CN201910264244.3
申请日:2019-04-03
Applicant: 哈尔滨理工大学
Abstract: 本发明一种用于图像识别的自适应算法属于智能图像识别领域。包括以下步骤:步骤一:采集图像;步骤二:对采集的图像进行预处理;步骤三:将所述步骤二所述进行预处理的图像,再次进行处理,使处理后的图像大小相同等步骤;在本发明一种用于图像识别的自适应算法作用下,本算法利用主成分分析对图像进行数据分析,寻找最优特征,将多余有瑕疵特征去除;然后利用算法生成初始种群,算法使种群均匀分布在求解区域,为提升整体搜寻速度,采用对遗传算法进行改进;依据适应度值自适应变化的交叉与变异概率确保种群多样性,提升寻优效率和识别率;最后进行人工分析和大数据分析对比计算,进行图像目标分类。
-
公开(公告)号:CN108282409A
公开(公告)日:2018-07-13
申请号:CN201810323286.5
申请日:2018-04-12
Applicant: 哈尔滨理工大学
IPC: H04L12/771 , H05K7/20 , H04B7/0413
Abstract: 本发明涉及一种加强散热的MIMO路由器。现有的路由器电路板内通常未设置散热风扇,导致未设置散热风扇的路由器电路板散热效果较差。加强散热的MIMO路由器,其壳体内上部安装行走组件,下部安装路由器电路板、单片机,风扇滑动安装在行走组件下方用于给路由器电路板降温,路由器电路板上方还安装温度传感器,单片机连接温度传感器、风扇、行走组件和供电装置,路由器电路板、温度传感器和行走组件分别连接供电装置;壳体上表面的天线周围可移动的设置一圈信号挡板。本发明的大功率路由器电路板具有自动调节内部风扇工作状态的功能,工作状态稳定,能够延长元器件使用寿命的优点。
-
公开(公告)号:CN107452404A
公开(公告)日:2017-12-08
申请号:CN201710642840.1
申请日:2017-07-31
Applicant: 哈尔滨理工大学
Abstract: 本发明涉及一种语音情感识别的优选方法。目前语音是人与人之间沟通、思想情感表达的工具,为了使计算机可以像人一样与人类交流,语音情感识别逐渐成为了智能人机交互领域的研究热点,国内在此研究上起步比较晚,语音情感识别的正确率也很低。本发明包括如下步骤:首先选取柏林数据集和中科院汉语情感语音库作为情感识别的语音数据库,所述的语音数据库中包括高兴、生气、害怕、悲伤、平静5种情感语音并对5种情感语音进行识别选定测试集和训练集,其次再对5种情感语音进行特征参数的信号提取,在提取的特征参数信号中利用Fisher准则和最大熵原理结合的方法得出SVM核参数,再用SVM核参数训练SVM,最后利用SVM优选后的核参数对语音情感信号进行识别。
-
公开(公告)号:CN117935195A
公开(公告)日:2024-04-26
申请号:CN202311767610.X
申请日:2023-12-20
Applicant: 哈尔滨理工大学
IPC: G06V20/56 , G06V10/141 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0455
Abstract: 一种基于深度学习的复杂场景车道线检测方法。为了能达到更好的捕捉输入数据的全局上下文信息、更好地适应实时驾驶的要求以及促使模型更好地学习和利用通道间的信息的目的,本发明方法包括,采用Tusimple数据集中的图像数据作为复杂场景车道线数据集;通过CULane其他数据集进行辅助训练,补充低照度、车辆遮挡条件下的图像数据;采用编码器和解码器架构一个输入和两个输出的模型;利用ShuffleNet作为编码器的信息编码块,模型学习两个不同的任务的表示,通过两个解码器处理特征图并分别获得每个任务的最终结果;将位置注意力嵌入通道注意力中,形成双记忆力模块。本发明方法引入膨胀卷积,增加卷积核的感受野,更好地理解输入图像的上下文信息,提高网络的性能。
-
公开(公告)号:CN117635960A
公开(公告)日:2024-03-01
申请号:CN202311760394.6
申请日:2023-12-20
Applicant: 哈尔滨理工大学
IPC: G06V10/40 , G06V10/764 , G06T3/4007 , G06T3/4038 , G06N3/0464 , G06N3/088 , G06N3/045 , G06N3/0495 , G06V10/82
Abstract: 本发明公开了一种轻量化线特征单应性矩阵估计方法,属于图像处理技术领域。包括以下步骤:S1、将原始图片进行预处理,以使得预处理后的图片数据尺寸一致且维度降低;S2、将预处理后的图片数据输入特征提取网络L‑SqueezeNet中进行特征提取,输出结果 S3、使用所述估计图像变换单应性矩阵,生成翘曲后的图像并计算损失函数用于模型训练。本发明改善了图像单应性矩阵估计的对噪声点敏感的问题,提高了图像单应性矩阵估计的稳定性。
-
-
-
-
-
-
-
-
-