-
公开(公告)号:CN117789080A
公开(公告)日:2024-03-29
申请号:CN202311772954.X
申请日:2023-12-21
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V20/40 , G06V10/82 , G06V10/26 , G06N3/0455 , G06N3/08
Abstract: 本申请提供了一种指向性视频对象分割方法,包括基于短视频数据进行文本标注制作数据集;用所述数据集训练神经网络分割模型,所述神经网络分割模型包括时间编码器、空间编码器、解码器,在所述空间编码器和所述时间编码器的第s级后插入所述LBDT模块,所述LBDT模块的结果输入到所述解码器;将待预测视频数据输入到训练好的所述神经网络分割模型,得到对象分割结果。首创基于短视频制作数据集,并添加中文标注训练得到的包含改进LBDT模块的神经网络分割模型。可以至少用以解决现有指向性视频对象分割方法在特定语种下准确度不够高的技术问题。
-
公开(公告)号:CN117273330A
公开(公告)日:2023-12-22
申请号:CN202311201777.X
申请日:2023-09-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06Q10/0631 , G06Q50/06 , G06N3/006 , G06N5/01
Abstract: 本发明实施例提供了一种资源分配方法及装置,本申请提供了“采用启发式的、基于群智能的猫鼬群优化算法(Meerkat Swarm Intelligence Algorithm,MSIA)、拉格朗日松弛法和分支定价算法相结合的策略”的解决方案,具体为:获取城市水资源的基础参数;依据所述基础参数确定种群内资源的近似最优解;依据所述近似最优解确定种群内资源的全局最优解。本发明采用启发式的MSIA方法、拉格朗日松弛法和分支定价算法相结合的策略,通过模拟猫鼬捕猎的具体行为,设置启发式算法平衡探索阶段和利用阶段之间的平衡以及提升算法解的准确性,最后将全局最优解近似为算法所求的近似最优解。
-
公开(公告)号:CN116758693A
公开(公告)日:2023-09-15
申请号:CN202310711869.6
申请日:2023-06-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本申请提供了一种基于室内的无线火灾报警系统,采用了无线方式对检测火灾参数的传感器进行布局,以实现对室内环境信息实时感知,并对室内火灾作出判别和报警,为火灾报警技术领域提供了一定的思路。传感器的无线布局方式解决了传统有线布局方式的繁琐性、复杂性以及资源浪费等问题,其为后续消防检查工作也带来了一定的便利性。
-
公开(公告)号:CN118505504B
公开(公告)日:2025-04-29
申请号:CN202410500537.8
申请日:2024-04-24
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T3/4053 , G06T3/4046 , G06T3/4038 , G06V30/16 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/084
Abstract: 本发明属于图像处理技术领域,且公开了一种面向文本图像的超分辨率方法,包括:生成文本超分数据集,识别并转换图像中目标文本区域为矩形,以便输入超分网络,提取待超分图像的特征,得到特征图X0,利用文本先验提取模块生成注意力图A,将特征图X0与注意力图A通过多个带注意力机制的残差块进行升维,得到特征图Xn,对特征图Xn进行像素和通道重组,生成超分图像SR,计算SR图像的文本序列损失lctc和像素间损失l2,求得总损失l。通过迭代优化网络参数,评估模型性能,将SR图像输入文本识别模型,获取预测文本,逆变换后拼接到原图,增强视觉效果,有效解决了传统超分模型对于文本图像质量的提升效果有限甚至产生负优化效果的问题。
-
公开(公告)号:CN118552489A
公开(公告)日:2024-08-27
申请号:CN202410608702.1
申请日:2024-05-16
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Inventor: 徐勇
IPC: G06T7/00 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/048
Abstract: 本发明涉及图像处理技术领域,具体是涉及一种视网膜图像评分方法、装置、设备及存储介质。本发明首先将视网膜图像划分成若干个图像块,对每个图像块应用已训练深度学习模型,以得到每个图像块的分类结果,然后根据分类结果从若干个图像块中筛选出目标图像块,并根据目标图像块得到视网膜图像的评分结果。从上述分析可知,本发明的评估结果包括每个目标图像块的分类结果以及每个目标图像块,从而提高了评分结果的精准度。
-
公开(公告)号:CN117274713A
公开(公告)日:2023-12-22
申请号:CN202311320829.5
申请日:2023-10-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/764 , G06V10/26 , G06V20/70 , G06V10/774 , G06V10/44 , G06N20/00 , G06V10/82
Abstract: 本申请涉及计算机技术领域,特别涉及一种机器学习模型训练方法、图像的处理方法、机器学习模型的训练装置、图像的处理装置、电子设备和非易失性计算机可读存储介质。本申请实施例提供的技术方案中,通过在对主干网络进行训练过程中引入关于背景区域分割的目标背景区分模块,使训练后的模型能够学习如何识别背景与目标区域,并将两者尽可能分开,提高了模型在图像处理过程中对于目标轮廓提取的精度。能够获得更清晰的缺陷形态以及更准确的定位结果。
-
公开(公告)号:CN117218496A
公开(公告)日:2023-12-12
申请号:CN202311320825.7
申请日:2023-10-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/774 , G06V10/80 , G06V20/70 , G06V10/82 , G06V10/764 , G06N3/0464
Abstract: 本申请涉及计算机技术领域,特别涉及一种检测模型训练方法、图像的处理方法、检测模型的训练装置、图像的处理装置、电子设备和非易失性计算机可读存储介质。本申请实施例提供的技术方案中,通过构建第一特征金字塔和第二特征金字塔,并且通过侧边之间的横向连接使得所有尺度下的特征都有丰富的语义信息,在通过高斯Wasserstein距离损失函数对检测结果输出的预测框位置进行评估,并训练模型,解决了现有技术中IOU度量在小目标情况下的不稳定的问题。
-
公开(公告)号:CN116723456A
公开(公告)日:2023-09-08
申请号:CN202310711863.9
申请日:2023-06-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本申请公开了一种面向火灾监测的网络定位优化方法和装置,该方法对SSA算法进行改进,得到改进后的ESSA算法;通过ESSA算法对DV‑Hop算法得到的不带有定位功能的未知节点位置进行二次更新,从而提高网络的定位精度。
-
公开(公告)号:CN111724303A
公开(公告)日:2020-09-29
申请号:CN202010398292.4
申请日:2020-05-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Inventor: 徐勇
Abstract: 本发明提供了一种具有图像类型适应性的超分辨率图像处理方法,包括以下步骤:S1、构建基于多类型图像的“通用”超分辨率模,将待处理图像作为基于多类型图像的“通用”超分辨率模的输入,运行基于多类型图像的“通用”超分辨率模型后,得出待处理图像的初步高分辨率图像;S2、构建基于单一类型图像的“精细”超分辨率模型,将初步高分辨率图像作为基于单一类型图像的“精细”超分辨率模型的输入,运行基于单一类型图像的“精细”超分辨率模型后,得出最终的高分辨率图像。本发明还提供了一种具有图像类型适应性的超分辨率图像处理系统。本发明的有益效果是:在提升图像分辨率的同时,还可以克服原图像中存在的局部亮度异常等问题。
-
公开(公告)号:CN119359359A
公开(公告)日:2025-01-24
申请号:CN202411534094.0
申请日:2024-10-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06Q30/0203 , G06Q10/0631 , G06V20/52 , G06V20/40 , G06V10/764 , G06V10/25 , G06V10/74
Abstract: 本发明涉及计算机视觉技术领域,具体为一种基于行人重识别改进的4S门店客流统计算法,包括以下步骤,基于图像采集设备,实时采集4S店入口的视频数据,结合视频处理的输入需求,对视频数据进行标准化处理,生成视频标准化处理结果。本发明中,通过实时采集视频数据并进行标准化处理,确保在高客流量情况下的图像质量和数据处理的连续性,结合目标检测框大小和位置的调整,提高目标识别和跟踪的准确性,分析目标的运动路径并添加标记信息,准确追踪多个客户的动向,与数据库中已存储的特征向量进行对比,有效区分重复目标并进行客流统计,结合门店布局参数实施的进出行为分析,帮助店面调整人力资源配置,提高运营效率和顾客满意度。
-
-
-
-
-
-
-
-
-