基于多模态Transformer的零配件检测方法、装置及可读介质

    公开(公告)号:CN117274253B

    公开(公告)日:2024-02-27

    申请号:CN202311546437.0

    申请日:2023-11-20

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于多模态Transformer的零配件检测方法、装置及可读介质,涉及图像处理领域,包括:获取零配件的重量以及不同角度零配件图像叠加得到输入图像;构建零配件检测模型并训练,得到经训练的零配件检测模型,将输入图像和重量输入经训练的零配件检测模型,得到特征向量;建立包含已知型号的零配件的特征向量的零配件特征向量数据库;将待检测的零配件的输入图像和重量输入经训练的零配件检测模型,得到待检测的零配件的特征向量,将待检测的零配件的特征向量与零配件特征向量数据库中的特征向量进行比对,检测得到待检测的零配件的型号,解决传统的图像检测方法使用单一类型的数据对零配件型号检测的准确性差等问题。

    基于多模态Transformer的零配件检测方法、装置及可读介质

    公开(公告)号:CN117274253A

    公开(公告)日:2023-12-22

    申请号:CN202311546437.0

    申请日:2023-11-20

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于多模态Transformer的零配件检测方法、装置及可读介质,涉及图像处理领域,包括:获取零配件的重量以及不同角度零配件图像叠加得到输入图像;构建零配件检测模型并训练,得到经训练的零配件检测模型,将输入图像和重量输入经训练的零配件检测模型,得到特征向量;建立包含已知型号的零配件的特征向量的零配件特征向量数据库;将待检测的零配件的输入图像和重量输入经训练的零配件检测模型,得到待检测的零配件的特征向量,将待检测的零配件的特征向量与零配件特征向量数据库中的特征向量进行比对,检测得到待检测的零配件的型号,解决传统的图像检测方法使用单一类型的数据对零配件型号检测的准确性差等问题。

    基于空间频域滤波的激光散斑衬比血流成像方法及系统

    公开(公告)号:CN116051423B

    公开(公告)日:2023-06-20

    申请号:CN202310206847.4

    申请日:2023-03-07

    Applicant: 华侨大学

    Abstract: 本发明公开了基于空间频域滤波的激光散斑衬比血流成像方法及系统,涉及生物组织医学成像领域。该方法包括:S1,图像采集步骤;S2,二维快速傅里叶变换步骤;S3,空间频域滤波步骤;S4,二维快速傅里叶逆变换步骤;S5,时域处理步骤;S6,调制步骤。本发明通过空间频域滤波提取散斑图像中的背景信号,抑制光照背景的不均匀性;相比于一维快速傅里叶变换,利用二维快速傅里叶变换分析法来分离散斑信号和背景信号,有效降低计算复杂度的同时提高计算速度;利用空间频域滤波和时域叠加平均散斑信号计算深度调制衬比值,有效提高LSCI成像的衬比度和信噪比,也因此进一步提升了成像的动态范围。

    一种非标记细胞显微图像增强方法及系统

    公开(公告)号:CN116342432A

    公开(公告)日:2023-06-27

    申请号:CN202310576207.2

    申请日:2023-05-22

    Applicant: 华侨大学

    Abstract: 本发明公开了一种非标记细胞显微图像增强方法及系统,属于图像处理技术领域,包括如下步骤:S1、输入非标记细胞显微图像;S2、利用滑动窗口中心灰度增强算法,对非标记细胞显微图像位于滑动窗口中心的像素进行灰度值预增强;S3、重复滑动窗口,使得滑动窗口中心遍历非标记细胞显微图像,对每一个像素进行灰度值预增强,获得预增强的非标记细胞显微图像;S5、利用预增强的非标记细胞显微图像与经自适应权值约束的高斯多尺度加权图像作差分运算,得到增强后的非标记细胞显微图像。本发明具有较好的鲁棒性及普适性,且运算速度更快;本发明对特征图像的提取更精确,且能进一步提高非标记细胞显微图像的对比度。

    一种基于模态关系学习的跨模态检索方法

    公开(公告)号:CN114817673A

    公开(公告)日:2022-07-29

    申请号:CN202210389983.7

    申请日:2022-04-14

    Applicant: 华侨大学

    Abstract: 本发明提出一种基于模态关系学习的跨模态检索方法,将数据集中相同语义的图像文本对以及所属的类标签输入到基于模态关系学习的跨模态检索网络模型中训练,直至模型收敛,从而获得网络模型M;利用S1中训练得到网络模型M分别提取待查询图像/文本和候选库中每个文本/图像的特征向量,从而计算待查询图像文本与候选库中文本/图像的相似度,根据相似度的大小进行降序排序,并返回相似度最高的检索结果;建立模态间和模态内的双重融合机制进行模态间关系学习,不仅在模态内融合多尺度的特征,还在模态间使用标签的关系信息直接对融合特征进行互补性关系学习,另外,加入模态间的注意力机制进行特征联合嵌入,进一步的提高了跨模态的检索性能。

    一种H.266/VVC屏幕内容编码快速模式选择方法

    公开(公告)号:CN113141504A

    公开(公告)日:2021-07-20

    申请号:CN202110235923.5

    申请日:2021-03-03

    Applicant: 华侨大学

    Abstract: 一种H.266/VVC屏幕内容编码快速模式选择方法,1)对当前输入的屏幕视频帧计算角点占比,根据角点占比将其划分为低对比度屏幕视频帧和高对比度屏幕视频帧;2)对于低对比度屏幕视频帧,根据当前CU是否有角点将当前编码CU分成前景CU和背景CU,再分别进行对应的模式检测;3)对于高对比度屏幕视频帧,检测当前CU是否有角点,如果未检测出角点,则当前CU为背景CU,转至步骤4),否则,当前CU为前景CU,转至步骤5);4)根据CU活动度和平均亮度差将背景CU分成屏幕内容背景CU和自然内容背景CU,再分别进行对应的模式检测;5)根据相邻CU是否使用IBC或PLT预测模式分别进行对应的模式检测。本发明的方法可大幅减少低对比度屏幕视频帧的编码时间,降低编码复杂度。

Patent Agency Ranking