一种基于文本辅助的可见光红外行人重识别方法

    公开(公告)号:CN119785384A

    公开(公告)日:2025-04-08

    申请号:CN202411940076.2

    申请日:2024-12-26

    Abstract: 本发明提出了一种基于文本辅助的可见光红外行人重识别方法。所述方法包括:获取待检索红外行人图像和可见光行人图像库,对红外行人图像标注粗略文本描述;对红外行人图像和可见光行人图像进行预处理;构建非对称双分支跨模态特征提取器,引入文本描述作为辅助信息,提取待检索行人图像和图像库所有行人图像的特征;计算两者的余弦相似度,将相似度从高到低排序,生成初始检索序列;计算图像库中行人图像之间的相似度,据此生成近邻集合;计算近邻相似度,据此对初始检索序列进行重排序。本发明通过引入文本描述作为跨模态检索辅助信息,并设计跨模态检索重排序算法,能够很好地解决跨模态行人特征对齐问题,因而获得了较现有方法更准确的行人重识别结果。

    一种融合多模态美学和属性特征的图像美学评估方法

    公开(公告)号:CN119625338A

    公开(公告)日:2025-03-14

    申请号:CN202411684939.4

    申请日:2024-11-22

    Abstract: 本发明提供了一种融合多模态美学和属性特征的图像美学评估方法。所述方法包括:构造图像‑美学以及图像‑属性文本对数据;构建联合属性和美学描述的多模态预训练模型;利用冻结的图像编码器与条件编码器提取原始图像特征与条件特征;利用文本解码器生成匹配条件特征的美学或属性文本;最小化生成文本与目标文本差异得到预训练模型;获取并处理图像和美学评分数据,构建融合多模态美学和属性特征的美学评分模型;提取并融合图像的属性和美学特征得到属性感知的美学特征;将该特征通过线性层映射得到美学分数;利用均方误差函数优化模型参数,得到最终的美学评分模型;本发明不仅能获得能准确的美学评分,而且在推理阶段仅需要单张图像。

    一种基于心电波形监督的压力识别方法

    公开(公告)号:CN118490245A

    公开(公告)日:2024-08-16

    申请号:CN202410581485.1

    申请日:2024-05-11

    Abstract: 本发明提供了一种基于心电波形监督的压力识别方法。所述方法包括:将心电信号有重叠地裁剪成多个心电序列;将心电序列无重叠地分割为N个片段,并进行片段编码;将N个片段编码输入到Informer编码器中,利用注意力机制计算片段编码之间的长距离依赖和上下文信息,提取含有全局信息表示的特征向量;将特征向量分别输入到压力分类头和关键波分类头,以获取压力分类结果和关键波分类结果;本发明能够利用好片段中的关键信息,并使用关键波形来监督模型充分学习到心电信号的模式和特征。本发明不仅能够准确得到压力识别的结果,还能够减小过拟合,提升模型泛化性。

    基于多层感知机网络的跨层级加强特征的行人再识别方法

    公开(公告)号:CN116030496A

    公开(公告)日:2023-04-28

    申请号:CN202310026052.5

    申请日:2023-01-09

    Inventor: 赵志诚 赵睿宁

    Abstract: 本发明涉及基于多层感知机网络的跨层级加强特征的行人再识别方法,包括如下步骤:1、从含有行人的视频中通过抽帧得到行人图像I;2、从行人图像I中提取特征E1,经过多层感知机网络融合、重塑,得到行人特征F;3、将行人特征F输入嵌入层;4、将嵌入层输出的特征F0输入特征提取网络,得到特征F4,所述特征提取网络包括结构相同的多层子网络、以及加强模块,用于对一层子网络的输出进行加强后输出到跨层的子网络;5、对特征F4进行全尺度融合、归一化与降维处理;6、将处理后的特征输入三元组损失函数进行度量学习,输入交叉熵损失函数进行分类学习,得到训练好的分类器;7、将特征Feat输入到训练好的分类器中,输出行人再识别的分类结果。

    一种目标细胞的智能检测方法

    公开(公告)号:CN113888474A

    公开(公告)日:2022-01-04

    申请号:CN202111063063.8

    申请日:2021-09-10

    Inventor: 赵志诚 苏菲 张琪

    Abstract: 本发明提供了一种目标细胞的智能检测方法。所述方法包括:将超高分辨率免疫组化数字图像均匀地、低重叠地裁剪成多个大尺寸概览图像;将概览图像输入卷积神经网络提取得到不同尺度的特征;将不同尺度的特征进行自适应加权融合,计算出候选细胞的分布概率图;将分布概率图映射到输入的概览图像中,得到多个位置坐标;根据位置坐标信息,对概览图像进行局部裁剪,得到候选细胞的小尺寸近距离图像;将候选细胞的小尺寸近距离图像输入分类网络,输出候选细胞是否为目标细胞的精确分类结果;融合所有概览图像中候选细胞的位置坐标信息和精确分类结果,最后输出目标细胞的检测结果。本发明不仅能更快速地得到检测的结果,还能保证检测的精度。

    一种体温序列职业画像新方法

    公开(公告)号:CN112086202A

    公开(公告)日:2020-12-15

    申请号:CN202010768565.X

    申请日:2020-08-03

    Abstract: 本发明公开了一种体温序列职业画像新方法,属于机器学习领域。首先针对某个目标用户,从体温数据库中提取固定时间段内的体温序列值生成该用户的体温时间序列数据集。如果该体温时间序列数据集有缺失,则对缺失的体温序列值进行补足,生成完整的体温时间序列数据。然后使用完整的体温时间序列数据生成目标用户的五维高层次特征,并将五维高层次特征组成K‑means聚类算法的输入向量,利用K‑means聚类算法得到不同职业的簇。最后对各个职业簇进行数据统计与分析,生成用户职业画像。本发明免去大量繁杂的人工操作,并且进一步挖掘了体温序列的深层次信息,更具表征性。

    基于深度网络的图标检测方法

    公开(公告)号:CN109800698A

    公开(公告)日:2019-05-24

    申请号:CN201910026888.9

    申请日:2019-01-11

    Abstract: 本公开涉及一种基于深度学习的图标检测方法,包括模型训练阶段和模型测试阶段,其中,所述模型训练阶段包括以下步骤:步骤1、准备画面中不含待检测图标的视频帧集合;步骤2、准备仅含有待检测图标的图标图像,其包含颜色通道和Alpha通道数据、以及图标分类信息;步骤3、将所述图标图像与视频帧集合中的各个帧进行随机的图像叠加,形成含有待检测图标的叠加图像,作为训练数据集,训练形成图标检测模型;其中,所述模型测试阶段包括以下步骤:步骤4、将待检测图像输入所述图标检测模型,所述图标检测模型输出检测结果,所述检测结果包括所述测试图像是否含有图标、所含图标的分类信息和位置信息。

    一种基于CNN和LSTM的暴恐视频检测方法

    公开(公告)号:CN105844239B

    公开(公告)日:2019-03-29

    申请号:CN201610168334.9

    申请日:2016-03-23

    Abstract: 本发明公开了一种基于CNN和LSTM的暴恐视频检测方法,属于模式识别、视频检测、深度学习技术领域。所述检测方法首先对待检测视频进行关键帧采样,并提取关键帧特征;然后进行视频层面的表达与判别,包括CNN语义模块的VLAD特征表达与SVM判别、CNN场景模块的场景VLAD特征表达与SVM判别,以及LSTM时序模块的LSTM判别;最后进行结果融合。本发明利用了CNN在图像特征提取和LSTM在时序序列表达方面的优势,并充分考虑暴恐视频在场景方面的特色,实际测试中检测指标mAP值达到98.0%,接近人工作业水准。在运行速度方面,仅采用单机GPU加速的方式,每秒钟便可以处理76.4秒的网络视频,适于阻断暴恐视频在大型视频网站上的传播,有利于维护社会稳定和国家长治久安。

    爆炸电路板残片图像自动比对识别方法

    公开(公告)号:CN106780440A

    公开(公告)日:2017-05-31

    申请号:CN201611075728.6

    申请日:2016-11-29

    CPC classification number: G06T7/0004 G06T2207/30141

    Abstract: 本发明公开了一种爆炸电路板残片图像自动比对识别方法,属于模式识别和图像处理技术领域。所述方法首先将残片图像基于概率图模型的图像分割算法进行对象分割,再采用基于概率抽样的颜色模型进行元器件的对象精定位,然后提取特征点并过滤,将过滤后的特征点与检索库中的电路板特征点进行比对识别,确定残片所属的源电路板。本发明首次提出并实现了根据爆炸电路板残片图像自动识别印刷电路板同型号原板的方法。所述比对识别方法能够准确地分割出电路板中的元器件及字符区域,抑制噪声干扰,比对时同时考虑特征点描述与空间几何关系的相似性,该方法在电路板残片图像自动识别中TOP1准确率高于99%。

    一种多模态行人再辨识技术

    公开(公告)号:CN103942563A

    公开(公告)日:2014-07-23

    申请号:CN201410125981.2

    申请日:2014-03-31

    Abstract: 本申请公开了一种多模态行人再辨识技术,包括以下步骤:步骤1、从第一摄像机和第二摄像机各自拍摄的第一图像和第二图像中分别截取包含目标的前景图像,其中,第二图像对应于已知目标;步骤2、从所截取的前景图像中分别提取颜色特征和纹理特征,并将颜色特征和纹理特征级联,形成图像特征;步骤3、将所述图像特征输入到Hash投影模型,计算第一图像和第二图像中的目标的相似度;步骤4、如果所计算的相似度大于预定阈值,则将第一图像的目标判定为第二图像所对应的已知目标。

Patent Agency Ranking