一种基于自适应分块与概率重分配的图像分割方法

    公开(公告)号:CN118628734B

    公开(公告)日:2025-05-16

    申请号:CN202410663602.9

    申请日:2024-05-27

    Abstract: 本发明提出一种基于自适应分块与概率重分配的图像分割方法,属于图像分割技术领域。包括:S1.初始化高斯混合模型参数与每个像素的分割类别初始估计值;S2.对待分割图像使用固定形状的滑动窗口进行固定分块划分;S3.将待分割图像转换为灰度图像,计算每个像素邻域范围内的方差,生成每个像素的匹配度向量,选取匹配度向量中最小值的区域块与对应像素建立映射关系和像素‑块区域似然矩阵;S4、得到待分割图像的后验概率及本轮图像分割结果;S5.将待分割图像的后验概率按照像素与区域块的映射关系分配到区域块中的每个像素,对模型参数进行更新;S6.重复S2至S5,直至收敛。本发明有效提升整体分割的准确度和一致性。

    一种基于动态注意力与图网络推理的视频问答系统、方法、计算机及存储介质

    公开(公告)号:CN113609355A

    公开(公告)日:2021-11-05

    申请号:CN202110908494.3

    申请日:2021-08-09

    Abstract: 本发明提出一种基于动态注意力与图网络推理的视频问答系统、方法、计算机及存储介质,属于计算机视觉和自然语言处理交叉领域。首先,计算物体空间特征和物体类别特征;其次,提取子视频的视觉运动特征;再其次,将物体空间、物体类别特征和视觉运动特征进行特征融合得到物体联合特征;再其次,对问题进行编码,获得问题特征,再其次,将物体联合特征和问题特征输入注意力模型中得到具有问题意识的联合特征;再其次,获得具有问题意识的物体关系特征;再其次,获得具有时序关系的视频特征;最后,得到融合特征生成答案。本发明解决了现有的视频问答系统不能有效地表示不同模态、同模态之间的关联程度和不能有针对性获取不同物体运动信息的问题。

    小样本图像分类的系统、方法、设备及存储介质

    公开(公告)号:CN113592008B

    公开(公告)日:2022-05-31

    申请号:CN202110896070.X

    申请日:2021-08-05

    Abstract: 本申请公开了一种基于自编码器的图神经网络机制解决小样本图像分类的系统、方法、设备及存储介质,属于计算机视觉技术领域。解决了现有技术中无法同时利用样本类内与类间分布情况的不足。本申请1)针对于基类数据集,依据重构损失最小化准则,训练一个自编码器,学习类内样本间的差异信息。2)将支持集的样本输入到自编码器中,为支持集生成更多的重构样本。3)将支持集的样本、重构样本和查询集样本一起训练出图神经网络,用来对查询集样本节点进行边标签的预测,进而预测节点所属的类别。本申请提高了小样本情况下模型的性能和泛化能力。

    一种基于知识蒸馏的不良图片识别系统、方法、计算机及存储介质

    公开(公告)号:CN113592007A

    公开(公告)日:2021-11-02

    申请号:CN202110896069.7

    申请日:2021-08-05

    Abstract: 一种基于知识蒸馏的不良图片识别系统、方法、计算机及存储介质,属于图片检测技术领域。本发明包括首先利用图片数据增强方式对训练数据集进行数据增强,然后利用数据增强后的图片数据集训练基于图片全局特征进行识别的教师神经网络T1,利用数据增强后的图片数据集训练基于图片语义特征进行识别的教师神经网络T2,然后利用教师神经网络T1、T2,结合类别预测损失函数,特征注意力蒸馏损失函数,语义蒸馏损失函数训练学生神经网络,最后将待预测的图片输入到已训练完毕的学生神经网络中进行不良图片识别。本发明在不良图片识别问题中相比于传统方法准确率更高,识别速度更快。

    一种基于自适应分块与概率重分配的图像分割方法

    公开(公告)号:CN118628734A

    公开(公告)日:2024-09-10

    申请号:CN202410663602.9

    申请日:2024-05-27

    Abstract: 本发明提出一种基于自适应分块与概率重分配的图像分割方法,属于图像分割技术领域。包括:S1.初始化高斯混合模型参数与每个像素的分割类别初始估计值;S2.对待分割图像使用固定形状的滑动窗口进行固定分块划分;S3.将待分割图像转换为灰度图像,计算每个像素邻域范围内的方差,生成每个像素的匹配度向量,选取匹配度向量中最小值的区域块与对应像素建立映射关系和像素‑块区域似然矩阵;S4、得到待分割图像的后验概率及本轮图像分割结果;S5.将待分割图像的后验概率按照像素与区域块的映射关系分配到区域块中的每个像素,对模型参数进行更新;S6.重复S2至S5,直至收敛。本发明有效提升整体分割的准确度和一致性。

    基于多模态渐进式注意力模型解决视频问答任务的方法

    公开(公告)号:CN113688296B

    公开(公告)日:2022-05-31

    申请号:CN202110915934.8

    申请日:2021-08-10

    Abstract: 本发明的实施方式提供了一种基于多模态渐进式注意力模型解决视频问答任务的方法。该方法包括:一、针对视频问答任务中的多种模态信息,分别提取多种模态特征;二、利用问题对提取到的多种模态特征进行初步关注并计算相应的权重得分,再利用问题对重要模态特征进行迭代关注以定位到与问题最相关的模态特征;三、利用多模态融合算法实现特征的跨模态融合,再利用问题对视频的多模态融合表示进行关注,找出与问题相关的重要视频特征;四、将模型的部分有效输出结果进行融合,用于答案生成。相比现有的视频问答解决方案,本发明能够更精准地定位到与问题相关的视频帧或视频画面区域。本发明在视频问答任务中取得的效果相比于传统的方法更好。

    一种缩短时间戳网络解决多事件视频问答系统、方法、计算机及存储介质

    公开(公告)号:CN113590879B

    公开(公告)日:2022-05-31

    申请号:CN202110896068.2

    申请日:2021-08-05

    Abstract: 本发明提出一种缩短时间戳网络解决多事件视频问答系统、方法、计算机及存储介质,属于计算机视觉和自然语言处理交叉领域。将视频和字幕提取为多级的事件嵌入,并提取问题和候选答案的特征。利用问题导向的注意力获取不同事件的注意力权重,并利用模糊理论中的截距阵提取视频中的关键事件嵌入。利用问题和答案分别关注不同模态的关键事件嵌入,生成具有问题导向和具有答案导向的上下文信息。自适应地融合问题导向和答案导向的上下文,生成答案。相比于一般视频问答方案,本发明从视频中提取多个事件的多模态嵌入,并利用模糊数学中的截距阵等理论筛选出关键事件,通过去除冗余信息提高了回答的准确性。本发明在视频问答中的效果比于传统方法更好。

    基于原型网络和自编码器的小样本图像分类系统

    公开(公告)号:CN113610151B

    公开(公告)日:2022-05-03

    申请号:CN202110896795.9

    申请日:2021-08-05

    Abstract: 本申请公开了一种基于原型网络的自编码器网络机制解决小样本图像分类的系统、方法、设备及存储介质,属于计算机视觉技术领域。解决了现有技术中无法同时利用样本类内与类间分布情况的不足。本申请1)针对于输入的基类数据集,训练一个基于映射学习的原型网络和编码神经网络,学习出基类的类原型表征,并计算类内样本与类原型表征的距离。2)对于编码后得到的类内样本的相对分布信息,再与类原型表征一起训练出解码神经网络,用来针对于支持集样本与类原型表征的相对分布信息输出一定数量的重构样本。3)将重构样本与支持集样本一起训练一个分类器,以提高小样本图像分类的准确率。本申请提高了分类器的性能和泛化能力。

    基于多模态渐进式注意力模型解决视频问答任务的方法

    公开(公告)号:CN113688296A

    公开(公告)日:2021-11-23

    申请号:CN202110915934.8

    申请日:2021-08-10

    Abstract: 本发明的实施方式提供了一种基于多模态渐进式注意力模型解决视频问答任务的方法。该方法包括:一、针对视频问答任务中的多种模态信息,分别提取多种模态特征;二、利用问题对提取到的多种模态特征进行初步关注并计算相应的权重得分,再利用问题对重要模态特征进行迭代关注以定位到与问题最相关的模态特征;三、利用多模态融合算法实现特征的跨模态融合,再利用问题对视频的多模态融合表示进行关注,找出与问题相关的重要视频特征;四、将模型的部分有效输出结果进行融合,用于答案生成。相比现有的视频问答解决方案,本发明能够更精准地定位到与问题相关的视频帧或视频画面区域。本发明在视频问答任务中取得的效果相比于传统的方法更好。

Patent Agency Ranking