-
公开(公告)号:CN119580336A
公开(公告)日:2025-03-07
申请号:CN202411553711.1
申请日:2024-11-03
Applicant: 北京工业大学
IPC: G06V40/18 , G06V10/26 , G06V10/32 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/084
Abstract: 一种基于多层次信息融合的人眼图像分割方法属于计算机视觉领域。针对现有方法分割类别复杂易混淆、泛化能力较差的问题,本发明引入基于图像金字塔和图像补丁的多尺度输入,并结合CNN和Transformer结构的优势,现不同层次的感受野大小,学习眼部图像各类的复杂上下文关系;同时,考虑到不同人眼图像数据集的域差异,我们采用了对抗训练策略,进一步强化了模型的鲁棒性。
-
公开(公告)号:CN114549492B
公开(公告)日:2024-05-31
申请号:CN202210183020.1
申请日:2022-02-27
Applicant: 北京工业大学
Abstract: 一种基于多粒度图像信息内容的图像质量评价方法,属于计算机视觉领域。针对图像局部纹理信息的质量评价模块,首先将单颗花粉图像集合中每张花粉颗粒图片针对不同方向进行纹理特征的提取,然后平均加权求和求每张花粉颗粒图片的总纹理特征分数,其次将其纹理评价指标平均加权求和作为单颗花粉基于图像纹理内容信息的质量评价得分,之后将所有花粉颗粒得分进行平均加权求和作为基于图像局部纹理信息的质量评价得分。最终,我们将图像全局内容信息的质量分数和图像局部纹理信息的质量分数进行加权求和来得到花粉图片的最终得分。本发明更关注花粉颗粒质量的效果,比以往只考虑基于粗粒度的图像内容信息质量评价结果更加准确。
-
公开(公告)号:CN118095282A
公开(公告)日:2024-05-28
申请号:CN202410172725.2
申请日:2024-02-07
Applicant: 北京工业大学
IPC: G06F40/295 , G06F40/284 , G06N3/0442 , G06N3/045 , G06N3/09
Abstract: 一种基于分层样本进行命名实体识别的方法,属于自然语言处理领域。该方法包括四个模块:数据预处理模块、粗粒度实体筛选模块、样本分层处理模块以及细粒度实体分类模块。首先,通过数据预处理模块对原始数据进行处理及标注。然后,利用粗粒度实体筛选模块训练BiLSTM和CRF组合模型获得实体类别预测置信度,指导样本粗粒度分类。之后,利用样本分层处理模块,结合置信度,进一步对初筛后的粗粒度样本划分为多层次类型:易样本、难样本和误判样本的处理。最后,细粒度实体分类模块将分类处理后的样本输入CRF网络进行实体标签的细粒度分类。此方法利用了外部知识且有针对性的使用词汇增强显著提高了命名实体识别的准确性和鲁棒性。
-
公开(公告)号:CN116883710A
公开(公告)日:2023-10-13
申请号:CN202310304844.4
申请日:2023-03-27
Applicant: 北京工业大学
IPC: G06V10/764 , G06V10/82 , G06V10/774 , G06V10/26 , G06V10/44 , G06V10/46 , G06V20/69
Abstract: 一种基于位置‑边界信息引导的图像对象分割方法属于计算机视觉领域。本发明通过结合两个模块的信息获得花粉分割图像:目标定位模块通过图像级标签训练的分类网络获得定位图,提供准确的位置信息;边界引导模块利用花粉轮廓先验知识匹配目标花粉获得显著图,得到细粒度的边界信息。本方法可以充分利用两者之间的互补关系,获得准确的目标花粉边界,并丢弃非目标对象(如杂质)像素,显著提高花粉图像分割质量。
-
公开(公告)号:CN113723426A
公开(公告)日:2021-11-30
申请号:CN202110857669.2
申请日:2021-07-28
Applicant: 北京工业大学
Abstract: 本发明提供一种基于深度多流神经网络的图像分类方法及装置,方法包括:获取特定领域的待分类图像以及待分类图像对应的文本数据;提取待分类图像的图像特征;提取待分类图像对应的文本数据的语义特征;将图像特征和语义特征,输入至少两个网络分支,获得各网络分支分别对应的分类阈值;基于分类阈值,确定待分类图像的标签。本发明用以解决现有技术中针对特定领域,仅能检测单一标签的图像的缺陷。
-
公开(公告)号:CN119579986A
公开(公告)日:2025-03-07
申请号:CN202411675594.6
申请日:2024-11-21
Applicant: 北京工业大学
IPC: G06V10/764 , G06V10/80 , G06V10/52 , G06V10/82 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/09
Abstract: 一种基于渐进式特征学习的多目标图像识别方法,属于图像识别领域。该方法:(1)图像增强预处理:构建质量分类器自动筛选出需要进行质量优化的模糊图像,然后使用循环一致性生成对抗网络完成模糊图像域到清晰图像域的复原。(2)多尺度融合的关键目标定位:采用多尺度特征金字塔融合高层特征图和低层特征图不同特征尺度上所蕴含的互补信息,实现对图像中每一个关键目标的精确定位,从而确保每一个关键目标都能作为一个独立的样本被分析识别。(3)领域知识引导的目标分类:本发明将领域知识(包括颜色和轮廓两种),结合注意力机制将领域知识嵌入到图像分类模型中,增强分类模型对关键特征的捕捉能力,从而获得准确的类别预测结果。
-
公开(公告)号:CN119445642A
公开(公告)日:2025-02-14
申请号:CN202411374955.3
申请日:2024-09-30
Applicant: 北京工业大学
IPC: G06V40/18 , G06V10/26 , G06N3/0464
Abstract: 一种基于拓扑交并约束损失的人眼多类分割方法属于计算机视觉领域,解决不同标签之间的拓扑结构表示。在分割模型的基础上,引入人体眼睛结构的先验知识,以拓扑交并约束损失函数形式来指导多类标签的分割图像。分割模型外部再接入一个最大池化层,在最大池化层中引入拓扑约束,最大池化差异和拓扑区域约束组成拓扑交并约束损失。此损失分为两个模块,模块一是最大池化差异,包括归一化输入和目标张量,以及使用不同的内核和步幅对预测图像和标注图像进行最大池化,计算池化预测与各通道标签的差值。模块二是拓扑区域约束,引入附加拓扑条件保证巩膜包含虹膜,虹膜包含瞳孔,巩膜与瞳孔互斥。将池化差异和拓扑约束组合成最终的拓扑交并约束损失。
-
公开(公告)号:CN118644670A
公开(公告)日:2024-09-13
申请号:CN202311297475.7
申请日:2023-10-09
Applicant: 北京工业大学
IPC: G06V10/26 , G06V10/764 , G06V10/25 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/09
Abstract: 一种基于高显著特征逐步失活的弱监督语义分割方法,属于计算机视觉领域。首先将图像分为三个不同尺度:包括分类网络和分割网络。其中分类网络输入的是中尺度图像,功能是生成CAM图,训练过程中通过使用改进的PDA方法减小CAM中高显著特征的激活值,从而减少最具鉴别性区域的贡献,使得分类网络更关注其他区域的同时不会忽略最具鉴别性区域的特征,然后通过加权后的特征图进行分类,以此扩大分类网络生成的CAM图的显著区域,从而得到更准确的CAM图,最终分类网络的输出是优化的CAM图。分割网络的输入是三个不同尺度的图像,其基于U‑Net网络,由3个编码器和1个解码器组成。在解码阶段,网络将三个尺度的特征进行融合,获得更好的分割性能。
-
公开(公告)号:CN118097233A
公开(公告)日:2024-05-28
申请号:CN202410096615.2
申请日:2024-01-23
Applicant: 北京工业大学
IPC: G06V10/764 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/09 , G06N3/096 , G06V10/30 , G06V10/54 , G06V10/74 , G06V10/34
Abstract: 一种数据与知识联合驱动的图像分类方法,属于计算机视觉领域。本发明包括:(1)目标对象定位:(2)形状‑纹理感知:设计预定义的特征提取器来提取目标对象的形状和纹理特征,从而分别得到形状和纹理的特征图和特征向量。这些特征被用于构建两种类型的先验知识:将形状特征图和纹理特征图进行融合以得到形状‑纹理注意力图;基于形状特征向量和纹理特征向量,通过模板匹配来获得目标对象的类间相似度。(3)图像分类:使用卷积神经网络完成图像分类任务。本发明设计预定义的特征提取器提取目标对象的形状和纹理,这些特征将被作为先验知识指导深度网络聚焦于图像的关键区域、提高深度模型对关键特征的关注程度,从而提升图像识别性能。
-
公开(公告)号:CN118097138A
公开(公告)日:2024-05-28
申请号:CN202410175513.X
申请日:2024-02-07
Applicant: 北京工业大学
IPC: G06V10/26 , G06V10/30 , G06V10/34 , G06V10/44 , G06V10/46 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/088 , G06N3/0895 , G06N3/092
Abstract: 一种基于协同增强学习的小目标分割与分类方法属于计算机视觉中的图像处理领域。本发明充分利用小目标分割和小目标分类任务之间的关联性,以协同优化的方式同时增强分割与分类任务的性能。具体来说,该方法首先利用改进的无监督小目标掩膜提取和基于类激活增强的弱监督小目标分割生成小目标对象融合掩膜,实现了有限的分类标注信息下获取像素级类别信息,解决了轮廓级别标注稀缺的问题。其次利用融合分割掩膜训练小目标分割模型,实现小目标对象的精细化分割。最后,利充分融合掩膜图像指导分类模型,消除了来自真实世界非目标噪声的干扰,有效帮助分类模型准确识别小目标对象。通过此类分割‑分类协同训练的方式,充分利用两个之间的互补性,实现同时小目标的分割与分类。
-
-
-
-
-
-
-
-
-