-
公开(公告)号:CN118114668A
公开(公告)日:2024-05-31
申请号:CN202410172746.4
申请日:2024-02-07
Applicant: 北京工业大学
IPC: G06F40/295 , G06N3/045 , G06N3/084 , G06N3/09
Abstract: 一种基于多粒度和图注意力网络的文档级实体关系抽取的方法,涉及自然语言处理技术的实体关系抽取领域。首先获取文档文本,得到文档中标注好的实体及其相关信息,并构建一个情感参考词表;然后基于文档的层次结构,利用多粒度思想,将文档分为段落、句子、实体等不同的层次,从而构建层次图;基于层次图和图注意力网络,分别进行同粒度节点之间以及不同粒度节点之间的信息交互和更新,然后使用多头注意力机制整合所有粒度节点信息;最后依据整合后的信息进行该文档的实体关系抽取。本发明充分利用文档的层次结构信息,使用图注意力网络在层次图中传递和聚合信息,更全面的捕捉并融合文本中信息,进而有效提高实体关系抽取的准确率。
-
公开(公告)号:CN118038113A
公开(公告)日:2024-05-14
申请号:CN202311351593.1
申请日:2023-10-18
Applicant: 北京工业大学
IPC: G06V10/764 , G06V10/82 , G06V10/762 , G06V10/44 , G06V10/80 , G06N3/0464
Abstract: 本发明提供了一种基于区域关系引导的图像分类方法。本发明包括四个模块:(1)经过CNN模型提取单个图像级特征,获得单个图像级特征矩阵;(2)首先经过CNN模型提取单个图像级特征;其次需要构造相似目标的图表征:基于上述图像级表示特征进行K‑means聚类,获得关键目标的聚类质心,最后通过GCN模型生成关键目标的关系矩阵;(3)在融合模块中,利用矩阵融合的方式将特征提取模块得到的特征矩阵和关系学习模块得到的关系矩阵深度融合;(4)在图像分类器模块,将上述融合后的图像特征输入分类器中的池化操作、归一化、交叉熵损失的三个流程,得到最终的图像分类预测结果。本发明有效解决了类间相似目标之间难以辨别的问题。
-
公开(公告)号:CN116503637A
公开(公告)日:2023-07-28
申请号:CN202310164383.5
申请日:2023-02-24
Applicant: 北京工业大学
IPC: G06V10/764 , G06V10/75 , G06V10/80 , G06V10/82 , G06N3/048 , G06N3/047 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 一种融合序列关系的图像分类方法,属于计算机视觉领域。连续的序列图像显现的图像特征变化可能表现出一定的规律性,在实际应用对序列图像分类时也需要通过观察完整的序列变化来完成。现有的序列图像分类方法只关注单张的图像特征,忽略了图像序列之间的上下文关系,从而对序列图像的分类结果造成很大影响。本发明针对此问题,设计了一种融合序列上下文关系特征的图像分类方法,在关注单张图像特征信息的基础上,更针对性地关注序列图像的上下文信息,结合单张图像和序列关系两方面的信息得出最后的分类结果。我们提出的流程和解决方案具有全面学习序列图像信息的效果,比以往只独立考虑单张图像信息更加准确。
-
公开(公告)号:CN119580336A
公开(公告)日:2025-03-07
申请号:CN202411553711.1
申请日:2024-11-03
Applicant: 北京工业大学
IPC: G06V40/18 , G06V10/26 , G06V10/32 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/084
Abstract: 一种基于多层次信息融合的人眼图像分割方法属于计算机视觉领域。针对现有方法分割类别复杂易混淆、泛化能力较差的问题,本发明引入基于图像金字塔和图像补丁的多尺度输入,并结合CNN和Transformer结构的优势,现不同层次的感受野大小,学习眼部图像各类的复杂上下文关系;同时,考虑到不同人眼图像数据集的域差异,我们采用了对抗训练策略,进一步强化了模型的鲁棒性。
-
公开(公告)号:CN118095282A
公开(公告)日:2024-05-28
申请号:CN202410172725.2
申请日:2024-02-07
Applicant: 北京工业大学
IPC: G06F40/295 , G06F40/284 , G06N3/0442 , G06N3/045 , G06N3/09
Abstract: 一种基于分层样本进行命名实体识别的方法,属于自然语言处理领域。该方法包括四个模块:数据预处理模块、粗粒度实体筛选模块、样本分层处理模块以及细粒度实体分类模块。首先,通过数据预处理模块对原始数据进行处理及标注。然后,利用粗粒度实体筛选模块训练BiLSTM和CRF组合模型获得实体类别预测置信度,指导样本粗粒度分类。之后,利用样本分层处理模块,结合置信度,进一步对初筛后的粗粒度样本划分为多层次类型:易样本、难样本和误判样本的处理。最后,细粒度实体分类模块将分类处理后的样本输入CRF网络进行实体标签的细粒度分类。此方法利用了外部知识且有针对性的使用词汇增强显著提高了命名实体识别的准确性和鲁棒性。
-
公开(公告)号:CN119579986A
公开(公告)日:2025-03-07
申请号:CN202411675594.6
申请日:2024-11-21
Applicant: 北京工业大学
IPC: G06V10/764 , G06V10/80 , G06V10/52 , G06V10/82 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/09
Abstract: 一种基于渐进式特征学习的多目标图像识别方法,属于图像识别领域。该方法:(1)图像增强预处理:构建质量分类器自动筛选出需要进行质量优化的模糊图像,然后使用循环一致性生成对抗网络完成模糊图像域到清晰图像域的复原。(2)多尺度融合的关键目标定位:采用多尺度特征金字塔融合高层特征图和低层特征图不同特征尺度上所蕴含的互补信息,实现对图像中每一个关键目标的精确定位,从而确保每一个关键目标都能作为一个独立的样本被分析识别。(3)领域知识引导的目标分类:本发明将领域知识(包括颜色和轮廓两种),结合注意力机制将领域知识嵌入到图像分类模型中,增强分类模型对关键特征的捕捉能力,从而获得准确的类别预测结果。
-
公开(公告)号:CN119445642A
公开(公告)日:2025-02-14
申请号:CN202411374955.3
申请日:2024-09-30
Applicant: 北京工业大学
IPC: G06V40/18 , G06V10/26 , G06N3/0464
Abstract: 一种基于拓扑交并约束损失的人眼多类分割方法属于计算机视觉领域,解决不同标签之间的拓扑结构表示。在分割模型的基础上,引入人体眼睛结构的先验知识,以拓扑交并约束损失函数形式来指导多类标签的分割图像。分割模型外部再接入一个最大池化层,在最大池化层中引入拓扑约束,最大池化差异和拓扑区域约束组成拓扑交并约束损失。此损失分为两个模块,模块一是最大池化差异,包括归一化输入和目标张量,以及使用不同的内核和步幅对预测图像和标注图像进行最大池化,计算池化预测与各通道标签的差值。模块二是拓扑区域约束,引入附加拓扑条件保证巩膜包含虹膜,虹膜包含瞳孔,巩膜与瞳孔互斥。将池化差异和拓扑约束组合成最终的拓扑交并约束损失。
-
公开(公告)号:CN117974993A
公开(公告)日:2024-05-03
申请号:CN202311262483.8
申请日:2023-09-27
Applicant: 北京工业大学
IPC: G06V10/26 , G06V10/25 , G06V10/762
Abstract: 本发明提供了一种集成二维最优分割的三维图像分割方法,针对像素级别标签收集费时又费力的问题。类激活映射图通过简单地将类激活映射上采样到输入图像的大小,可以识别与特定类别最相关的图像区域。然而,类激活映射方法通常具有两方面问题:一是目标激活不足,即仅覆盖对象的最有区别的部分;二是背景激活过度,指激活了背景区域,导致激活不正确。因此,在二维图像分割层面,本发明首先采用弱监督方法来缓解像素级别标签难以获得的问题。其次,本方法充分考虑了传统无监督方法具有先验知识指导的优势,最终结合两种方法将二者获得的鉴别性区域进行充分融合、优势互补,可以弥补上述类激活映射两个问题的缺点,获得二维层面的最优分割结果。
-
公开(公告)号:CN115546466A
公开(公告)日:2022-12-30
申请号:CN202211201019.3
申请日:2022-09-28
Applicant: 北京工业大学
IPC: G06V10/24 , G06V10/25 , G06V10/764 , G06V10/80
Abstract: 一种基于多尺度显著特征融合的弱监督图像目标定位方法,属于计算机视觉领域。为了解决小目标图像ROI标注工作繁杂、CAM激活不足两个问题,本发明重点关注优化弱监督下分类网络输出类激活图的研究。本发明涉及两个层面的信息融合:①由于卷积神经网络中最底层的特征图语义信息弱但位置信息强,故可与最高层特征图进行融合得到分类网络最终的特征图;②由于分类网络对不同尺度ROI的敏感度不同,其得到的类激活图也有所不同,所以融合不同激活图中互补的对象信息能够完善图像中目标区域的定位,进而产生更准确的伪标签用于分割任务。
-
公开(公告)号:CN119579985A
公开(公告)日:2025-03-07
申请号:CN202411675524.0
申请日:2024-11-21
Applicant: 北京工业大学
IPC: G06V10/764 , G06V10/26 , G06V10/40 , G06V10/75 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/047 , G06N3/082 , G06N3/088
Abstract: 一种基于匹配式分层迁移网络的图像分类方法属于计算机视觉中的图像分类领域。首先,本发明先创建了利用预训练分类模型的中间层特征构建局部结构检测器,以此匹配全局和局部两类图像。其次,基于上述匹配结果,构建分层特征迁移策略分别建立浅层和通用特征迁移网络。对于一般特征来说,本发明直接进行参数共享。对于深度特异特征,构造域鉴别器并使用对抗损失和分类损失的组合来引导深度网络学习域不变特征。通过图像匹配和分层迁移的相互作用,有效提升迁移学习的性能,为图像分类任务提供了强有力的支持。
-
-
-
-
-
-
-
-
-