-
公开(公告)号:CN113066111A
公开(公告)日:2021-07-02
申请号:CN202110274467.5
申请日:2021-03-12
Applicant: 北京工业大学
Abstract: 一种基于CT影像的心脏二尖瓣顶点的自动定位方法属于医学图像解析领域。本发明首先基于深度神经网络对CT图像进行图像预处理,以实现CT图像关键特征提取与表达;然后,利用深度强化学习模型针对基于智能体智能体的CT影像标志点进行定位,对心脏二尖瓣顶点位置进行自动检测。本发明提出了一种最优路径的搜索策略,可以非常方便地在CT图像中实现计算机自动定位心脏二尖瓣顶点的位置供医生进行疾病诊断,同时随着人工指定定位位置的变化,也具备一定的扩展性,在医学图像解析上下文中有利地创建了机器图像理解。
-
公开(公告)号:CN112434553A
公开(公告)日:2021-03-02
申请号:CN202011105896.1
申请日:2020-10-15
Applicant: 北京工业大学
Abstract: 本发明实施例提供一种基于深度字典学习的视频鉴别方法及系统,该方法包括:获取目标视频中的若干关键帧图像;将每一关键帧图像输入到视频指纹生成网络中,获取目标视频的指纹,其中,视频指纹生成网络包括字典,字典用于进行稀疏矩阵的计算;将目标视频的指纹与预设数据库中的每一备用视频的指纹进行匹配,根据匹配结果对目标视频进行鉴别。本发明实施例利用深度学习和多层字典学习提取视频的特征稀疏矩阵,形成视频指纹,并进行指纹数据库的构建和目标视频的指纹匹配,实现对数字视频的鉴别。
-
公开(公告)号:CN111666836A
公开(公告)日:2020-09-15
申请号:CN202010437866.4
申请日:2020-05-22
Applicant: 北京工业大学
Abstract: M-F-Y型轻量化卷积神经网络的高分辨率遥感影像目标检测方法属于遥感领域。本发明首先在轻量化卷积神经网络(CNN)模型MobileNetV3-Small的基础上构建特征金字塔网络结构FPN,对高分辨率遥感影像提取并融合多尺度深度特征,联合利用YOLOv3tiny目标检测框架构建M-F-Y型轻量化卷积神经网络;之后通过构建互补注意力网络结构,抑制复杂背景同时提升对目标的空间位置信息的关注;最后使用基于迁移学习的滤波器嫁接策略训练模型,实现高分辨率遥感影像目标检测。本发明可以在提高高分辨率遥感影像目标检测准确率同时,通过更少的参数量以及更低的延迟减少对平台高速计算力的约束,为高分辨率遥感影像目标检测的实用化提供技术积累。
-
公开(公告)号:CN111128196A
公开(公告)日:2020-05-08
申请号:CN201911243498.3
申请日:2019-12-06
Applicant: 北京工业大学
Abstract: 本发明实施例提供一种基于声纹特征识别主播的方法及装置,其中方法包括:从待识别主播的直播视频中截取若干帧音频信息,根据预先训练的神经网络模型,从所述若干帧音频信息中提取待识别主播的声纹特征;根据局部敏感哈希方法将所述声纹特征存储至预先生成的哈希桶中,将与所述声纹特征处于同一哈希桶内的至少一个特征作为待匹配的样本主播的声纹特征;计算所述样本主播的声纹特征与所述待识别主播的声纹特征间的相似度,将相似度最高的样本主播作为所述待识别主播。本发明实施例适应直播条件下识别主播的要求。
-
公开(公告)号:CN110378882A
公开(公告)日:2019-10-25
申请号:CN201910616863.4
申请日:2019-07-09
Applicant: 北京工业大学
Abstract: 一种多层级深度特征融合的中医舌质颜色分类方法属于计算机视觉领域和中医舌诊诊领域,具体涉及深度学习、图像处理等技术。本发明以人体舌图像为研究对象,在全面分析人体舌质颜色特征的基础上,将深度学习的理论知识应用于舌质颜色特征分类中,提出一种基于多层级深度特征融合的中医舌质颜色分类方法。该方法通过进行多层特征融合以增加特征的多样性,以融合后的特征进行分类模型训练,以提高中医舌质颜色分类的准确性和鲁棒性。
-
公开(公告)号:CN109840509A
公开(公告)日:2019-06-04
申请号:CN201910119305.7
申请日:2019-02-15
Applicant: 北京工业大学
Abstract: 本发明提供了一种网络直播视频中不良主播的多层次协同识别方法及装置,涉及视频处理的技术领域,包括:从目标视频中提取图像样本、弹幕样本和语音样本;根据图像样本、弹幕样本和语音样本分别计算出图像分类序列、语音分类序列和弹幕分类序列;根据D-S证据理论对图像分类序列、语音分类序列和弹幕分类序列进行融合处理,生成视频分类序列;根据视频分类序列识别出目标视频的行为分类。通过融合图像、语音和弹幕三个识别结果,提高了视频识别的鲁棒性,提高了网络直播视频中主播的不良行为的识别精度。
-
公开(公告)号:CN109740684A
公开(公告)日:2019-05-10
申请号:CN201910018484.5
申请日:2019-01-08
Applicant: 北京工业大学
Abstract: 本发明提供了一种共享单车入栏检测方法及装置,涉及共享单车的技术领域,所述方法包括获取围栏的边界坐标定位数据,以及获取共享单车的多个定位数据;研制数据筛选算法对数据进行预处理,以去除粗大误差及异常值;研制基于K均值的单车位置估计算法,采用K均值聚类算法对共享单车的多个定位数据进行聚类处理,以获取最接近共享单车真实停放位置的一个定位信息;根据研制的入栏检测算法计算共享单车定位数据是否在围栏边界定位数据范围内,以判断共享单车是否入栏;本发明能够准确定位共享单车,从而能够准确检测出共享单车是否入栏,为规范管理共享单车停放提供依据和标准。
-
公开(公告)号:CN109581018A
公开(公告)日:2019-04-05
申请号:CN201910018558.5
申请日:2019-01-08
Applicant: 北京工业大学
IPC: G01R13/02
Abstract: 本发明提供了一种宽带取样示波器时基误差同步补偿方法及装置,涉及宽度取样示波器技术领域,所述方法包括:同步触发被测信号和两个近似正交的参考信号,将参考信号和被测信号同时接入宽带取样示波器并进行采样;根据两个近似正交的参考信号构建误差模型,根据误差模型和正交距离回归数学模型构建宽带取样示波器的时基误差估计模型;根据时基误差估计模型计算时基误差估计值;根据时基误差估计值对被测信号的时基误差进行补偿;本发明能够对时基误差进行准确估计和补偿,有效提高宽带取样示波器的测量精准度,使得测量结果具有较小的不确定性。
-
公开(公告)号:CN106446015A
公开(公告)日:2017-02-22
申请号:CN201610750490.6
申请日:2016-08-29
Applicant: 北京工业大学
Abstract: 本发明公开一种基于用户行为偏好的视频内容访问预测与推荐方法,首先,通过聚类技术实现镜头边缘检测和提取视频的关键帧,然后基于用户评分数据,采用深度学习技术CNN学习视频关键帧的深度视觉特征,并进一步基于深度视觉特征向量来表征视频内容。然后通过多级贝叶斯模型构建用户行为偏好模型。最后基于用户行为偏好模型,采用线性回归技术实现视频内容访问预测与推荐。采用本发明的技术方案,有效提高了个性化视频推荐的准确度。
-
公开(公告)号:CN103744976B
公开(公告)日:2017-02-22
申请号:CN201410014056.2
申请日:2014-01-13
Applicant: 北京工业大学
Abstract: 本发明涉及一种基于同态加密的图像安全检索方法。首先提取图像的颜色、纹理和形状等特征,并利用LPP方法对图像特征降维;然后采用Paillier同态加密算法对特征进行保护;最后直接对加密后的图像特征进行相似性匹配,将最相似的K幅图像作为检索结果反馈给用户。本发明基于CBIR框架,采取同态加密技术,无需解密,而是利用Paillier加密算法的同态特性,对加密后的图像特征直接进行相似度度量。克服了现有的图像检索方法无法对加密后的图像直接进行检索的不足。实验结果表明,本发明能够在保证图像信息安全性的前提下,得到与原来明文域CBIR方法完全一致的检索结果,加密不会影响图像的检索性能。
-
-
-
-
-
-
-
-
-