-
公开(公告)号:CN103810500A
公开(公告)日:2014-05-21
申请号:CN201410064526.6
申请日:2014-02-25
Applicant: 北京工业大学
Abstract: 本发明涉及基于有监督学习概率主题模型的地点图像识别方法,目的在于更好地解决地点图像识别中由于不同光照和角度、事物变化和运动导致的不确定问题,以及原有LDA模型中随主题数目增加图像的识别率出现过拟合现象进而影响图像的识别率的问题。所述方法包括:图像获取;图像预处理;采用SIFT对图像局部特征进行检测和描述;生成“词袋”;用“词袋”中的词对图像进行描述步骤;本发明采用基于有监督学习的概率主题模型学习图像的潜在主题分布;根据sLDA模型中图像的类别响应函数识别测试集中的未知地点图像。本发明用有监督学习的LDA模型代替原有的LDA模型,在保证实时性的前提下,可以有效提高地点图像的识别率。
-
公开(公告)号:CN103077537A
公开(公告)日:2013-05-01
申请号:CN201310013907.7
申请日:2013-01-15
Applicant: 北京工业大学
IPC: G06T7/20
Abstract: 本发明公开了一种基于L1正则化的实时运动目标跟踪的新方法,包括以下步骤:输入第一帧图像并确定跟踪的目标;初始化跟踪姿态;初始化模板集;进行粒子滤波的粒子初始化;获取下一帧图像,转下一步进行跟踪,直到最后一帧;对图像进行预处理;计算粒子与模板的相似度;将最大观测概率的粒子并进行重采样;遮挡检测;模板更新。通过将琐碎模板的系数的二范数项添加到L1最小化模型中,建立新的最小化模型,在模板更新前使用遮挡检测方法检测目标是否存在遮挡,从而改进目标跟踪的精度;利用导数有界和可解析表示求解新的最小化模型,从而使得新的算法能适用于实时运动目标跟踪。本发明可在保证目标跟踪准确度的同时,使算法满足实际应用的性能要求。
-
公开(公告)号:CN103077530A
公开(公告)日:2013-05-01
申请号:CN201210365994.8
申请日:2012-09-27
Applicant: 北京工业大学
IPC: G06T7/20
Abstract: 一种基于改进混合高斯和图像剪切的运动目标检测方法,属于智能视频监控技术领域,其目的在于克服现有方法存在的问题,提高运动目标检测的准确度与处理速度。本发明实现步骤包括:⑴确定运动区域,本发明提出一种基于灰度差异性的三帧差分及曲线拟合的方法初步确定目标的运动区域,⑵期望最大化(EM)算法初始化,利用基于网格和密度估计的方法确定EM算法的初始值,以减小EM算法对于初始值的依赖,⑶运动目标检测,利用已初始化的EM算法估计混合高斯模型参数,并且仅在剪切出的运动区域上采用混合高斯模型的方法检测运动目标,极大的降低了计算复杂度。本发明可在保证目标检测准确度的同时,使算法满足实际应用的性能要求。
-
公开(公告)号:CN119992534A
公开(公告)日:2025-05-13
申请号:CN202510051371.0
申请日:2025-01-13
Applicant: 北京工业大学
Abstract: 一种基于多源多表示信息融合的3D目标检测方法,涉及智能驾驶感知领域。本发明将输入的3D点云数据体素化,通过体素特征编码层实现体素内逐点特征的聚合;使用DeepLabv3模型作为2D骨干网络提取图像特征;提出了图像特征索引方法,对图像特征和体素特征进行对齐,将体素特征和相应图像特征融合得到多模态特征;使用3D稀疏卷积网络从多模态特征中提取深层特征,将深层特征转化为鸟瞰图特征;通过距离投影将输入的3D点云数据转化为距离视图表示,提出了频率感知的自适应扩张卷积网络,从距离图像中提取多尺度特征;将距离特征转化到鸟瞰图,与从多模态特征得到的鸟瞰图特征拼接进行3D目标检测。本发明提升了3D目标检测精度。
-
公开(公告)号:CN119723501A
公开(公告)日:2025-03-28
申请号:CN202411906590.4
申请日:2024-12-23
Applicant: 北京工业大学
IPC: G06V20/56 , G06V10/44 , G06V10/42 , G06T7/50 , G06V10/771 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464
Abstract: 一种基于三维空间筛选局部体素特征的3D车道线检测方法属于自动驾驶领域。现有方法将前视摄像头特征汇总到网格中构建BEV(鸟瞰图)特征。图像特征转换为体素特征后沿高度维度对三维空间进行扁平化处理为BEV特征时,无法突出不同高度的车道线特征。本发明利用LSS(Lift,Splat,Shoot)预测像素的深度信息,将图像特征转换为三维空间体素特征。基于高度对三维体素特征分层处理,分别进行全局池化和局部池化,提取全局体素特征和局部体素特征进行融合,将融合后的BEV特征。针对车道线在图像中具有细长的特点,在特征提取阶段,提出了基于特征金字塔的条状卷积注意力模块,显著扩大感受野,提升对车道线特征的捕获能力。本发明实现高精度的3D车道线检测。
-
公开(公告)号:CN114612748B
公开(公告)日:2024-06-07
申请号:CN202210296716.5
申请日:2022-03-24
Applicant: 北京工业大学
IPC: G06V10/774 , G06V10/82 , G06F17/16 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于特征解耦的跨模态视频片段检索方法,涉及跨模态视频片段检索领域,包括以下步骤:首先,使用三维卷积神经网络C3D模型提取视频特征,利用LSTM网络提取查询文本的特征;然后,使用视频特征构建相邻特征矩阵,并通过编码器解耦为内容特征矩阵和位置特征矩阵;其次,增强视频内容特征的表达,并对不同的位置特征进行加权,从而降低训练集的长尾分布效应对模型的影响;接着,重构相邻特征矩阵,以学习视频的上下文信息;最后,将重构的相邻特征矩阵与文本特征进行融合,输入全卷积神经网络生成检索结果。模型使用二进制交叉熵焦点损失(Binary Cross Entropy Focal‑loss)作为检索的损失函数,通过反向传播算法完成训练。
-
公开(公告)号:CN112330681B
公开(公告)日:2024-05-28
申请号:CN202011235609.9
申请日:2020-11-06
Applicant: 北京工业大学
IPC: G06T7/10
Abstract: 本发明涉及一种基于注意力机制的轻量级网络实时语义分割方法,用以解决分割精度与分割效率难以达到平衡,不能满足实际应用的问题。包括:图像数据准备;构建基于注意力机制的轻量级实时语义分割网络,提出一种新的非对称编码‑解码网络结构,在编码器中,使用了轻量化模块‑可分离非对称模块,该模块结合了深度可分离非对称卷积和空洞卷积的优点,在保持精度的同时大大降低了计算量;在解码器中设计了一个注意力特征融合模块,将编码器中的特征与解码器中的特征进行融合,将其融合后的的特征经过注意力机制的选择和组合,增强对恢复图像信息有用的特征,有效提高了网络分割的精度;最终利用训练完成的分割网络实现语义分割。
-
公开(公告)号:CN112329794B
公开(公告)日:2024-03-12
申请号:CN202011235688.3
申请日:2020-11-06
Applicant: 北京工业大学
IPC: G06V10/46 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了一种基于双重自注意力机制的图像描述网络,包括特征提取器、双重自注意力模块、解码器。其中,Faster R‑CNN网络作为特征提取器用于提取图像的重要特征。双重自注意力模块由两个自注意力分支组成,利用自注意力机制能够捕获长范围依赖关系的特性分别从空间和通道维度捕获特征的依赖性。解码器由两层LSTM构成,分别为注意层和语言层,注意层来预测生成当前词汇在图像上的注意力分布,语言层生成描述。本发明能自适应地将局部特征与全局相关性结合起来,从而获得图像的上下文信息,有利于生成更精确的描述,提高了描述语句的准确性。
-
公开(公告)号:CN109965869B
公开(公告)日:2021-09-10
申请号:CN201811539310.5
申请日:2018-12-16
Applicant: 北京工业大学
Abstract: 本发明公开了基于脑源域空间的MI‑EEG识别方法,对采集到的运动想象脑电信号进行共平均参考及带通滤波等预处理;使用标准化低分辨率脑电磁断层扫描成像算法对脑电信号进行逆变换,得到脑源域偶极子偶极矩幅值时间序列;使用数据驱动方法,基于偶极子偶极矩幅值大小进行偶极子的初选,并采用连续小波变换对其进行时频分析,实现偶极子的精选及最优时间段的确定;选用一对一共空间模式算法提取偶极子小波系数功率序列特征,并输入到支持向量机中进行分类。本发明提高空间分辨率的同时,使得其时域、频域、空域信息在偶极子的优选、最优时间段的确定,及特征提取中得以充分利用,对于提高计算效率和分类精度具有重要意义。
-
公开(公告)号:CN109241879B
公开(公告)日:2021-06-04
申请号:CN201810956897.3
申请日:2018-08-21
Applicant: 北京工业大学
IPC: G06K9/00
Abstract: 本发明公开了基于加权复合多尺度模糊熵的运动想象脑电信号的特征提取方法,首先,计算MI‑EEG的复合多尺度模糊熵时间序列,根据每个运动想像任务T不同导联的CMFE熵值差异和变化情况确定最优时间段,并将该时间段内的MI‑EEG信号进一步用于特征提取;然后,对CMFE粗粒化过程中不同采样点引入权重因子以获取τ个加权粗粒化序列,再求各粗粒化序列的模糊熵,并将其平均值定义为WCMFE;针对各种运动想像任务T任意导联Ci计算单尺度τ下的WCMFE;确定尺度因子τ的变化范围,计算多个尺度下的WCMFE,依次构造各尺度τ下的特征向量和各类运动想像任务T的特征向量FT,并进一步融合为MI‑EEG的特征向量F,进一步提高了分类准确率。
-
-
-
-
-
-
-
-
-