-
公开(公告)号:CN112364905A
公开(公告)日:2021-02-12
申请号:CN202011204115.4
申请日:2020-11-02
Applicant: 北京工商大学
Abstract: 本申请公开了一种基于注意力机制SENet的Faster R‑CNN食物分类和GL值识别方法。所述方法将获取用户上传至服务器的包含参照物的照片,将食物图片通过基于注意力机制SENet的Faster R‑CNN算法,进行食物检测和识别。注意力机制使特征提取网络能使用全局信息,而不受限于局部小视野信息,同时有效避免由于网络深度增加所引起的梯度消失和退化问题。将食物类别和位置,及参照物位置输入到训练好的线性回归模型中,预测出食物体积。根据食物的类别、升糖指数(Glycemic index,GI),计算出食物的升糖负荷(Glycemic load,GL)值,判断食物的可食用类别,生成食物可食用建议。最后将结果反馈给用户。
-
公开(公告)号:CN112115786A
公开(公告)日:2020-12-22
申请号:CN202010813907.5
申请日:2020-08-13
Applicant: 北京工商大学
Abstract: 本申请公开一种基于注意力U‑net的单目视觉里程计方法及装置。所述方法将获取单目图像序列,将相邻的若干图像依次通过镜头边界识别算法,从连续帧中识别出镜头边界,整个模块使用关键帧进行运算,并使用高斯金字塔对原图像进行降维,减少后续计算量。使用基于注意力的局部特征强化方法,对U‑net自编码网络添加注意力机制,将关键帧序列输入到该网络,首先采用基于注意力的方法来区分纹理区域和平滑区域,当定位高频细节的位置时,注意机构用作特征选择器,其增强高频特征并抑制平滑区域中的噪声。将特征强化后的序列输入到最终的Bi‑LSTM(Bi‑directional Long Short‑Term Memory,双向长短时记忆网络)中,每个时间戳上,根据tn帧大致推测出tn+1帧的图像作为反向序列的输入,根据上下文环境获取每个时间戳的相机位姿。
-
公开(公告)号:CN112100371B
公开(公告)日:2023-10-03
申请号:CN202010808842.5
申请日:2020-08-12
Applicant: 北京工商大学
IPC: G06F16/35 , G06F40/117 , G06F40/205 , G06F40/242 , G06F40/284 , G06F40/289 , G06N3/0464 , G06N3/08
Abstract: 弹幕是目前年轻人常用的互动方式,其中承载了丰富的情感信息。基于此本申请提出一种基于XLNet和BLS弹幕情感分类方法,包括:一、获取弹幕数据并预处理,构建数据集;二、对弹幕进行分词,使用词典编码器对句子进行标记;三、利用XLNet模型进行学习来更新深空间中的任务特定参数;四、将序列G(x)放入广义学习系统中,在广义空间中搜索额外的特征,根据实际的情绪分析任务随机生成映射特征和增强特征,并连接在一起计算样本的标签;五、用训练好的网络对测试样本做情感分类。
-
公开(公告)号:CN112364743A
公开(公告)日:2021-02-12
申请号:CN202011204098.4
申请日:2020-11-02
Applicant: 北京工商大学
IPC: G06K9/00 , H04N21/4788 , G06F16/75 , G06F16/783 , G06F40/143 , G06F40/284
Abstract: 弹幕视频是近年来新兴的一种娱乐互动的产物,对于包含弹幕视频的分类可以使用到这些先验知识,挖掘其中的情感信息以及对视频内容做出预测,本申请为解决上述技术问题,提供了一种基于半监督学习和弹幕分析的视频分类方法。包括:一、获取并预处理弹幕数据集。二、使用一种半监督学习的方式使用少部分标注数据和大量的无标注数据训练模型提取弹幕中的情感和主题信息。三、根据上述的结果来检测视频的内容,并结合时间轴将结果用于生成一种包含情感标签和主题标签的线性序列,通过对比不同视频的上述序列相似度,完成视频分类任务。
-
公开(公告)号:CN112100371A
公开(公告)日:2020-12-18
申请号:CN202010808842.5
申请日:2020-08-12
Applicant: 北京工商大学
IPC: G06F16/35 , G06F40/117 , G06F40/205 , G06F40/242 , G06F40/284 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 弹幕是目前年轻人常用的互动方式,其中承载了丰富的情感信息。基于此本申请提出一种基于XLNet和BLS弹幕情感分类方法,包括:一、获取弹幕数据并预处理,构建数据集;二、对弹幕进行分词,使用词典编码器对句子进行标记;三、利用XLNet模型进行学习来更新深空间中的任务特定参数;四、将序列G(x)放入广义学习系统中,在广义空间中搜索额外的特征,根据实际的情绪分析任务随机生成映射特征和增强特征,并连接在一起计算样本的标签;五、用训练好的网络对测试样本做情感分类。
-
公开(公告)号:CN112115786B
公开(公告)日:2024-08-13
申请号:CN202010813907.5
申请日:2020-08-13
Applicant: 北京工商大学
IPC: G06V20/40 , G06V20/10 , G06V10/82 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/084 , G01C22/00 , G01C21/20
Abstract: 本申请公开一种基于注意力U‑net的单目视觉里程计方法及装置。所述方法将获取单目图像序列,将相邻的若干图像依次通过镜头边界识别算法,从连续帧中识别出镜头边界,整个模块使用关键帧进行运算,并使用高斯金字塔对原图像进行降维,减少后续计算量。使用基于注意力的局部特征强化方法,对U‑net自编码网络添加注意力机制,将关键帧序列输入到该网络,首先采用基于注意力的方法来区分纹理区域和平滑区域,当定位高频细节的位置时,注意机构用作特征选择器,其增强高频特征并抑制平滑区域中的噪声。将特征强化后的序列输入到最终的Bi‑LSTM(Bi‑directional Long Short‑Term Memory,双向长短时记忆网络)中,每个时间戳上,根据tn帧大致推测出tn+1帧的图像作为反向序列的输入,根据上下文环境获取每个时间戳的相机位姿。
-
公开(公告)号:CN112507785A
公开(公告)日:2021-03-16
申请号:CN202011205524.6
申请日:2020-11-02
Applicant: 北京工商大学
IPC: G06K9/00 , G06K9/62 , G06N3/04 , G06N3/08 , G01M13/045
Abstract: 本申请公开了一种基于CNN和LSTM的滚动轴承故障分类方法。获取轴承振动数据并预处理,构建数据集。对处理后的振动数据使用巴特沃斯滤波器(Butterworth Filter)去噪声,并进行快速傅里叶变换(FFT)将预处理的时域信号转化为频域信号。利用CNN网络进行学习来获取时域图、频域图的图像特征,通过Add层进行图像特征融合。将CNN学习获得的图像特征输入到LSTM网络中,通过LSTM网络学习特征中包含的时序特征,通过一个全连接层和Softmax函数实现分类功能。用训练好的网络对测试样本进行故障分类,对滚动轴承微弱故障的早期检测分析具有重要的现实意义和实用价值。
-
-
-
-
-
-