-
公开(公告)号:CN112766378B
公开(公告)日:2023-07-21
申请号:CN202110078446.6
申请日:2021-01-19
Applicant: 北京工商大学
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06V10/46 , G06N3/0464 , G06N3/048 , G06N3/096
Abstract: 本发明公布了一种专注细粒度识别的跨域小样本图像分类模型方法,构建专注细粒度识别的跨域小样本分类模型FFGR,FFGR模型采用两步识别的方法,包括图像特征提取模块MFFE和图像特征分类识别模块BMF;通过前端专注特征编码器提取图像特征,再通过后端双线性度量函数利用图像特征进行图像分类识别。采用本发明方法,能够更快速并高效地提取到小样本图像特征信息,模型整体优化更加快捷精准,分类准确率高。
-
公开(公告)号:CN112215958B
公开(公告)日:2023-05-02
申请号:CN202011076160.6
申请日:2020-10-10
Applicant: 北京工商大学 , 南京数联空间测绘科技有限公司
IPC: G06T17/20 , G06F16/51 , G06F16/182
Abstract: 本发明提出一种基于分布式计算的激光雷达点云数据投影方法,步骤为:建立投影空间的坐标模型;获取激光雷达点云数据并清洗噪点数据;根据里程信息将点云数据切分成数据块,分发到计算节点上;将每个数据块的点云数据投影生成正射投影灰度图像;计算每个隧道实测点在断面坐标系中的空间特征值Rn;为正射投影灰度图像增加空间特征通道,生成所需尺度的多维特征融合的图像矩阵。本发明将点云数据高效处理为包含表面和空间特征的多维特征图像矩阵,有利于提高隧道变形和缺陷检测的准确率,具有更高的应用价值及经济效益。
-
公开(公告)号:CN111476302B
公开(公告)日:2023-03-24
申请号:CN202010269277.X
申请日:2020-04-08
Applicant: 北京工商大学 , 煤科集团沈阳研究院有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/25 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公布了一种基于深度强化学习的Faster‑RCNN目标物体检测方法,采用深度强化学习的经验池保存每个时刻的区域建议网络RPN的状态,采用卷积门控循环单元输出两个动作,采用随机策略选择执行相应的动作,同时采用自定义的非极大值抑制方法去除冗余的检测框,获得与标注框最接近的检测框;采用分类网络对检测框进行分类,对检测框进行二次回归,实现对目标物体的检测与识别。采用本发明技术方案,目标定位准确,目标检测精度高。
-
公开(公告)号:CN115329951A
公开(公告)日:2022-11-11
申请号:CN202211112093.8
申请日:2022-09-13
Applicant: 北京工商大学
Abstract: 本发明涉及一种用于卷积神经网络快速卷积运算的FPGA架构,属于FPGA架构技术领域。该架构包括若干Winograd硬核计算单元,Winograd硬核计算单元在FPGA中以宽松方式进行排布;Winograd硬核计算单元包括图像数据变换模块、权重变换模块、基于快速乘法器的点乘模块和输出变换模块;权重转换模块和图像转换模块的输入端接收数据,权重转换模块和图像转换模块的输出端输入到点乘模块,点乘模块的输出端输入到输出转换模块的输入端,输出转换模块的输出端向外输出;宽松方式进行排布,各Winograd硬核计算单元之间均设有FPGA的LB以进行间隔。本发明通过设计Winograd硬核计算单元并将其加入到FPGA上,不同于直接使用FPGA上资源实现Winograd算法,减少了计算时LBs、DSP和FPGA的互联依赖,提高了最大时钟频率。
-
公开(公告)号:CN115328313A
公开(公告)日:2022-11-11
申请号:CN202210985906.8
申请日:2022-08-16
Applicant: 北京工商大学
IPC: G06F3/01 , G06F3/04815 , A61F9/08
Abstract: 本发明公布了一种用于视觉障碍者的避障导航行进系统及方法,基于STM32F427单片机、GPS模块、高清双目摄像头眼镜,设计包括智能眼镜模块、智能避障手套模块和智能手机端的避障导航行进系统;智能手机端中安装用于上传行进目的地的智能手机端导航APP;通过智能眼镜模块进行三维场景重建,并将三维场景重建所得到的信息传输往智能避障手套端并转化为触摸信息;使用者通过智能避障手套所提供的触感指引来进行避障行进。本发明提供的避障导航行进系统符合人体工程学的设计,系统稳定性好,携带方便,实用性高。
-
公开(公告)号:CN112198524B
公开(公告)日:2022-09-23
申请号:CN202011076454.9
申请日:2020-10-10
Applicant: 北京工商大学 , 南京数联空间测绘科技有限公司
IPC: G01S17/89
Abstract: 本发明提出一种基于激光雷达扫描点云数据的隧道管缝分析方法,该方法的步骤为:1)提取隧道管缝两侧的断面数据;2)对隧道断面数据进行拟合过滤;3)分析管缝两侧的隧道断面数据得到管缝错台量字典;4)筛选管缝的错台弧;5)生成管缝分析断面图。本发明的优点是根据轨道检测小车获取的里程值、时间、激光雷达扫描的隧道断面数据,对隧道中的管缝两侧的隧道断面进行错台分析;加快了分析时间,提高了分析的准确性和效率,具有更高的应用价值及经济效益。
-
公开(公告)号:CN113241065B
公开(公告)日:2022-05-24
申请号:CN202110512052.7
申请日:2021-05-11
Applicant: 北京工商大学
Abstract: 本发明公布了一种基于视觉面部轮廓运动的构音障碍语音识别方法及系统,系统包括多模态数据获取、多模态融合特征计算、多模态语音识别计算和语言模型计算模块;多模态数据获取算模块用于获取构音障碍者的面部轮廓运动视频数据和与视频同步的语音数据;多模态融合特征计算模块用于融合面部轮廓运动特征和语音声学特征;多模态语音识别计算模块用于获得由多模态特征到音素字符的映射关系;语言模型计算模块用于获得由音素字符到中文句子的映射关系。本发明通过融合语音声学特征参数与构音障碍者的发音动作得到融合后的多模态特征,利用融合后的多模态特征进行构音障碍语音识别,由此有效地提升构音障碍语音识别准确度。
-
-
-
公开(公告)号:CN113241065A
公开(公告)日:2021-08-10
申请号:CN202110512052.7
申请日:2021-05-11
Applicant: 北京工商大学
Abstract: 本发明公布了一种基于视觉面部轮廓运动的构音障碍语音识别方法及系统,系统包括多模态数据获取、多模态融合特征计算、多模态语音识别计算和语言模型计算模块;多模态数据获取算模块用于获取构音障碍者的面部轮廓运动视频数据和与视频同步的语音数据;多模态融合特征计算模块用于融合面部轮廓运动特征和语音声学特征;多模态语音识别计算模块用于获得由多模态特征到音素字符的映射关系;语言模型计算模块用于获得由音素字符到中文句子的映射关系。本发明通过融合语音声学特征参数与构音障碍者的发音动作得到融合后的多模态特征,利用融合后的多模态特征进行构音障碍语音识别,由此有效地提升构音障碍语音识别准确度。
-
-
-
-
-
-
-
-
-