一种无标记平面物体识别的优化算法

    公开(公告)号:CN103903013A

    公开(公告)日:2014-07-02

    申请号:CN201410151036.X

    申请日:2014-04-15

    Applicant: 复旦大学

    Abstract: 本发明属于统计模式识别与图像处理技术领域,具体为一种无标记平面物体识别的优化算法。本发明以局部特征关键点作为无标记物体的特征,采用二分类的决策算法分别在离线训练和实时识别阶段开始阶段进行特征提取;使用随机Ferns分类器对关键点进行离线训练;识别阶段采用随机抽样一致性算法得到物体在实时帧中的位置与姿态;将计算所得目标物体位姿信息附加在虚拟物体上,叠加在真实场景中完成增强现实系统。本发明主要两点优化:特征检测阶段,对关键点进行加权筛选;识别阶段,采用改进后的ARANSAC拟合算法将初始随机集合中的内点比例增大,提高拟合的性能。本发明较之基线算法在各方面性能都得到极大提升,可满足增强现实系统的实时性、可靠性要求。

    基于机器学习的农药喷洒检测方法

    公开(公告)号:CN103699907A

    公开(公告)日:2014-04-02

    申请号:CN201410002727.3

    申请日:2014-01-04

    Applicant: 复旦大学

    Inventor: 冯瑞 李斌 蒋龙泉

    Abstract: 本发明属于数字图像处理及模式识别技术领域,具体为一种基于机器学习的农药喷洒检测方法。本发明先在农业作业场景的监控视频中,获取大量务农人员背着农药箱和不背农药箱进行走动的视频,采用较适合刚性物体检测的方法检测农药箱;从视频中各抽取部分图片作为样本,对每个抽取的图片中的农药箱图像进行特征提取,将这些特征组合成特征向量;然后对每幅特征向量用Adaboost的方法进行级联训练,形成一个Adaboost级联分类器,然后将大量的包含或不包含农药箱的图像用该分类器检测图像中是否存在农药箱。本发明具有高实时性和高易实施性,解决了需要实体考察才能判断是否有人在喷洒农药以及农药喷洒效果的弊端。

    对道路图像进行车牌识别的方法和系统

    公开(公告)号:CN101872416B

    公开(公告)日:2013-05-01

    申请号:CN201010166981.9

    申请日:2010-05-06

    Applicant: 复旦大学

    Abstract: 描述了一种进行车牌识别的方法和系统,该方法可以为智能交通系统提供支持,并能广泛应用在停车场,收费卡口,刑事缉拿等方面。方法主要包括定位、字符分割、字符识别三个阶段。有较高的识别率,能够应对较复杂的环境并能达到实时处理的要求。系统封装了上述方法,并提供了不同的参数,可灵活使用。便于分布,批量处理数据。

    基于分块一致LBP和稀疏编码的单训练样本人脸识别方法

    公开(公告)号:CN102799870A

    公开(公告)日:2012-11-28

    申请号:CN201210241541.4

    申请日:2012-07-13

    Applicant: 复旦大学

    Abstract: 本发明属于数字图像处理及模式识别技术领域,具体为一种基于分块一致LBP和稀疏编码的人脸识别方法。本发明首先将人脸图像按4*4分割成等大小的16块子区域,对于每块区域计算其1像素半径、8邻居的一致LBP直方图,再将16个子区域的LBP直方图连接成一个列向量,作为单幅人脸图像的特征向量。然后将通过将测试图像表示成训练集上的一个最稀疏线性组合,识别出人脸对象。相比于传统的特征提取和分类的算法,本发明能够更好的提取人脸的结构信息,并且能够在单训练样本和存在遮挡的情况下,表现出较高的识别率和鲁棒性。

    一种基于Zernike矩的压缩域音频指纹方法

    公开(公告)号:CN101882439A

    公开(公告)日:2010-11-10

    申请号:CN201010197996.1

    申请日:2010-06-10

    Applicant: 复旦大学

    Abstract: 本发明属于基于内容的音乐检索技术领域,具体为一种基于Zernike矩的压缩域音频指纹方法。本发明巧妙地将MP3压缩域数据的修正离散余弦变换系数(MDCT系数)的频率和时间信息,与Zernike矩的一些特性相结合,如:低阶矩代表信号的整体特性,高阶矩代表信号细节特性;Zernike矩有着旋转,缩放和平移的不变性特性,使最终构成的音频压缩域指纹能够鲁棒的抵抗时间域的众多信号处理和轻微的抵抗时间域信号处理。

    一种基于视频的过境车辆快速检测方法

    公开(公告)号:CN101872546A

    公开(公告)日:2010-10-27

    申请号:CN201010167001.7

    申请日:2010-05-06

    Applicant: 复旦大学

    Abstract: 本发明属于交通监视、视频处理技术领域,具体公开了一种基于视频的过境车辆快速检测方法。该方法采用背景差法、梯度帧间差法和帧间差法,同时消除白天阴影、呼吸效应以及晚上前大灯地面反射光等影响,精确检测运动物体位置,判断运动物体所处车道。实验结果表明,本方法能够克服传统方法中运算量较大的缺点,满足电子警察视频车辆检测的实时性要求,能够对场景中的车辆进行精确检测,对光线变化、阴影等干扰,具有较好的鲁棒性。

    智能学习、娱乐机器人玩伴

    公开(公告)号:CN101036838A

    公开(公告)日:2007-09-19

    申请号:CN200710039652.6

    申请日:2007-04-19

    Applicant: 复旦大学

    Abstract: 本发明属于机器人技术领域,具体涉及一种具备丰富的运动自由度、并能智能控制的机器人,是一种与智能机器人紧密结合的新型学习、娱乐平台。机器人本体结构包括头颈、手臂、躯体、底座等结构,具备9个独立的运动自由度。系统采用PID反馈控制,能够精确控制伺服电机的速度,从而控制各关节的速度、方向和位置。这是一个标准的机器人学习和游戏操作交互平台,能够运行多种不同的、能和这个控制台的标准接口相兼容的应用程序,主要包括学习、游戏程序和机器人本身的学习程序。本发明将移动式的拟人机器人与学习、娱乐等相结合,用户可以通过视频、音频等信息与机器人进行交互,在学习和娱乐的过程中,机器人可以进行肢体动作和语音交流。

    一种基于视听觉多模态的视频音源分离方法

    公开(公告)号:CN114446317B

    公开(公告)日:2025-04-04

    申请号:CN202210093434.5

    申请日:2022-01-26

    Applicant: 复旦大学

    Abstract: 本发明公开了一种基于视听觉多模态的视频音源分离方法,具有这样的特征,包括以下步骤:步骤1,对视频的视觉信息和听觉信息进行特征提取,得到视觉标签和听觉特征;步骤2,将视觉标签和听觉特征放入多实例多标签网络,得到听觉特征与视觉标签的关联值;步骤3,将视频和关联值放入音源分离网络中,得到每一个对象的单独声音,其中,步骤2中,多实例多标签网络的训练包括以下步骤:步骤2‑1,构建初始多实例多标签网络;步骤2‑2,将一个视频中所得到的所有音频特征向量作为训练集放入多实例多标签网络中训练,得到每个音频特征向量和所有视觉对象的关联特征图。

    一种弱光环境下的人脸表情捕捉方法及装置

    公开(公告)号:CN114519883B

    公开(公告)日:2025-02-18

    申请号:CN202210142311.6

    申请日:2022-02-16

    Applicant: 复旦大学

    Inventor: 张峰 赵瑞玮 冯瑞

    Abstract: 本发明提供一种弱光环境下的人脸表情捕捉方法及装置,能够在复杂环境的视频流中对不同的尺度的座位实现精确框定,并基于此框定结果检测提取脸部特征用于识别表情。其特征在于,包括以下步骤:步骤S1,获取待测影院内的俯视角度的视频流;步骤S2,基于影院座椅定位模型对视频流进行检测,得到待测影院内所有座椅最新位置的标注框;步骤S3,使用表情识别分类模型对所有标注框进行人脸定位和表情识别,从而得到待测影院内的观众的人脸表情类别。其中,影院座椅定位模型以ResNet50和FPN结合的网络作为Backbone,并加入CBAM模块以构建影院座椅定位初始网络并对该初始网络进行训练得到,表情识别分类模型基于构建并训练改进VGGNet和改进Focal Loss结合的人脸表情识别算法得到。

    点云立柱三维目标检测方法及装置
    170.
    发明公开

    公开(公告)号:CN118537842A

    公开(公告)日:2024-08-23

    申请号:CN202410778207.5

    申请日:2024-06-17

    Applicant: 复旦大学

    Inventor: 静琦 冯瑞 陈荣华

    Abstract: 本发明提供了一种点云立柱三维目标检测方法及装置,具有这样的特征,三维目标检测模型包括:立柱特征编码模块用得到伪图像;伪图像特征提取模块用于对伪图像进行特征提取得到特征向量;边界框预测模块用于根据特征向量得到目标检测结果,伪图像特征提取模块包括:下采样单元用于对伪图像进行多次下采样得到下采样特征图;第一上采样单元用于对下采样特征图进行多次上采样和跳跃连接,得到上采样特征图;第二上采样单元,用于分别将最小尺寸的下采样特征图和各个上采样特征图上采样至预设维度,得到对应的采样特征图;连接单元,用于将所有采样特征图进行串联,得到特征向量。总之,本方法能够提高根据点云数据进行目标检测的准确率。

Patent Agency Ranking