-
公开(公告)号:CN103901891A
公开(公告)日:2014-07-02
申请号:CN201410150310.1
申请日:2014-04-12
Applicant: 复旦大学
IPC: G05D1/02
Abstract: 本发明属于人工智能领域,具体为一种基于层次结构的动态粒子树SLAM算法。本发明算法能有效的提升SLAM算法的稳定性,通过层次化的结构使得概率模型具有两种不同分辨率视角,低分辨率的全局模型有利于全局信息的生成与维护,并且能够保持地图的重叠与闭合,为导航系统生成拓扑图等信息打下基础;另一方面具有较高精度的低层次局部信息能够很好的保持小块区域内的导航精度,并不重复带入累积误差,使得整个算法在长时间运行的状态下仍然保持误差在可接受的水平范围内。动态更新的粒子树可以很好的降低时间、空间复杂度。
-
公开(公告)号:CN103605991A
公开(公告)日:2014-02-26
申请号:CN201310513702.5
申请日:2013-10-28
Applicant: 复旦大学
IPC: G06K9/66
Abstract: 本发明属于计算机视频处理技术领域,具体为一种视频广告的自动检测方法。本发明输入为电视台播放的数字电视信号或本地视频格式,综合采用颜色、纹理和边缘特征,对视频进行镜头分割,关键帧提取,FMPI帧分类,拷贝检测,和疑似广告检测,最终分析出视频中的广告成分。可以用作数字电视转播的广告过滤和解决项目中需要处理视频数据自动标注的问题。本发明采用FMPI关键帧的概念,大大提高了广告拷贝检测的准确率和算法效率,对于疑似广告检测也有了非常可靠的基于FMPI关键帧的特征做分类器的依据。
-
公开(公告)号:CN102354457B
公开(公告)日:2013-10-16
申请号:CN201110325073.4
申请日:2011-10-24
Applicant: 复旦大学
Abstract: 本发明属于数字图像处理及模式识别技术领域,本发明公开了一种基于广义霍夫变换的交通信号灯位置检测方法。本发明以图像序列为输入,使用图像灰度,对图像采用一阶微分算子计算图像梯度信息;建立交通灯形状描述函数,定义从图像点到累加器空间的映射,搜索累加器空间极值获取信号灯的坐标,为交通灯状态识别提供位置信息。本发明能应光照的显著变化,对图像采样偏色造成的影响不敏感,并能应对多种常见形状的交通灯。
-
公开(公告)号:CN103345645A
公开(公告)日:2013-10-09
申请号:CN201310262308.9
申请日:2013-06-27
Applicant: 复旦大学
Abstract: 本发明属于多媒体信息检索技术领域,具体为基于网购平台的商品图像类别预测方法。本发明主要包含六个模块及相关算法,即训练图像的获取,图像特征提取,不相关图像过滤,图像特征训练,多层次图像分类,相关图像选择。本发明基于从网购平台上获取的真实数据,通过大规模数据的训练,能够自动分析图像中商品的类别信息,向用户提供购物指引,从而简化用户在线购物流程,增强用户体验,在图像检索领域具有广泛的应用价值。
-
公开(公告)号:CN101901346B
公开(公告)日:2012-11-21
申请号:CN201010166984.2
申请日:2010-05-06
Applicant: 复旦大学
IPC: G06K9/62
Abstract: 本发明属于数字图像处理技术领域,具体为一种对彩色数字图像进行内容识别的方法。该发明包含图像拷贝检测算法和色情图片识别算法。其中图像拷贝检测算法用级联的方法,先用图像二阶熵的比较缩小在图片库中的范围。再用SSIM算法在缩小的范围内最终得出相似度。色情图片识别算法包括四个弱分类器:皮肤区域比例分类器,人脸个数分类器,不变矩分类器,皮肤区域分布分类器,它们输出4个置信度,组成一个四维特征向量,输入一个强分类器,得到最后结果。强分类器结果越大,内容为色情的概率越大。该系统和方法对互联网管控领域有广发的应用价值。
-
-
公开(公告)号:CN102354457A
公开(公告)日:2012-02-15
申请号:CN201110325073.4
申请日:2011-10-24
Applicant: 复旦大学
Abstract: 本发明属于数字图像处理及模式识别技术领域,本发明公开了一种基于广义霍夫变换的交通信号灯位置检测方法。本发明以图像序列为输入,使用图像灰度,对图像采用一阶微分算子计算图像梯度信息;建立交通灯形状描述函数,定义从图像点到累加器空间的映射,搜索累加器空间极值获取信号灯的坐标,为交通灯状态识别提供位置信息。本发明能应光照的显著变化,对图像采样偏色造成的影响不敏感,并能应对多种常见形状的交通灯。
-
公开(公告)号:CN101901249A
公开(公告)日:2010-12-01
申请号:CN201010184725.2
申请日:2010-05-12
Applicant: 复旦大学
IPC: G06F17/30
Abstract: 本发明属于多媒体信息检索领域,涉及一种在图像检索中实现基于义类词典的查询扩展与排序的方法。该发明包含:基于WordNet的英语词语语义相似度度量算法、基于HowNet的汉语词语语义相似度度量算法、基于扩展规则的查询扩展词选择与优化算法、检索结果的评分与优化算法。本发明方法使用相关的文本处理方法和语义网络词典对图像搜索引擎进行改进,通过语义扩展与用户交互及通过改进的相似度度量对检索结果进行排序。较之于传统方法而言,本发明具有准确率高、完整性强且时空代价低的优点。对于在大规模图像数据集基础上,考虑图像高层语义信息而进行高效图像检索具有非常重要的意义,在跨语言跨媒体检索领域具有广泛的应用价值。
-
-
公开(公告)号:CN119295574A
公开(公告)日:2025-01-10
申请号:CN202411156542.8
申请日:2024-08-22
Applicant: 复旦大学
IPC: G06T11/00 , G06T3/04 , G06V40/16 , G06V10/26 , G06V10/44 , G06N3/0455 , G06N3/0464 , G06N3/0475
Abstract: 本发明公开了一种基于扩散模型的通用风格人物图像定制生成方法;该方法的生成过程分为两个连续的阶段:语义场景构建和概念特征注入;第一阶段,参考感知自注意力RSA使潜在图像能够同时从所有概念的图像中提取特征,从而获取粗粒度的整体语义理解,以便建立初始的语义布局;第二阶段,首先基于注意力的语义分割方法,准确定位潜在图像中所有概念的生成位置,随后,区域分组混合注意力RBA将潜在图像划分为多个语义组,并使每个组从其对应的参考概念中查询细粒度的特征,以确保精确的属性对齐和特征注入。本发明还采用了权重掩码策略,以确保模型更关注参考的概念特征。本发明方法在以人为中心的图像生成和多概念人像定制方面具有显著优势。
-
-
-
-
-
-
-
-
-