-
公开(公告)号:CN107065586A
公开(公告)日:2017-08-18
申请号:CN201710367540.7
申请日:2017-05-23
Applicant: 中国科学院自动化研究所
IPC: G05B15/02 , G05B19/418
Abstract: 本发明涉及一种交互式智能家庭服务系统及方法,所述系统包括:视频监控单元、语音单元、交互终端和分析服务器。通过对传统的智能家居系统进行改造,使其具备自动感知、自我学习的能力,从而提升设备智能化的交互体验。分析服务器通过根据视觉、听觉、通信数据,对用户场景、身份和行为进行智能分析、进行模式类别切换,主动探知不同情景下用户的需求,智能化地实现交互和服务,并通过分布式的语音交互系统整合不同智能设备的功能,从而实现信息的主动交互,降低结构连接的复杂程度。
-
公开(公告)号:CN103984959B
公开(公告)日:2017-07-21
申请号:CN201410224860.3
申请日:2014-05-26
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于数据与任务驱动的图像分类方法,该方法包括:根据数据集规模与图像内容设计卷积神经网络结构;使用给定分类数据集对卷积神经网络模型进行训练;使用训练后的卷积神经网络对训练集图像提取特征表达;将测试图像输入训练后的卷积神经网络,并进行分类。本发明方法基于非线性卷积特征学习,可以以数据驱动的方式实现模型对数据集的自适应,从而更好的描述特定的数据集,通过任务驱动的方式直接对K近邻的误差进行优化,使其能够在K近邻任务上取得更好的性能;并且在训练阶段可以采用GPU进行高效训练,在测试阶段只需使用CPU就可以实现高效的K近邻图像分类,非常适用于大规模的图像分类、检索等任务。
-
公开(公告)号:CN105894025A
公开(公告)日:2016-08-24
申请号:CN201610195565.9
申请日:2016-03-30
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
CPC classification number: G06K9/6267 , G06K9/6256
Abstract: 本发明公开了一种基于多任务深度学习的自然图像美感质量评估方法。其中,该方法包括步骤1:对所述自然图像进行基于多任务深度学习的美感和语义特征的自动学习;步骤2:针对自动学习的结果,进行基于多任务深度学习的美感分类和语义识别,从而实现对自然图像的美感质量评估。本发明利用语义信息来辅助美感特征的表达学习,从而更加有效地进行美感质量评估,并且设计多种多任务深度学习网络结构来有效地利用美感和语义信息来获得高准确率的图像美感分类。本发明能应用于涉及图像美感质量评估的众多领域,包括图像检索、摄影学及相册管理等。
-
公开(公告)号:CN102509110B
公开(公告)日:2014-04-23
申请号:CN201110325938.7
申请日:2011-10-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于成对约束的在线词典再加权对图像进行分类的方法,包括:对所有训练集图像进行底层特征提取,构建初始视觉词典;采用稀疏编码对提取的底层特征进行特征变换,得到编码后的特征;对编码后的特征进行最大值汇聚,得到一个用向量表达的特征,以利用分类器进行分类;以及利用成对约束对所述用向量表达的特征进行在线词典再加权,并送入分类器进行训练和分类。本发明利用成对约束,可以有效地编码成对图像之间的关系,基于保守-激进训练策略提出的在线学习算法,大大减少了训练时间,并可以实现增量更新,尤其适用于海量数据集。
-
公开(公告)号:CN103237197A
公开(公告)日:2013-08-07
申请号:CN201310123512.2
申请日:2013-04-10
Applicant: 中国科学院自动化研究所
Abstract: 一种用于鲁棒跟踪的自适应多特征融合的方法,包括步骤:特征结构初始化;分别计算梯度直方图HOG特征、局部二值模式LBP特征、颜色直方图特征;利用增量式主成分分析IPCA算法计算特征的主分量,并得到特征的稳定性表征;更新子特征权重;根据粒子滤波的跟踪结果,计算子特征的更新率。本发明目标特征用梯度信息,纹理信息和颜色信息共同表达,复杂场景下提高了特征的描述能力。根据不同子特征在跟踪中不同的稳定性,实时更新其权重,提高融合后的特征的稳定性。本发明计算量小,可以满足实时性要求。
-
公开(公告)号:CN102609732A
公开(公告)日:2012-07-25
申请号:CN201210021813.X
申请日:2012-01-31
Applicant: 中国科学院自动化研究所
IPC: G06K9/66
Abstract: 本发明公开了一种基于泛化视觉词典图编码的目标识别方法,包括以下步骤:对已经标好类别的目标图像进行特征提取,对提取的特征在视觉词典图上进行泛化编码,对编码结果进行训练并建模;对未知类别的图像进行特征提取,将提取的特征在视觉词典图上进行泛化编码,将编码结果输入到训练得到的模型,获得图像中目标的类别。该方法采用基于泛化视觉词典图的编码技术来提高分类精度,可用于智能视觉监控系统,使得监控系统能真正理解场景;可用于多媒体数字内容分析中的目标分析,判断目标的类别;可用于分析顾客对特定产品或者特定娱乐项目喜好。
-
公开(公告)号:CN101470809B
公开(公告)日:2011-07-20
申请号:CN200710304222.2
申请日:2007-12-26
Applicant: 中国科学院自动化研究所
Abstract: 本发明是一种基于扩展混合高斯模型的运动目标检测方法。所述方法包含如下步骤:通过一级模型构建模块,基于扩展混合高斯模型,构造阴影背景、和前景的概率密度函数;通过二级模型构建模块,基于上述三类的模型,构造运动目标和非运动目标的概率密度函数;通过分类模块,应用MAP-MRF(Maximum a Posteriori-Markov Random Field)方法进行分类;应用跟踪的反馈信息,进一步精确前景模型。本发明通过将高斯混合模型融合空间信息可以克服因背景运动造成的前景误检测;通过在一个概率框架中融合背景建模、前景检测和阴影去除可以克服阴影所造成的不利影响,从而提高运动目标的检测效果。
-
公开(公告)号:CN101488222B
公开(公告)日:2011-02-09
申请号:CN200810056258.8
申请日:2008-01-16
Applicant: 中国科学院自动化研究所
IPC: G06T7/00
Abstract: 本发明基于视频中运动目标表象和运动信息的摄像机自标定方法,对包含运动目标的视频进行前景检测,提取运动目标区域;对每一个运动目标区域提取特征;对运动目标区域进行粗略分类;从海量运动目标区域的表象和运动信息中,提取相互垂直的三个消失点;结合摄像机高度信息完成监控场景摄像机的完全标定。本发明替代手工标定的工作量和误差。用于基于图像或视频的测量,通过图像中的点距离获得三维世界的真实点距离,通过图像中的线夹角获得三维世界的真实线夹角。用于监控场景中的物体分类识别,补偿二维图像特征固有的透视变形。用于监控场景中的基于三维模型的物体识别,获得三维姿态和轨迹,有效帮助系统理解场景中发生的行为。
-
公开(公告)号:CN101883261A
公开(公告)日:2010-11-10
申请号:CN201010191162.X
申请日:2010-05-26
Applicant: 中国科学院自动化研究所
Abstract: 一种大范围监控场景下的异常目标检测和接力跟踪的系统,包括:目标检测模块,利用亚采样的图像进行高斯背景建模,获得前景图像,并计算目标在数字地图中的坐标,然后把坐标信息发送到目标识别与跟踪控制模块;目标识别与跟踪控制模块,完成目标跟踪和轨迹记录以及目标异常行为的检测,如果发生异常行为,据该目标坐标信息选择合适的云台摄像机,发送报警信号到主动跟踪模块;主动跟踪模块,接收目标识别与跟踪控制模块的报警信息,根据报警信息内容控制云台摄像机进行预置位转向,然后进行运动目标的检测与跟踪。本发明解决了大范围监控场景下,多路图像目标信息的融合。实现了同一目标的精确、鲁棒的接力跟踪。
-
公开(公告)号:CN101751553A
公开(公告)日:2010-06-23
申请号:CN200810238875.X
申请日:2008-12-03
Applicant: 中国科学院自动化研究所
Abstract: 本发明提出一种大规模人群密度分析和预测方法,基于统计特征的人群密度分析对输入视频作人群密度分析,获取单个监控点的人群密度值;采用多段线性拟合实现人群密度和人数的互相转换;采用光流法对单个监控点中人群流速和流向进行计算,获得单个监控点中人群流速和流向信息;根据各个监控点的空间位置关系和人群流向流速关系建立一个有向图的结构,对重要监控枢纽节点做一段时间内的人数和人群密度预测。该方法能够自动实时监控大范围内的人群密度和人数分布,并且能对重要地点做人群密度和人数的预测,所提供的信息对于人群监控部门具有重要的参考价值。
-
-
-
-
-
-
-
-
-