-
公开(公告)号:CN113254716B
公开(公告)日:2022-05-24
申请号:CN202110577336.4
申请日:2021-05-26
Applicant: 北京亮亮视野科技有限公司 , 中国科学院自动化研究所
Abstract: 本公开提供了一种视频片段检索方法、装置、电子设备和计算机可读存储介质,涉及视频检索技术领域。其中,视频片段检索方法包括:在候选视频的语义空间中查询查询语句的多个相似语句;基于多个相似语句分别构建图神经网络,得到多个图神经网络;基于检测距离对多个图神经网络进行排序,生成网络序列;将相邻的上一图神经网络的第一知识信息知识迁移至下一图神经网络中,得到对应的节点更新特征和边更新特征;基于节点更新特征得到下一图神经网络进行知识迁移后的第二知识信息,直至得到尾部更新网络;计算尾部更新网络中与相似语句节点相连的边更新特征的置信度;得到视频片段的检索结果。通过本公开的技术方案,有利于提高对视频片段的检索性能。
-
公开(公告)号:CN114038052A
公开(公告)日:2022-02-11
申请号:CN202111121648.0
申请日:2021-09-24
Applicant: 南京南瑞信息通信科技有限公司 , 北京易达图灵科技有限公司 , 中国科学院自动化研究所
Abstract: 本发明提供一种行人重识别方法及系统,该方法包括:确定待识别行人图像;将待识别行人图像输入至特征提取模型,得到特征提取模型输出的全局特征向量和局部特征向量;对全局特征向量和局部特征向量进行拼接融合,得到所述待识别行人图像对应的完整特征表达;并基于完整特征表达,将待识别行人图像与预设图像库中的行人图像进行匹配,确定待识别行人图像的行人重识别结果;其中,局部特征向量包括特征提取模型确定的特征图在垂直方向及深度方向上的多个局部特征向量。该方法进行了全局特征向量和局部特征向量等多维特征的提取,并利用待识别行人图像的宏观全局特征与微观局部特征进行行人重识别,把控整体与细节,提高了行人重识别的准确率。
-
公开(公告)号:CN113705322A
公开(公告)日:2021-11-26
申请号:CN202110655846.9
申请日:2021-06-11
Applicant: 北京易达图灵科技有限公司 , 南京南瑞信息通信科技有限公司 , 中国科学院自动化研究所
Abstract: 本发明提供一种基于门限图神经网络的手写汉字识别方法和装置,其中方法包括:确定待识别汉字的汉字节点矩阵以及空间信息关系矩阵;所述汉字节点矩阵中的各汉字节点为所述待识别汉字的书写视频中每一时刻书写位置的坐标;将所述汉字节点矩阵和所述空间信息关系矩阵输入至汉字识别模型中,得到所述汉字识别模型输出的识别结果;其中,所述汉字识别模型用于基于门限图神经网络,提取所述汉字节点矩阵对应的包含图结构信息的汉字特征向量,提取所述汉字特征向量中的时序信息,得到时序特征向量,并基于所述时序特征向量经由瓶颈网络进行手写汉字识别。本发明综合了汉字的空间结构信息和时序信息,提高了手写汉字识别的准确性。
-
公开(公告)号:CN113591546A
公开(公告)日:2021-11-02
申请号:CN202110653956.1
申请日:2021-06-11
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种语义增强型场景文本识别方法及装置,通过场景文本识别模型的编码器提取场景文本图像的视觉特征图以及上下文特征序列,并基于视觉特征图、上下文特征序列以及特征图的位置编码确定增强型特征表达,获取场景文本图像全局的视觉信息和语义信息,解码器采用特殊设计的循环神经网络单元进行解码,该单元能够均衡上下文信息的独立性和相关性。将隐含状态向量和展开后的增强型特征表达进行多头注意力运算,得到局部表观特征向量。局部表观特征向量与循环神经网络单元的隐层输出共同参与当前时刻的字符预测,增强了语义信息和视觉信息的相关性。多头注意力机制设计能够捕捉特征的显著性信息和辅助信息,使得场景文本识别结果准确率较高。
-
公开(公告)号:CN113254716A
公开(公告)日:2021-08-13
申请号:CN202110577336.4
申请日:2021-05-26
Applicant: 北京亮亮视野科技有限公司 , 中国科学院自动化研究所
Abstract: 本公开提供了一种视频片段检索方法、装置、电子设备和计算机可读存储介质,涉及视频检索技术领域。其中,视频片段检索方法包括:在候选视频的语义空间中查询查询语句的多个相似语句;基于多个相似语句分别构建图神经网络,得到多个图神经网络;基于检测距离对多个图神经网络进行排序,生成网络序列;将相邻的上一图神经网络的第一知识信息知识迁移至下一图神经网络中,得到对应的节点更新特征和边更新特征;基于节点更新特征得到下一图神经网络进行知识迁移后的第二知识信息,直至得到尾部更新网络;计算尾部更新网络中与相似语句节点相连的边更新特征的置信度;得到视频片段的检索结果。通过本公开的技术方案,有利于提高对视频片段的检索性能。
-
公开(公告)号:CN109191366B
公开(公告)日:2020-12-01
申请号:CN201810764054.3
申请日:2018-07-12
Applicant: 中国科学院自动化研究所
IPC: G06T3/00
Abstract: 本发明属于图像合成技术领域,具体提供一种基于人体姿态的多视角人体图像合成方法及装置。旨在解决现有技术无法有效地进行人的多视角图像合成以及保持人的特征不发生明显变化的问题。本发明提供了一种基于人体姿态的多视角人体图像合成方法,包括基于姿态转换模型并根据原始人体姿态和目标视角,对原始人体姿态进行姿态转换;基于前景转换模型并根据原始前景图像、原始人体姿态和目标视角人体姿态,对原始前景图像进行前景转换;基于多视角合成模型并根据原始图像和目标前景图像,对原始图像进行多视角合成,得到多视角人体合成图像。本发明提供的方法具有保持合成图像中人的特征,以及合成高质量的合成图像的有益效果。
-
公开(公告)号:CN104615983B
公开(公告)日:2018-07-31
申请号:CN201510043587.9
申请日:2015-01-28
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开种基于递归神经网络的人体骨架运动序列行为识别方法,包括以下步骤:对已经提取好的人体骨架姿态序列中节点坐标进行归化,以消除人体所处绝对空间位置对识别过程的影响,利用简单平滑滤波器对骨架节点坐标滤波以提高信噪比,最后将平滑后的数据送入个层次化双向递归神经网络进行深度特征提取及识别,同时提供了种层次化单向递归神经网络模型以应对实际中的实时在线分析需求。该方法主要优点是根据人体结构特征及运动的相对性,设计端到端的分析模式,在实现高精度识别率的同时避免复杂的计算,便于实际应用。该发明对于基于深度摄像机技术的智能视频监控、智能交通管理及智慧城市等领域具有重要意义。
-
公开(公告)号:CN105205448A
公开(公告)日:2015-12-30
申请号:CN201510522576.9
申请日:2015-08-24
Applicant: 中国科学院自动化研究所 , 富士通株式会社
CPC classification number: G06K9/00536 , G06K9/6267 , G06K2209/01
Abstract: 一种基于深度学习的文字识别方法,包括:设计更深的多层卷积神经网络结构,把每一个字符作为一个类别;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后根据现有识别出的字符,采用维特比算法从词典中找出最有可能的词语。在测试的时候,给定一个输入,需要先进行滑动窗口扫描获得备选字符,再从备选字符中找出最可能的词语。本方法利用更深的卷积神经网络来学习文字特征,对于文字的颜色、大小、光照、模糊具有鲁棒性,字符识别和词语识别能够保持较高的准确率。
-
公开(公告)号:CN111881957B
公开(公告)日:2022-09-23
申请号:CN202010683490.5
申请日:2020-07-15
Applicant: 中国科学院自动化研究所 , 国网江西省电力有限公司
IPC: G06V10/774 , G06V10/776 , G06N3/04
Abstract: 本发明属于领域,具体涉及了一种基于信息导向注意力网络的图像识别方法,旨在解决的问题。本发明包括:获取输入图像,通过信息导向的注意力网络计算输入图像的特征向量,计算特征向量和信息导向的注意力网络中的原型表征之间的距离,选取特征向量距离最近的类别得到图像的分类结果。本发明解决了现有的图像识别技术中训练神经网络严重依赖数据规模的缺陷,通过将标注数据和未标注数据组织在一起并对他们之间的关系进行建模,可以抽取更具代表性的特征,解决了现有图像识别技术所用人工神经网络需要大量有标注的训练数据才能满足使用性能需求的缺陷。
-
公开(公告)号:CN112784918A
公开(公告)日:2021-05-11
申请号:CN202110137847.4
申请日:2021-02-01
Applicant: 中国科学院自动化研究所
Inventor: 王威
Abstract: 本发明属于大数据分析、模式识别和神经网络技术领域,具体涉及一种基于无监督图表示学习的节点识别方法、系统、装置,旨在解决现有基于图神经网络的节点识别方法需要大量的标签样本,在标注样本较少时,造成图神经网络训练困难以及识别精度较低的问题。本系统方法包括获取待识别的数据,作为输入数据;构建输入数据的图结构,得到图结构数据,并通过训练好的多层图神经网络获取所述图结构数据中各节点的特征表示;基于特征表示,通过预训练的分类器得到图结构数据中各节点所属的类别。本发明减少了样本标注的需求,简化了网络训练的难度,并能在少量标记样本的监督下实现具有较高精度的节点识别。
-
-
-
-
-
-
-
-
-