一种基于迹比准则的三元组损失函数设计方法

    公开(公告)号:CN108399428B

    公开(公告)日:2020-04-10

    申请号:CN201810135207.8

    申请日:2018-02-09

    Abstract: 一种基于迹比准则的三元组损失函数设计方法,通过对于图像特征提取、三元组损失函数和迹比准则的调研,使用迹比准则(Trace Ratio Criterion)作为三元组选取准则和损失计算方法。所述方法主要包括:A、三元组样本构建:对于数据集中的每一个样本,将其构建成三元组样本;B、三元组样本选取:从构建的三元组样本中进行筛选,设定有效的选取机制,在不损失精度的同时,提高训练速度;C、损失函数设计:根据B中获得的三元组样本,分别计算三元组中当前样本和正负样本之间的距离,设计损失函数计算模型预测和真实结果之间的误差;D、深度网络训练:将模型误差回传到深度卷积神经网络中,对网络参数进行更新调整,迭代地训练模型直到收敛。

    一种基于字符编码的深度神经翻译方法及系统

    公开(公告)号:CN106126507B

    公开(公告)日:2019-08-09

    申请号:CN201610457514.9

    申请日:2016-06-22

    Inventor: 张海军 李婧萱

    Abstract: 本发明提出了一种基于字符编码的深度神经翻译方法及系统,使用递归神经网络(Recurrent Neural Network,RNN)建立一个联合的神经网络模型来覆盖整个翻译过程,从编码器‑解码器框架的角度直接完成翻译任务。方法包括:A、词向量生成:将字符级别的输入数据通过神经网络建模进行分词,并生成词向量;B、语言模型生成:利用递归神经网络在时间上具有记忆性的特点,建立语法规则;C、词对齐模型生成:得到对源语言语句中多个词翻译成目标语言词的概率;D、输出:将输入的源语言翻译成目标语言;E、联合翻译模型:将上述4个步骤的神经网络模型联合起来,建立一个基于字符编码的深度神经翻译模型(RNN‑embed),并使用GPU并行计算来加速模型的训练。

    一种基于明星识别的衣服时尚挖掘方法及视觉感知系统

    公开(公告)号:CN107862241A

    公开(公告)日:2018-03-30

    申请号:CN201710851088.1

    申请日:2017-09-20

    Inventor: 张海军 姬玉柱

    Abstract: 本发明涉及一种基于明星识别的衣服时尚挖掘方法及视觉感知系统,所述方法包括:A、人体检测步骤;B、姿势选择步骤,对探测到的人体的姿势优劣进行筛选;C、人脸探测及明星身份验证步骤,对筛选好的人体区域进行人脸探测,利用关键点检测技术对探测到人脸进行对齐,并利用深度卷积网络抽取人脸特征,与基准明星人脸库进行人脸验证;D、衣服探测步骤,对通过明星验证的人体区域进行衣服探测;E、待检索衣服图像去冗余步骤,利用聚类算法去除冗余的待检索衣服图像;F、同款衣服图像检索及推荐步骤,利用图像检索算法在衣服数据库中搜索同款或类似的衣服并推荐给用户。本发明主要用于视频广告推荐,提高广告对用户的吸引力。

    一种脑电信号特征提取及解释方法

    公开(公告)号:CN106073708A

    公开(公告)日:2016-11-09

    申请号:CN201610387255.7

    申请日:2016-06-01

    CPC classification number: A61B5/72 A61B5/0476

    Abstract: 本发明提出了一种脑电信号特征提取及解释方法,采用联合流形学习在提取脑电信号特征时可以同时实现通道选择,即联合学习仅从对识别比较重要的通道提取特征。这样的特征有两方面优点:一方面可以增强特征实际意义的解释,另一方面利用联合学习对特定脑电信号进行通道选择,所得到的结果也有助于神经生物学的发展,可以帮助研究人员确认相关电位,与神经生物学的研究成果进行相互验证等。另外,本发明的通道选择与特征提取可以应用到未来的BCI系统中,克服现有BCI系统识别率低等问题,对于BCI技术的发展具有重要意义。

    一种基于视频主角识别的服装广告投放方法及系统

    公开(公告)号:CN105913275A

    公开(公告)日:2016-08-31

    申请号:CN201610177425.9

    申请日:2016-03-25

    Inventor: 张海军 安玉松

    CPC classification number: G06Q30/0251 G06K9/00288 G06K9/00744 G06K9/6269

    Abstract: 本发明涉及一种基于视频主角识别的服装广告投放方法及系统,所述方法包括以下步骤:A、人脸检测:得到视频图片中的人脸图片以及坐标位置等信息;B、人脸跟踪:将连续视频帧中同一人的人脸图片聚集到一起,实现人脸的初步聚类;C、人脸验证:计算两两人脸图片之间的距离;D、人脸聚类:把同一人的人脸图片聚集到一起,找到视频中的主要角色;E、人体探测:对每帧视频图片利用基于区域卷积特征探测获得视频中人体的相关信息;F衣服标注:人体图片中衣服的分类和标注;G背景去除以及人体分割与聚类:把人体从图片中剪切出来,去掉与人体无关的背景,把人体衣服分割为多个区域;H衣服图片检索,利用衣服检索数据库中搜索匹配衣服的广告对象。

    面向电子图书的语义空间表示方法及系统

    公开(公告)号:CN103593339A

    公开(公告)日:2014-02-19

    申请号:CN201310634080.1

    申请日:2013-11-29

    Abstract: 本发明提供了一种面向电子图书的语义空间表示方法及系统,该面向电子图书的语义空间表示方法包括如下步骤:A.文档分割:将电子图书按语义结构分成若干个语义单元;B.权重计算:首先构建全文的词汇表,从而电子图书的每一个语义单元用一个词频向量表示,整个电子图书用一个词频矩阵来表示;然后根据权重计算方法针对每个词计算其权重;C.关系图构建:根据电子图书的词频矩阵和词的权重构建一个词邻接关系图;D.多维压缩:用该低维语义空间模型表示电子图书。本发明的有益效果是本发明的低维空间表示可以更加有效的用于储存、分类、聚类等数据分析与挖掘。

    一种购物票据的光学字符识别方法

    公开(公告)号:CN114863457B

    公开(公告)日:2025-03-11

    申请号:CN202110152434.3

    申请日:2021-02-03

    Inventor: 张海军 任狼

    Abstract: 本发明公开了一种自然场景中购物票据图像的光学字符识别方法,该方法包括使用文本检测模块对原始图像进行区域检测获取票据文本图,以及使用文本识别模块对票据文本图进行文本识别。文本检测模块设置有显著性物体检测和文本检测至少两个任务,文本识别模块设置有基于Transformer的注意力模块。本发明公开的技术方案通过多任务模型的建立减少数据的过拟合,提高检测速度,通过基于Transformer的注意力模块将对齐过程和预测过程解耦,加快了推理速度并提高了文本识别精度。

    一种基于交叉注意力机制的视频显著性物体检测模型及系统

    公开(公告)号:CN112149459B

    公开(公告)日:2023-07-25

    申请号:CN201910566667.0

    申请日:2019-06-27

    Inventor: 张海军 姬玉柱

    Abstract: 本发明涉及一种基于交叉注意力机制的视频显著性物体检测方法及系统。所述方法包括:A、将输入相邻帧图像输入到共享参数的相似网络结构中,抽取高级和低级特征;B、利用自注意力模块对单帧图像内部的显著性特征进行特征的重新配准和对齐;C、利用帧间交叉注意力机制,获取帧间时空关系上显著性物体位置上的关系依赖,作为权重作用到高级特征上,捕获时空关系上的显著性物体检测的一致性;D、对抽取的相邻帧帧内高级特征、低级特征以及具有帧间依赖关系的时空特征进行融合;E、将输入的特征进行特征降维,利用分类器输出像素级分类结果;F、建立一个基于交叉注意力机制的深度视频显著性物体检测模型,并使用GPU并行计算来加速模型的训练。

    适用于传感器掉电导致数据缺失的时间序列修复方法

    公开(公告)号:CN112699608B

    公开(公告)日:2022-05-06

    申请号:CN202011626058.9

    申请日:2020-12-31

    Abstract: 本发明涉及一种适用于传感器掉电导致数据缺失的时间序列修复方法、计算机设备及计算机可读存储介质,该方法包括:获取传感器测量所得的多元时间序列矩阵,确定传感器掉电导致数据缺失片段的长度及位置;对多元时间序列矩阵进行张量汉克尔化,将多元时间序列矩阵映射到三维张量,三维张量的三个维度分别为多元变量、时延、时序;基于随机梯度下降的机器学习方法,对三维张量进行张量分解,分解为多元变量嵌入、时延嵌入和时序嵌入;将求解得到的多元变量嵌入、时延嵌入和时序嵌入以张量积的形式重构为三维张量的估计张量;利用重构得到的估计张量,填补多元时间序列矩阵中的数据缺失片段。本发明能够更为准确修复传感器掉电导致的数据缺失。

Patent Agency Ranking