-
公开(公告)号:CN111274440B
公开(公告)日:2022-03-25
申请号:CN202010060686.9
申请日:2020-01-19
Applicant: 浙江工商大学
IPC: G06F16/735 , G06F16/783 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于视觉和音频内容相关度挖掘的视频推荐方法,该方法通过分析视频的视觉和音频内容挖掘视频之间的相关度。考虑现有的视频特征表示不是专门针对推荐任务设定的,本发明提出级联多特征融合映射网络对现有视频特征进行映射,并通过负样本增强三元损失函数训练模型,最终得到更适合视频推荐任务的二级特征表示,从而更好的衡量视频之间的相关度。为了充分挖掘视频的内容特征,本发明还提出特征交叉门控融合模块有效地对视频视觉和音频特征进行融合,该模块通过类似注意力机制衡量不同特征之间的交互作用,通过权重来加强特征中的重要信息,剔除冗余信息。本发明方法可以有效地解决视频的冷启动问题,并能够有效提高视频推荐性能。
-
公开(公告)号:CN113920164A
公开(公告)日:2022-01-11
申请号:CN202111252678.5
申请日:2021-10-27
Applicant: 浙江工商大学
Abstract: 本发明公开了一种剧场环境下基于近红外防伪油墨的演员身份重识别方法。该方法通过近红外相机获取彩色相机中不可见的近红外防伪油墨标记,然后将图像送入训练好的检测器与分类器中,最终实现对舞台上表观相似演员跟踪时的身份重识别。本方法用仅近红外相机可见的近红外防伪油墨标记替代已有的演员表观信息或传感器作为区分演员身份的关键特征,具有以下优势:极大程度减少了舞台复杂光照对演员跟踪过程中身份识别稳定性的干扰,以及通过引入特有近红外防伪油墨标记信息解决了演员表观相似所带来的跟踪困难问题。与基于传感器的身份识别方法相比,该方法成本低,操作性强,在舞台演出中具有普遍的适用性。
-
公开(公告)号:CN109640299B
公开(公告)日:2021-09-21
申请号:CN201910101765.7
申请日:2019-01-31
Applicant: 浙江工商大学
Abstract: 本发明公开了一种保证M2M通信完整及故障容错的聚合方法及系统,该方法由可信权威负责管理和分配系统中所有其他实体的秘密信息;由控制中心负责集成、处理和分析来自于M2M感知端N个节点的周期性时间序列数据;由网关负责对数据进行聚合及转发;由感知节点负责实时数据采集,并通过网关转发给控制中心;具体步骤如下:(1)系统初始化阶段;(2)数据聚合请求阶段;(3)数据聚合请求中继阶段;(4)用户数据汇报阶段;(5)安全数据聚合阶段;(6)聚合数据恢复阶段。本发明在大幅提升M2M通信系统信息交换效率及可靠性的同时,有效保护了M2M通信系统的用户隐私。
-
公开(公告)号:CN112633220A
公开(公告)日:2021-04-09
申请号:CN202011610311.1
申请日:2020-12-30
Applicant: 浙江工商大学
Abstract: 本发明公开了一种基于双向序列化建模的人体姿态估计方法,以连续的3帧作为输入,充分利用视频的时序信息计算每个关节的大致空间范围,然后从更小的范围内回归关节的具体位置,从而更好地解决人体姿态估计任务中固有的遮挡、运动模糊等问题,使得模型的泛化性更强,具有更高的准确率。本发明充分利用了视频的时序信息,增强了模型的推理能力,能够更好地对人体关键部位进行估计,在安防、短视频平台等需要实时抽取姿态进行分析的行业具有重要意义。
-
公开(公告)号:CN111897913A
公开(公告)日:2020-11-06
申请号:CN202010686024.2
申请日:2020-07-16
Applicant: 浙江工商大学
IPC: G06F16/33 , G06F16/783 , G06F40/30 , G06N3/04
Abstract: 本发明公开了一种基于语义树增强的复杂文本查询到视频的跨模态检索方法。对于复杂文本查询语句,将其各个单词转换成叶子节点表示,挖掘子节点之间的关系,将两个依赖性最高的子节点进行合并,通过递归的方式构建查询语句的语义树结构,得到基于语义树增强的查询表示。对于候选视频的编码,通过CNN获得视频初步特征,利用GRU和自注意力机制模块捕获视频之间的时间依赖性和语义相关性,得到鲁棒的视频特征表示。将复杂文本查询表示和视频特征表示映射到公共空间中,自动学习两者的匹配关系,从而实现复杂文本查询到视频的跨模态检索。本发明方法不仅可以解释复杂文本查询语句中的信息成分,更好的理解用户意图,并且在很大程度上提高了检索的性能。
-
公开(公告)号:CN111695457A
公开(公告)日:2020-09-22
申请号:CN202010468015.6
申请日:2020-05-28
Applicant: 浙江工商大学
Abstract: 本发明公开了一种基于弱监督机制的人体姿态估计方法,通过弱监督的训练方式,利用较少的带标签数据来训练模型,解决了视频数据集标注困难、成本高等问题,同时充分利用了视频的时序信息即视频帧之间的隐式相关性,从而更好的处理了人体姿态估计任务中固有的遮挡、运动模糊等问题,使得模型的泛化性更强,实现更高的检测准确率。同时,本发明方法采用轻量级的网络架构,使得姿态估计实时利用更加可行,解决了传统姿态估计占用大量资源的问题,对短视频平台、安防等领域具有重要应用价值。
-
公开(公告)号:CN108710830B
公开(公告)日:2020-08-28
申请号:CN201810362559.7
申请日:2018-04-20
Applicant: 浙江工商大学
Abstract: 本发明公开了一种结合密集连接注意力金字塔残差网络和等距限制的人体3D姿势估计方法,该方法分解为辨别式人体2D姿势估计和生成式人体3D姿势估计两个部分。首先构建人体2D姿势估计模型,人体2D姿势估计模型包括注意力金字塔残差块和由若干注意力金字塔残差块组成的沙漏子网络,注意力金字塔残差块用于多尺度图像特征提取,沙漏子网络用于生成人体关节点热力图;为解决环境上下文信息未充分利用的问题,结合注意力机制和多尺度分析捕捉环境上下文特征;为解决梯度消失/梯度爆炸问题,密集连接网络结合上述注意力机制改进特征图辨识度。然后构建损失函数,引入等距限制项,通过最小化损失函数来拟合人体3D姿势。本发明方法在人体3D姿势估计任务上有明显优势。
-
公开(公告)号:CN111309971A
公开(公告)日:2020-06-19
申请号:CN202010060690.5
申请日:2020-01-19
Applicant: 浙江工商大学
IPC: G06F16/783 , G06F16/33
Abstract: 本发明公开了一种基于多级编码的文本到视频的跨模态检索方法,该方法包括:首先获取视频和文本的初步特征,然后通过两个多级编码网络分支分别对两种模态的全局、时序和局部信息进行编码;对于视频端提取音频特征,对于文本端提取句子特征;最后将编码的多个特征进行多级特征融合,得到鲁棒的视频和文本表达。通过全连接层将两个模态的特征映射到一个统一公共空间中,利用公共空间算法学习两个模态之间的关系,通过端到端的方式训练模型,自动学习文本和视频的匹配关系,从而实现文本到视频的跨模态检索。本发明是一种无概念的方法,不需复杂的概念检测操作,就能实现跨模态检索,并且利用了深度学习技术,在很大程度上提高了检索的性能和效率。
-
公开(公告)号:CN110049000A
公开(公告)日:2019-07-23
申请号:CN201910069048.0
申请日:2019-01-24
Applicant: 浙江工商大学
Abstract: 本发明一种大小空间明文聚合及差分安全的物联通信方法及系统,由可信权威负责管理整个系统;由控制中心负责集成、处理和分析用户的实时汇报数据,并提供综合性智能服务;由网关负责将汇报数据转发给控制中心及对数据进行聚合;由物联网感知端的感知节点负责实时采集并周期性汇报用户的大小明文空间数据,具体步骤如下:系统初始化阶段;用户数据汇报阶段;安全数据聚合阶段;聚合数据恢复阶段。本发明创新性的构造了 群上同时支持大、小明文空间数据安全聚合需求的代数结构;优化与平衡了数据聚合系统的差分隐私效用性及差分隐私安全性,从而有效防御了差分攻击;通过构建层次式架构,有效抵抗攻击者通过差分攻击窃取用户的隐私信息。
-
公开(公告)号:CN106600659B
公开(公告)日:2019-06-04
申请号:CN201611104799.4
申请日:2016-12-05
Applicant: 浙江工商大学
Abstract: 本发明公开了一种基于随机采样点的多样化颜色表绘制方法。本发明在设定一定的限定条件下,根据输入的L值和颜色分类数n,通过随机获取采样点的方式构成颜色表。根据颜色点在CIELAB颜色空间中,相同的欧式距离给人的视觉距离相同的特性,通过限定欧式距离值以及计算最大采样数来保证生成的颜色表有一定的区分度。本发明能够满足构成颜色表多样化,保证颜色相互之间具有一定的视觉距离的特性。
-
-
-
-
-
-
-
-
-