一种增强视角一致性的零样本3D生成方法

    公开(公告)号:CN119152101A

    公开(公告)日:2024-12-17

    申请号:CN202411625074.4

    申请日:2024-11-14

    Inventor: 周媛 金世龙

    Abstract: 本发明提出一种增强视角一致性的零样本3D生成方法,旨在解决当前3D生成技术中,同一对象在不同视角下呈现出的不一致性问题,即“多面”问题。此问题源于预训练生成模型的典型视角偏好。为此,本发明采用视角解耦方法VDM提取视角特征来消除视角先验偏好并增强视角控制,同时,引入相似度偏序损失PSL优化视角间图像的相似度分布,确保生成的3D图像在不同视角下保持高度一致性。此外,本技术还结合了3D高斯泼溅技术,进一步增强了模型的渲染效果和细节表现。这一方案显著提升了3D内容的真实性和一致性,使其更加适用于虚拟现实、游戏设计和工业设计等领域,极大推动了零样本3D生成技术的实用化和发展。

    一种基于视觉的动态选择的零样本学习分类方法

    公开(公告)号:CN117372775A

    公开(公告)日:2024-01-09

    申请号:CN202311418537.5

    申请日:2023-10-30

    Inventor: 周媛 向磊

    Abstract: 本发明公开了一种基于视觉的动态选择的零样本学习分类方法,包括如下步骤:获取待分类的图片;将图片输入至训练好的零样本学习分类模型中,得到图片对应的类别标签;其中,零样本学习分类模型包括视觉编码器、动态区域选择模块、属性分类器、动态属性选择模块和分类模块,其中,基于动态区域选择模块,能够得到精炼后的区域视觉特征,从而更好的捕捉到图片中的属性;基于动态属性选择模块,得到精炼后的类别原型,学习针对每个样本的类别原型,从而减少了同类图片中属性表现的差异性,提高了对图片的识别准确率。

    一种基于特征的文本到图像生成方法、装置及介质

    公开(公告)号:CN115908641A

    公开(公告)日:2023-04-04

    申请号:CN202211703322.3

    申请日:2022-12-29

    Inventor: 周媛 王鹏

    Abstract: 本发明公开了一种基于特征的文本到图像生成方法、装置及介质,其方法包括获取测试文本,进行编码处理生成文本特征;随机生成分布噪声并作为图像特征;将文本特征和图像特征输入训练好的图像生成模型,获取输出的生成图像;其中,图像生成模型的训练包括:获取由大量训练文本及对应的真实图像构成的数据集;基于生成对抗网络设计图像生成模块,图像生成模块包括生成器和判别器;从数据集中取出训练文本及其对应的真实图像;对取出的训练文本及其对应的真实图像分别进行编码处理生成文本特征和图像特征,并计算对抗性损失和相似性比较损失,根据对抗性损失和相似性比较损失优化生成器和判别器,并进行迭代训练;本发明能够提升图像生成的准确性。

    一种特征加权的模糊紧致散布聚类方法

    公开(公告)号:CN104008197B

    公开(公告)日:2016-03-30

    申请号:CN201410265975.7

    申请日:2014-06-13

    Inventor: 周媛 何军 夏景明

    Abstract: 针对现有的WFCM算法在聚类时没有考虑样本硬划分实际情况,FCS算法没有考虑硬划分边界点的情况以及忽略样本特征参数对聚类影响的问题,本发明公开了一种特征加权的模糊紧致散布聚类方法。本发明通过对样本隶属度、特征权重进行调整,遵循了样本硬划分的实际情况,并充分考虑样本特征参数对样本划分的影响,尽可能使得样本类内紧致、类间分散,解决了位于硬划分边界的样本隶属度问题,对于噪声数据和异常数据实现了更有效的划分。聚类性能良好,收敛速度快、迭代效率高。实验证明,本算法聚类性能良好,收敛速度快、迭代效率高。与现有方法相比,本发明聚类准确率高,耗时明显减少,适于应用在工业控制中实时性要求高的场合。

    基于RGB彩色特征双重鉴别分析的彩色人脸识别方法

    公开(公告)号:CN103116758B

    公开(公告)日:2016-03-30

    申请号:CN201310039790.X

    申请日:2013-02-01

    Inventor: 刘茜 周媛 王新蕾

    Abstract: 本发明公开了一种彩色人脸识别方法,将鉴别分析技术同时应用到R、G、B三个彩色分量内部和三个彩色分量之间,在各个彩色分量内部和不同彩色分量之间实现基于欧式距离的特征层双重鉴别分析,获取的鉴别信息多,分类正确率高,识别能力强。本发明提供的基于RGB彩色特征双重鉴别分析的彩色人脸识别方法包括:首先获得训练样本集,定义训练样本集内部的类内特征散布矩阵和类间特征散布矩阵与各彩色分量训练样本集之间的类内特征散布矩阵和类间特征散布矩阵;定义目标函数并对目标函数求解,得到投影后的训练样本特征集;根据上述投影后的训练样本特征集,得出投影后的测试样本特征,计算测试样本特征到每个训练样本特征的欧式距离后将其归类。

    一种基于随机投影和Fisher向量的人物行为识别方法

    公开(公告)号:CN104881651A

    公开(公告)日:2015-09-02

    申请号:CN201510289260.X

    申请日:2015-05-29

    CPC classification number: G06K9/00335 G06K9/00718 G06K9/6269

    Abstract: 本发明公开了一种基于随机投影和Fisher向量的人物行为识别方法,采用随机投影定理的方法替代主成份分析法进行特征降维,以解决其时间消耗大,主成份保留不明确等问题,随机投影定理表明,通过一个压缩测量矩阵,可以把具有稀疏性质的原始信号投影到某个低维子空间上,该映射后的向量与原始高维特征向量间点距离基本保持不变,即整个压缩过程不会产生数据的曲解。此外不同于BoW模型的硬划分,本发明采用GMM—Fisher向量混合模型对轨迹特征向量进行软划分,它融合了Fisher核生成模式和判别模式的特点,不仅能计算出每个特性描述子出现的频率,还能从统计学的意义上描述这些特征描述子的概率分布情况,既丰富了行为动作的特征表达又提高了行为识别的效率。

    一种面向弱标签数据进行人脸年龄合成的方法

    公开(公告)号:CN112487971A

    公开(公告)日:2021-03-12

    申请号:CN202011370958.1

    申请日:2020-11-30

    Inventor: 周媛 马莞悦 何军

    Abstract: 本发明公开了一种面向弱标签数据进行人脸年龄合成的方法。属于计算机科学技术人工智能领域,具体步骤包括人脸特征提取、人脸年龄合成及身份信息增强。本发明可以解决数据集标签不精确,缺乏匹配年龄段人脸图片问题,同时,由于添加了循环网络,本发明保留更多的个人面部特征信息,使生成的回归/老化人脸效果更好;另外,本发明在解决数据集不足问题的基础上仍然可以保证良好的生成效果;解决了传统人脸年龄合成任务中数据稀缺的问题,在现实生活中有很广泛的应用,例如寻找失踪人口、影视娱乐、公益项目宣传等。

    一种基于随机投影和Fisher向量的人物行为识别方法

    公开(公告)号:CN104881651B

    公开(公告)日:2017-12-15

    申请号:CN201510289260.X

    申请日:2015-05-29

    Abstract: 本发明公开了一种基于随机投影和Fisher向量的人物行为识别方法,采用随机投影定理的方法替代主成份分析法进行特征降维,以解决其时间消耗大,主成份保留不明确等问题,随机投影定理表明,通过一个压缩测量矩阵,可以把具有稀疏性质的原始信号投影到某个低维子空间上,该映射后的向量与原始高维特征向量间点距离基本保持不变,即整个压缩过程不会产生数据的曲解。此外不同于BoW模型的硬划分,本发明采用GMM—Fisher向量混合模型对轨迹特征向量进行软划分,它融合了Fisher核生成模式和判别模式的特点,不仅能计算出每个特性描述子出现的频率,还能从统计学的意义上描述这些特征描述子的概率分布情况,既丰富了行为动作的特征表达又提高了行为识别的效率。

    一种无人值守的路边停车收费系统

    公开(公告)号:CN107274495A

    公开(公告)日:2017-10-20

    申请号:CN201710342103.X

    申请日:2017-05-16

    CPC classification number: G07B15/02 G06K9/00785 G06K2209/15

    Abstract: 本发明公开了一种无人值守的路边停车收费系统,包括数据处理模块以及分别与之连接的视频采集模块、数据存储模块和数据传输模块,视频采集模块采集停车区域内的视频帧数据,数据存储模块存储用户信息、用户停车信息、停车收费标准和用户黑名单,数据传输模块实现数据处理模块与用户客户端的数据交互,数据处理模块包括影像识别单元、计费单元和报警单元,影像识别单元检测和跟踪驶入停车区域的车辆目标,计费单元计算用户的停车费用并向用户客户端发送电子发票,报警单元对未在规定的阈值时间内确认停车、驶离停车位或支付停车费的用户客户端发送报警信息。本发明实现了对路边车辆停车行为进行识别、计费和付费的全程电子化管理。

    一种带有感知反馈功能的假肢系统

    公开(公告)号:CN104825256A

    公开(公告)日:2015-08-12

    申请号:CN201510215646.6

    申请日:2015-04-30

    Abstract: 本发明涉及一种带有感知反馈功能的假肢系统,包括与残疾人的残肢部连接且具有动作执行机构的假肢以及:语音信号采集与处理模块;脑电波采集与处理模块;压力采集模块,用于采集假肢末端的实时压力值;感知反馈模块,根据假肢末端的实时压力值产生电流信号对残肢部进行刺激,使得残疾人实时修正自己的脑电波信号;控制模块,接收所述语音信号、脑电波信号,形成控制动作执行机构完成假肢动作的控制指令;接收所述实时压力值,形成控制感知反馈模块对残肢部产生刺激电流的控制指令。本发明使得假肢使用者完全可以按照自己的真实意图去操控假肢,并能够实时的获知假肢末端的触控压力大小,便于及时调整自己的控制意图,实现精细操控的目的。

Patent Agency Ranking