一种基于渐进图注意力网络的视频问答方法

    公开(公告)号:CN112488055B

    公开(公告)日:2022-09-06

    申请号:CN202011501849.9

    申请日:2020-12-18

    Inventor: 杨阳 彭亮

    Abstract: 本发明公开了一种基于渐进图注意力网络的视频问答方法,其中,采样一种新颖的渐进图注意网络,以渐进的方式探究了在目标层次、视频帧层次和视频片段层次的多种视觉交互。在该渐进图注意网络当中,目标层次的图结构主要用于获取相同帧或者不同帧中目标之间的时空关系,视频帧层次的图结构探究了视频帧之间的相互关系,而视频片段层次的图结构构建了其中不同动作之间的时序关系。同时,本发明也使用了注意力机制去关注与问题相关的图顶点和边,并且用一种渐进的方式连接这些不同层次的图特征。用这样的方式,每一个图都能基于视觉相关性关注到它的时空邻接顶点和更细粒度的视觉内容。这样提高了预测问题的答案的准确性。

    一种基于多粒度融合网络的零样本图片识别方法

    公开(公告)号:CN112488241B

    公开(公告)日:2022-04-19

    申请号:CN202011501887.4

    申请日:2020-12-18

    Applicant: 贵州大学

    Inventor: 杨阳 位纪伟

    Abstract: 本发明公开了一种基于多粒度融合网络的零样本图片识别方法,利用类别的语义信息作为指导,抑制噪音,增强语义,修正已有知识图谱中的误差,构建出新的知识图谱,从而得到新的邻接矩阵,获取了更为精确的类别之间的关系,其次,针对深层图卷积网络易过平滑,浅层图卷积网络表达能力不够的难题,为更好地利用知识图谱迁移知识,设计一个多粒度融合网络,它能捕获多粒度的特征信息来生成分类器,将多种粒度的特征融合到一起,可以高效的在类别之间进行知识迁移,大幅提升图片分类效果。

    一种基于自监督对抗的图片文本跨模态检索方法

    公开(公告)号:CN112488131A

    公开(公告)日:2021-03-12

    申请号:CN202011501824.9

    申请日:2020-12-18

    Applicant: 贵州大学

    Abstract: 本发明公开了一种基于自监督对抗的图片文本跨模态检索方法,通过在嵌入生成网络构建一个共享网络,作为图片特征、文本特征分别映射为图片编码、文本编码的共享子空间,这样减小图片特征和文本特征之间的区隔,同时,构建一个自监督对抗网络,在自监督对抗网络的辅助下,进行对抗训练嵌入生成网络,以滤除图片特征中的冗余信息,更好地将不同模态特征映射到同一空间,使不同模态特征可以更好地对齐,从而提高图片文本跨模态检索效果。

    一种基于多层级表达引导注意力网络的指示表达理解方法

    公开(公告)号:CN112488111A

    公开(公告)日:2021-03-12

    申请号:CN202011508271.X

    申请日:2020-12-18

    Applicant: 贵州大学

    Inventor: 杨阳 彭亮

    Abstract: 本发明公开了一种基于多层级表达引导注意力网络的指示表达理解方法,创新性地设计了一个新的多层级注意机制,即一个多层级表达引导注意网络(MEGA‑Net),其中,包含了一个三个层级注意网络。该多层级注意机制在不同层级的表达式表示的指导下(语句层级、单词层级和短语层级)能够生成具有区分度的图像区域表示,从而帮助准确地确定目标区域。此外,现有方法一般采用单级的方式来匹配区域,这种方式不能对相似的物体或目标进行很好地区分。针对这个问题,本发明设计了一种两级的结构,来比较这些相似的图像区域,找出它们之间的不同,从而去匹配最优的图像区域。本发明在三个流行的数据集上进行评估,实验结果显示其性能优于其他最高水平的模型。

    一种基于多阶段聚合Transformer模型的视频语句定位方法

    公开(公告)号:CN112488063A

    公开(公告)日:2021-03-12

    申请号:CN202011508292.1

    申请日:2020-12-18

    Applicant: 贵州大学

    Inventor: 杨阳 张明星

    Abstract: 本发明公开了一种基于多阶段聚合Transformer模型的视频语句定位方法,在视频语句Transformer模型中,每个视频切片或者单词都可以根据自身的语义自适应地聚合和对齐来自两种模态中所有其他视频切片或者单词的信息。通过多层叠加,最后所得到的视频语句联合表示具有丰富的视觉语言线索捕捉能力,能够实现更精细的匹配。在多阶段聚合模块中,将其开始阶段的阶段特征、中间阶段的阶段特征和结束阶段的阶段特征串联起来,构成该候选片段的特征表示。由于所获得的特征表示捕捉了不同阶段的特定信息,因此非常适合准确定位视频片段的起始位置和终止位置。这两个模块整合在一起,形成一个既有效又高效的网络,提高视频语句定位的准确度。

    一种基于自编码器的零样本图片分类方法

    公开(公告)号:CN112487193A

    公开(公告)日:2021-03-12

    申请号:CN202011501875.1

    申请日:2020-12-18

    Applicant: 贵州大学

    Inventor: 杨阳 位纪伟

    Abstract: 本发明公开了一种基于自编码器的零样本图片分类方法,构建了一个新的生成模型,来直接用生成式方法生成不可见类别的分类器向量。生成模型是一个基于图的自编码结构,其中,编码器用来学习每个类别的隐分布,解码器则用来依据隐分布信息来生成每个类的分类器向量。由于知识图谱允许类别之间共享统计强度,本发明利用结构化的知识图谱来表示类别之间的关系,并采用图卷积神经网络在类别之间迁移知识。不同于之前的生成式方法生成类别的视觉特征,本发明直接为不可见类生成分类器,从而避免现有的生成式方法消耗大量时间的问题,缩短训练耗时,提高图片分类精度,即高效且准确。

    充电插板的节能控制方法及节能插板

    公开(公告)号:CN101876814A

    公开(公告)日:2010-11-03

    申请号:CN201010197037.X

    申请日:2010-06-10

    Applicant: 贵州大学

    Abstract: 本发明公开了一种充电插板的节能控制方法及节能插板,它是在插板上设置单片机,当插板工作时,单片机循环检测插板上每个充电插口的充电情况和每一种充电器的充电时间和充电电流的关系曲线,当检测到某一个充电插口上的充电器充满电后,单片机运用神经模糊自适应反馈控制原理,对该充电器进行最优断电控制,并通过电磁继电器切断与该充电器相连的回路。本发明主要解决充满电后待机耗电问题和保护电池及充电设备问题,它能检测到设备是否充满电、并在设备充满电后自动切断与设备之间的回路;它在很大程度上实现充电的节能要求和人性化要求,为现代的各种充电设备的首选。

    一种基于自监督对抗的图片文本跨模态检索方法

    公开(公告)号:CN112488131B

    公开(公告)日:2022-06-14

    申请号:CN202011501824.9

    申请日:2020-12-18

    Applicant: 贵州大学

    Abstract: 本发明公开了一种基于自监督对抗的图片文本跨模态检索方法,通过在嵌入生成网络构建一个共享网络,作为图片特征、文本特征分别映射为图片编码、文本编码的共享子空间,这样减小图片特征和文本特征之间的区隔,同时,构建一个自监督对抗网络,在自监督对抗网络的辅助下,进行对抗训练嵌入生成网络,以滤除图片特征中的冗余信息,更好地将不同模态特征映射到同一空间,使不同模态特征可以更好地对齐,从而提高图片文本跨模态检索效果。

    一种FeCoNiSix中熵合金及其激光增材制造方法

    公开(公告)号:CN118404087A

    公开(公告)日:2024-07-30

    申请号:CN202410574437.X

    申请日:2024-05-10

    Applicant: 贵州大学

    Abstract: 本发明公开了一种激光增材制造FeCoNiSix中熵合金的方法,按照如下步骤制备:按照FeCoNiSix的原子量,准确称取FeCoNi合金粉以及Si粉,将称取好的粉末放入球磨罐中球磨,为防止粉末粘结,加入适量酒精,使得粉末混合均匀,然后烘干、过筛、干燥保存;选择304L不锈钢作为基材,砂磨、清洗去除表面油污。将送粉速率设定为固定值,设定激光加工合金粉末层数,并从下而上逐层搭接熔化沉积,送粉嘴与激光头同步输出作用得到FeCoNiSix中熵合金涂层。促使材料的内部形成大的晶粒与织构,使得材料在激光制备加工时的流动性能变好,在保证材料饱和磁化强度的不降低太多的情况下使得机械性能得以提升。

    一种基于自编码器的零样本图片分类方法

    公开(公告)号:CN112487193B

    公开(公告)日:2022-11-22

    申请号:CN202011501875.1

    申请日:2020-12-18

    Applicant: 贵州大学

    Inventor: 杨阳 位纪伟

    Abstract: 本发明公开了一种基于自编码器的零样本图片分类方法,构建了一个新的生成模型,来直接用生成式方法生成不可见类别的分类器向量。生成模型是一个基于图的自编码结构,其中,编码器用来学习每个类别的隐分布,解码器则用来依据隐分布信息来生成每个类的分类器向量。由于知识图谱允许类别之间共享统计强度,本发明利用结构化的知识图谱来表示类别之间的关系,并采用图卷积神经网络在类别之间迁移知识。不同于之前的生成式方法生成类别的视觉特征,本发明直接为不可见类生成分类器,从而避免现有的生成式方法消耗大量时间的问题,缩短训练耗时,提高图片分类精度,即高效且准确。

Patent Agency Ranking