基于双特长教师模型知识融合的图像分类方法及存储介质

    公开(公告)号:CN112801209A

    公开(公告)日:2021-05-14

    申请号:CN202110218021.0

    申请日:2021-02-26

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于双特长教师模型知识融合的图像分类方法及存储介质,其中图像分类方法包括:步骤1:通过调整训练数据分布分别对两个特长教师模型进行训练,获得双特长教师模型;步骤2:对于双教师模型的不同层特征采用基于注意力转移的逐层融合方式进行融合,训练时分别对教师模型和学生模型计算注意力特征图,通过注意力特征损失函数对学生模型的特征层进行约束;步骤3:采用选择性知识传递机制对教师模型特征进行选择性传递;步骤4:对双教师模型进行融合训练,获取目标模型;步骤5:使用步骤4获取的目标模型进行图像分类。与现有技术相比,本发明具有目标模型获取速度快、学生模型性能好等优点。

    一种基于FPN的钢材表面瑕疵检测方法

    公开(公告)号:CN112053357A

    公开(公告)日:2020-12-08

    申请号:CN202011034750.2

    申请日:2020-09-27

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于FPN的钢材表面瑕疵检测方法,包括:步骤1:获取数据集并对数据集进行划分,同时获取数据集中图像对应的瑕疵标签,构成标签集;步骤2:对数据集进行预处理;步骤3:构建基于FPN的钢材表面瑕疵检测模型;步骤4:对瑕疵检测模型进行训练;步骤5:对完成训练的瑕疵检测模型进行测试,判断模型精度是否达到预设阈值,若是,则执行步骤7,否则,返回步骤5;步骤6:使用瑕疵检测模型对钢材表面进行瑕疵检测,获取检测结果,并对检测结果进行可视化处理。与现有技术相比,本发明具有精确、高效、端到端、检测精度高等优点。

    基于triplet深度二值网络的快速人脸检索方法

    公开(公告)号:CN108388574A

    公开(公告)日:2018-08-10

    申请号:CN201810026049.2

    申请日:2018-01-11

    Applicant: 同济大学

    Abstract: 本发明提出了一种基于triplet深度二值网络进行快速的人脸检索的方法,属于图像处理技术领域。首先将图片进行三元组预处理和编码分组,再利用分块图切方法进行triplet哈希编码训练,利用深度网络进行特征提取,使用循环交错两阶段的方法有效地将深度网络判别信息反馈给哈希编码网络,使得两个阶段进行循环学习,相互修正,最后提取深度网络的判别特征作为图片的哈希编码,进行特征对比和人脸检索。通过这种方式可以进行分块编码训练,加快训练速度,同时能有效利用深度网络信息,提取高判别性的哈希编码,提高检索精度。

    三维忆阻器阵列电路、控制系统及多片协同神经网络计算方法

    公开(公告)号:CN119993233A

    公开(公告)日:2025-05-13

    申请号:CN202411702542.3

    申请日:2024-11-26

    Applicant: 同济大学

    Inventor: 尤鸣宇 任柏宇

    Abstract: 本发明公开了一种三维忆阻器阵列电路、控制系统及多片协同神经网络计算方法,以支持神经网络片上高速推理计算。首先,搭建三维忆阻器阵列用于支持多通道卷积神经网络特征信息的计算,将计算的矩阵映射到忆阻器阵列的输入和输出端,通过电压和电流之间的关系计算乘积。其次,构建系统单体模块,用于多通道卷积计算和网络模型参数处理。最后,搭建系统整体模块,实现信息传输、多片计算与计算任务调配。该方法不仅提高了神经网络计算速度,还具备灵活的系统整合方式,可在人工智能领域广泛应用,为高速神经网络计算提供了新的解决方案。

    一种基于避障扩散引导的复杂场景钉孔装配方法

    公开(公告)号:CN119910650A

    公开(公告)日:2025-05-02

    申请号:CN202510143578.0

    申请日:2025-02-10

    Applicant: 同济大学

    Inventor: 尤鸣宇 吴程亮

    Abstract: 本发明公开了一种基于避障扩散引导的复杂场景钉孔装配方法,具体分为两个阶段:在搜索阶段,系统以点云为输入,并以碰撞损失为约束条件,通过扩散模型生成一条避开孔附近障碍物并到达目标孔位的轨迹;在对准插入阶段,以点云为输入,视觉伺服网络输出末端关节坐标及姿态变化的增量,通过闭环控制不断迭代平移增量和旋转增量,以优化末端插入位姿。与现有方案相比,本发明能够适应目标孔位位于非平坦、非水平面上的复杂装配场景,支持在考虑空间约束关系的前提下实现避障和装配任务,基于与目标孔位之间三维空间关系的编码,结合碰撞损失的约束条件,本发明显著提升了钉孔装配的精度与效率,为复杂场景中的自动化装配提供了有效解决方案。

    基于单视角图像和大语言模型引导的三维装配方法

    公开(公告)号:CN119579896A

    公开(公告)日:2025-03-07

    申请号:CN202411702338.1

    申请日:2024-11-26

    Applicant: 同济大学

    Inventor: 尤鸣宇 姚启皓

    Abstract: 本发明公开了一种基于单视角图像和大语言模型引导的三维装配方法,用于服务机器人的自动装配。利用语义分割模型和边缘检测算法对单视角图像中的装配体进行部件级别的分割并获取相应的语义类别标签,实现对单视角图像的精确解析;设计了固定的提示词用以激活大语言模型中蕴含的装配先验知识,形成部件挑选规则,从而对三维装配的部件挑选过程进行指导,解决单视角图像中存在的部分遮挡问题;最终将从单视角图像中解析出的部件语义类别信息与大语言模型生成的装配次序信息编码进基于Transformer架构的部件装配网络,对挑选部件进行装配,预测其正确的装配位姿。大大提高了算法的泛化能力,提升了三维装配的精度。

    一种基于部分视觉观测的机器人长序列任务学习与规划方法

    公开(公告)号:CN117565032A

    公开(公告)日:2024-02-20

    申请号:CN202311216691.4

    申请日:2023-09-20

    Applicant: 同济大学

    Inventor: 尤鸣宇 王伟昊

    Abstract: 本发明提出一种基于部分视觉观测的机器人长序列任务学习与规划方法,包括收集一系列专家示范数据,利用元动作识别模型对示范数据进行元动作分割与识别,整理为一系列历史轨迹用于训练;利用部分可观测马尔科夫过程对长序列任务学习问题进行建模,定义参数空间;设计状态转移函数和观测函数,以及置信度更新方式;设计奖励函数,利用QMDP网络对模型进行近似求解;以专家示范的历史轨迹作为监督,设计损失函数,模型进行端到端训练。本发明将专家演示的视频录像作为输入,演示数据来源广泛易收集,利用神经网络进行部分可观测马尔科夫过程的参数建模,实现端到端的参数学习,泛化性强,对于不同的演示视角和操作主体都能完成长序列的模仿与规划学习。

    一种利用大规模语言模型评估任务完成度的服务机器人模仿学习方法

    公开(公告)号:CN117301049A

    公开(公告)日:2023-12-29

    申请号:CN202311206540.0

    申请日:2023-09-19

    Applicant: 同济大学

    Abstract: 本发明提出一种利用大规模语言模型评估任务完成度的服务机器人模仿学习方法,基于图像的模仿学习算法只需要专家提供动作执行的示范图像,通过逆强化算法,学习专家动作。逆强化算法在优化过程中,需要计算奖励来引导策略收敛。此外,大规模语言模型还会就当前机器人执行动作与场景,提出下一步的建议,该建议将作为下一步策略的输入组成之一。大规模语言模型的输入是文本,机器人任务执行的过程是图像数据,无法直接作为大规模语言模型的输入。针对这个问题,本发明提出一个图像转文本网络,经过训练之后ITTNet可以把图像中的场景转换为文字描述,使之可以成为大规模语言模型的输入。

    一种基于自训练负样本对的无监督对抗性对比学习方法

    公开(公告)号:CN116994046A

    公开(公告)日:2023-11-03

    申请号:CN202310948566.6

    申请日:2023-07-31

    Applicant: 同济大学

    Inventor: 尤鸣宇 李龙

    Abstract: 本发明公开了一种基于自训练负样本对的无监督对抗性对比学习方法,包括:S1、寻求无监督表征学习最小化的一个对比损失函数L;S2、以对抗的方式积极训练一组负样本,构造负样本N集的方法;S3、通过极大极小值问题来训练双方与对抗性的对比损失,找到最优解;S4、更新每个负样本图片的梯度,使负样本N和查询q之间的余弦相似性是最大化的。根据本发明,构建一系列负样本可以连续跟踪学习表征的变化,将更新负样本作为一个整体,以更少的迭代更有效的训练表征网络,可训练的负样本类似于不涉及负样本自监督模型中的网络构成。

    一种仿真环境下的三维装配体补全方法

    公开(公告)号:CN116976032A

    公开(公告)日:2023-10-31

    申请号:CN202310983113.7

    申请日:2023-08-07

    Applicant: 同济大学

    Abstract: 本发明提供一种仿真环境下的三维装配体补全方法,属于三维装配与人工智能领域,具体步骤包括:1)利用三维仿真装配体构建不完整装配体集合和候选部件集合,并通过采样将不完整装配体与候选部件转化为点云;2)利用模型将装配体点云分割为部件级点云,并进行特征提取,获取点云特征;3)利用编码器对待补全装配体的部件特征进行交互建模,再利用解码器进行关系建模;4)根据解码器输出的候选部件特征,利用多层感知机网络进行多任务学习;5)根据预测值和真实值计算损失函数,设定相关训练参数并对模型进行训练。本发明实现了仿真环境下高精度的三维装配体补全,能够作为专业工具辅助三维装配体设计,缩短设计周期,提升生产效率。

Patent Agency Ranking