一种基于MPViT-DeepLab的建筑物分割方法

    公开(公告)号:CN119360017A

    公开(公告)日:2025-01-24

    申请号:CN202411359561.0

    申请日:2024-09-27

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于MPViT‑DeepLab的建筑物分割方法,包括以下步骤:采用MPViT网络对输入的遥感图像进行多次尺寸递减、序列数递增的迭代循环;将MPViT网络第一次迭代后得到的原始粗略特征数据输入解码层;将MPViT网络最后一次换迭代后得到的精细特征数据输入的编码层,并进行不同扩张率的空洞卷积处理;将经编码层空洞卷积处理后的特征与原始粗略特征进行融合,并上采样到原始图像的分辨率;利用DeepLabV3+网络对上采样后的特征进行解码,生成建筑物分割结果。与现有技术相比,本发明显著提高了模型对图像细节的捕捉能力,使得模型在处理具有复杂结构的遥感图像时,能够更加有效地恢复图像的高分辨率特征。

    一种基于语义查询学习的点监督视频动作定位方法

    公开(公告)号:CN119169496A

    公开(公告)日:2024-12-20

    申请号:CN202411144207.6

    申请日:2024-08-20

    Applicant: 同济大学

    Inventor: 汪昱 赵生捷

    Abstract: 本发明涉及一种基于语义查询学习的点监督视频动作定位方法,包括:S1、给定未剪辑视频,包括有多个动作实例;S2、利用特征提取器提取出时空特征;S3、语义查询学习;S4、完整性学习;S5、根据预测动作实例定位动作的位置区间,通过非极大值抑制算法过滤冗余的预测动作实例得到最终点监督视频动作定位结果。与现有技术相比,本发明具有准确率高的优点。

    视频字幕生成方法、装置及存储介质

    公开(公告)号:CN118695047A

    公开(公告)日:2024-09-24

    申请号:CN202410694213.2

    申请日:2024-05-31

    Applicant: 同济大学

    Abstract: 本发明涉及一种视频字幕生成方法、装置及存储介质。该方法获取原始视频数据并采样得到视频帧;利用训练好的图像字幕模型生成帧字幕、利用目标检测模型获取每帧目标检测区域及相应的标签、利用视频编码器提取视频嵌入特征;从预先获取的知识图谱中导出子图作为额外的输入特征,并利用字幕时序编码器对每帧字幕进行时序特征编码得到相应的帧字幕嵌入特征;进行聚类和计数并利用区域时空编码器对经聚类和计数的区域特征进行编码,得到经聚类和计数的区域嵌入特征;将获取的多模态特征输入多模态解码器模型中,得到最终的视频字幕。与现有技术相比,本发明具有等优点。

    一种基于行为模式的SEIR感染风险模拟方法

    公开(公告)号:CN114373542B

    公开(公告)日:2024-08-27

    申请号:CN202111523055.7

    申请日:2021-12-13

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于行为模式的SEIR感染风险模拟方法,该方法通过时序网络将疫情数据划分为不同尺度的数据,以家庭为网络节点,基于行为模式确定网络节点连接关系,构建人群接触网络,采用SEIR模型模拟疫情传播的各个阶段,确定每天的疫情传播情况。与现有技术相比,本发明具有模拟真实性高以及准确性高的优点。

    基于双判别器对抗学习的雨纹图像生成方法、设备和介质

    公开(公告)号:CN118446916A

    公开(公告)日:2024-08-06

    申请号:CN202410587668.4

    申请日:2024-05-13

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于双判别器对抗学习的雨纹图像生成方法、设备和介质,基于双判别器搭建雨纹图像生成网络,网络中的雨生成器根据显式控制变量和潜在变量输出生成雨纹图像,所述显式控制变量通过雨分类子网络根据真实雨景图像获得,包括多个独立变量,每个独立变量用于控制生成雨纹图像中的一个独立雨属性;所述潜在变量通过雨推断子网络根据真实雨景图像获得,用于控制生成雨纹图像中的其他雨属性;网络中的判别器分用于生成雨纹图像和渲染雨纹图像之间、生成雨景图像和真实雨景图像之间的对抗学习。与现有技术相比,本发明可以生成逼真的雨纹图像,辅助更好地完成图像去雨任务。

    一种面向抑郁人群的心理咨询聊天机器人实现方法

    公开(公告)号:CN114187997B

    公开(公告)日:2024-06-28

    申请号:CN202111352930.X

    申请日:2021-11-16

    Applicant: 同济大学

    Abstract: 本发明涉及一种面向抑郁人群的心理咨询聊天机器人实现方法,包括基于模板式方案搭建认知引导对话模块、基于检索式方案搭建心理问答闲聊模块,心理咨询聊天机器人的工作流程为:机器人接收到用户的输入文本后,首先启动认知引导对话模块,将输入文本与认知引导对话模块中预定义的模板进行匹配,若匹配成功,则根据匹配到的模板生成输出语句,否则,启动心理问答闲聊模块,将输入文本与心理问答闲聊模块中预存储的问题进行匹配,并基于匹配分数最高的问题的回答生成输出语句。与现有技术相比,本发明以模板式方案对用户进行认知引导,使用检索式方案作为补充,为用户的困扰提供建议和支持,提升回复的多样性和趣味性。

    一种基于计算编码的CSXI轮盘式编码孔径设计方法

    公开(公告)号:CN113476067B

    公开(公告)日:2024-05-31

    申请号:CN202110732942.9

    申请日:2021-06-30

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于计算编码的CSXI轮盘式编码孔径设计方法,包括:步骤1:确定编码孔径的编码方式;步骤2:构建对应编码孔径轮盘;步骤3:设计轮盘随CT扫描系统的运动方式;步骤4:在与CT扫描系统的X射线源对应位置设置编码孔径轮盘,编码孔径轮盘通过随扫描视角的变化切换用于调制X射线能谱的滤波器,完成CSXI的计算编码。与现有技术相比,本发明具有有效实现CSXI系统的编码扫描、成像精度高等优点。

    一种基于图神经网络的序列推荐方法、装置及介质

    公开(公告)号:CN117829964A

    公开(公告)日:2024-04-05

    申请号:CN202410146313.1

    申请日:2024-02-01

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于图神经网络的序列推荐方法、装置及介质,所述方法包括以下步骤:S1、获取当前用户的当前序列和其他用户的历史序列,构造序列扩展图#imgabs0#通过注意力机制聚合全局上下文信息;S2、获取当前用户的当前序列和当前序列对应的用户节点,构造本地图#imgabs1#提取用户个性化兴趣;S3、整合步骤S1和步骤S2的输出,预测待预测物品为当前用户下一交互物品的概率,选择概率最高的待预测物品作为推荐结果。与现有技术相比,本发明增强了图神经网络对用户数据稀疏性的鲁棒性,同时可以进一步提升预测精确度。

    基于深度图拉普拉斯正则化的点云去噪方法及装置

    公开(公告)号:CN117788329A

    公开(公告)日:2024-03-29

    申请号:CN202311830662.7

    申请日:2023-12-28

    Applicant: 同济大学

    Abstract: 本发明涉及计算机视觉技术领域,尤其是涉及一种基于深度图拉普拉斯正则化的点云去噪方法及装置。该方法将噪声点云划分为多个斑块,每个斑块包括多个补丁;将每个补丁的三维坐标输入特征提取神经网络,得到补丁特征,并根据补丁特征获取每组补丁对之间的距离,得到子图;根据每组补丁对之间的距离获取相似度量,进而获取子图的邻接矩阵和度矩阵,进而获取图拉普拉斯矩阵;根据图拉普拉斯矩阵和所有补丁的三维坐标,优化每个斑块的去噪点云块;利用超采样聚合方法处理所有斑块的去噪点云块,得到最终的去噪点云。与现有技术相比,本发明具有兼顾基于优化方法的鲁棒性和数据驱动方法的强大学习能力,且不易在小数据集下出现过拟合现象等优点。

Patent Agency Ranking