-
公开(公告)号:CN119647929A
公开(公告)日:2025-03-18
申请号:CN202411773309.4
申请日:2024-12-05
Applicant: 同济大学
IPC: G06Q10/0633 , G06Q10/10 , G06N3/042 , G06N3/086 , G06N3/092
Abstract: 本发明涉及云计算和深度强化学习领域,公开了一种基于深度强化学习的大规模科学计算工作流调度方法。本发明提出了引入图注意力网络以提取工作流结构特征,并设计了基于遗传算法的深度强化学习采样策略为深度强化学习智能体生成初始样本轨迹,以加速训练过程。实验表明,本发明能在模拟的云环境下可以获得更快的训练速度,按照生成的大规模科学计算工作流调度策略在云计算平台上执行工作流,能够体现出更优的完成时间、能耗和可靠性。
-
公开(公告)号:CN119583797A
公开(公告)日:2025-03-07
申请号:CN202411706795.8
申请日:2024-11-26
Applicant: 同济大学
IPC: H04N19/119 , H04N19/154 , H04N19/50
Abstract: 本发明提出了一种考虑显著度的基于隐式神经表示的视频编码方法,包括:原始视频预处理;构建基于多尺度特征网格的视频隐式神经表示网络,包括多尺度特征网格和解码器;通过显著度指导的训练策略优化模型;将多尺度特征网格和解码器作为压缩数据进行压缩,得到视频码流;发送并解压视频码流,将每一帧的帧索引通过特征网格生成特征嵌入,将特征嵌入输入解码器输出对应的重构图像,按顺序排列,得到解码的视频。本发明将视频编码在一个隐式神经网络中,提出多尺度特征网格和基于轻量化卷积神经网络的解码器,显著提高视频重建的客观质量,并引入显著度预处理和显著度指导的训练方式,综合提高视频重建的视觉质量。
-
公开(公告)号:CN119420950A
公开(公告)日:2025-02-11
申请号:CN202411603271.6
申请日:2024-11-11
Applicant: 同济大学
IPC: H04N19/91 , H04N19/146 , G06T9/00 , H04N1/41
Abstract: 本发明公开了一种基于混合神经表示的图像压缩方法。本方法针对现有基于深度学习的图像压缩方法存在的解码复杂度高的问题,提出了一种基于混合神经表示的图像压缩方法,对于每幅要压缩的图像单独过拟合轻量化的自编码器网络。具体地,在自编码器网络中,本发明设计了分组特征聚合网络,用来聚合不同组的特征;设计了局部调制网络,用于对局部特征的增强表示;运用了高斯混合模型,提高了码率估计的准确性。实验结果表明,本发明通过混合神经表示的方法,可以有效降低图像解码时的复杂度,实现图像压缩的轻量化。
-
公开(公告)号:CN118154090A
公开(公告)日:2024-06-07
申请号:CN202410301933.8
申请日:2024-03-17
Applicant: 同济大学
IPC: G06Q10/087 , G06N3/0455 , G06N3/092
Abstract: 本发明公开了一种基于Transformer的供应链库存管理方法。本发明针对飞机制造供应链库存管理模型规模增速较快、决策复杂度较高的问题,基于多智能体强化学习序列决策的本质,将多智能体强化学习问题转化为编码器‑解码器架构的序列建模问题,从逻辑上降低算法的复杂度。本发明设计了轻量化编码器模块以及自回归解码器模块:轻量化编码器模块通过利用傅里叶变换的对偶性,对复杂度较高的自注意力机制进行替换,从实现上降低算法复杂度;自回归解码器模块基于信息传递机制的思想,通过自回归顺序决策的方式保证供应链整体的联合策略单调改善。本方法能够在保持性能的基础上,在训练时间、模型参数量等方面相对于现有其他方法实现有效简化。
-
公开(公告)号:CN117152784A
公开(公告)日:2023-12-01
申请号:CN202311000952.9
申请日:2023-08-09
Applicant: 同济大学
IPC: G06V30/422 , G06V30/148 , G06V30/19 , G06V30/146 , G06V30/18 , G06V10/82 , G06V30/26
Abstract: 本发明公开了一种基于改进PP‑OCRv3的厂站接线图文本自动检测和识别方法。本发明针对现有基于深度学习的电网图纸文本检测识别方法在处理多尺度、多方向、形状不规则的紧凑文本方面的局限性问题,提出了基于改进PP‑OCRv3的厂站接线图文本自动检测和识别方法。利用基于像素行聚类的区域重分割模块,纠正了包含垂直和水平字符的不规则形状文本的检测错误。通过BiFPN模块中引入通道注意力机制和深度可分卷积,提高了识别模型对不同尺度输入图像的鲁棒性。利用基于区域扩展和切割的字符重识别模块,减少了简单字符和密集文本对模型的不利影响。实验结果表明,本发明通过对PP‑OCRv3的一系列改进,可以显著提高厂站接线图中文本的检测和识别精度。
-
公开(公告)号:CN115905188A
公开(公告)日:2023-04-04
申请号:CN202211160479.6
申请日:2022-09-22
Applicant: 同济大学
IPC: G06F16/215 , G06F16/22 , G06F16/242 , G06F16/25 , G06F16/36
Abstract: 本发明公开了一种基于知识图谱的数据质量提升方法,包括,对数据库中的建表语句进行预处理,再进行实体抽取和关系抽取;提取数据库中的数据仓库加工流程之间的关系自动化建立知识图谱;基于知识图谱的关系检索,对数据处理和加工过程进行关联关系映射;在运用异常检测算法的过程中,利用知识图谱中的关联关系,为相近数据特征的异常检测提供数据补充,提升大数据的异常值检测效果。本发明简单利用了两种不同的异常检测算法模型对样板用电量数据进行检测,算法本身具有一定的局限性,在利用知识图谱进行群体划分对算法进行优化后,一定程度上提升了算法的精准度,通过知识图谱很好的反映出数据加工结构,有效地提高异常检测的精确度。
-
公开(公告)号:CN114170066A
公开(公告)日:2022-03-11
申请号:CN202111326217.8
申请日:2021-11-10
Applicant: 同济大学
Abstract: 本发明公开了一种基于多注意力网络的任意风格迁移方法。本发明针对现有风格迁移方法在保留显著的内容结构和细节的风格模式方面存在局限性的问题,提出了用于任意风格迁移的多注意网络,利用多注意力机制提取内容图像的显著结构和风格图像的细节纹理,将艺术作品中丰富的风格模式迁移到内容图像中;并设计了一种新颖的注意力损失来保留内容的重要信息。实验结果表明,本发明通过多注意力网络可以保留内容显著结构和风格细节纹理,可以有效生成更高质量的风格化图像。
-
公开(公告)号:CN109688414A
公开(公告)日:2019-04-26
申请号:CN201811556797.8
申请日:2018-12-19
Applicant: 同济大学
IPC: H04N19/593 , H04N19/147 , H04N19/186 , H04N19/11 , H04N19/625 , H04N19/119 , H04N19/176
CPC classification number: H04N19/593 , H04N19/11 , H04N19/119 , H04N19/147 , H04N19/176 , H04N19/186 , H04N19/625
Abstract: 本发明“一种VVC帧内编码单元候选预测模式缩减及块划分提前终止方法”利用了图像纹理复杂度的特性,通过分析图像的纹理复杂度和图像像素值经DCT变换后的非0系数个数之间的关系,提前对该图像块的帧内编码单元候选模式进行缩减,降低模式选择的计算复杂度。还通过分析图像像素值经DCT变换后的非0系数个数以及图像的四个子块之间纹理复杂度的差异和帧内编码单元块的最优划分尺寸之间的关系,提前终止帧内编码单元块的向下递归划分。该方法可以有效的缩减VVC帧内编码单元候选模式的数量以及避免为了寻找最优编码块划分尺寸而进行的额外计算,从而降低VVC编码器的复杂度,在几乎不影响视频编码质量的前提下,有效的降低了VVC编码器的时间复杂度,提高了编码速度。
-
公开(公告)号:CN105430407B
公开(公告)日:2018-06-05
申请号:CN201510881394.0
申请日:2015-12-03
Applicant: 同济大学
IPC: H04N19/40 , H04N19/109
Abstract: 应用于H.264到HEVC转码的快速帧间模式决策方法。根据H.264码流信息以及HEVC帧间编码单元(Coding Unit,CU)不同深度的预测模式信息,对于HEVC不同深度层次的CU采取不同的快速帧间模式决策方法。对于深度为0、1层的CU,使用分类器处理H.264码流解码得到的信息,并计算分别用于Skip模式判定和CU划分的决策阈值。首先根据Skip模式判定阈值对CU进行提前Skip模式判决,然后预测CU是否要向下一层子CU划分。该方法结合了CU划分分布的统计特征以及H.264的码流信息,可以提前地判定Skip模式,有效地预测CU的划分是否应当终止或者继续划分,从而对四叉树进行有效的剪枝和跳过不必要的编码分支。该方法可显著减少H.264到HEVC转码过程中帧间编码的计算复杂度。
-
公开(公告)号:CN108111255A
公开(公告)日:2018-06-01
申请号:CN201711190617.4
申请日:2017-11-24
Applicant: 同济大学
IPC: H04L1/00 , H04N19/177 , H04N19/625 , H04N19/176 , H04N19/89
Abstract: 本发明涉及一种模拟编码中基于最大后验概率的译码方法,包括:S1、发送端将经过模拟编码后的信号和块方差通过引入设定混沌函数伪模拟传输SoftCast发送到接收端;S2、对接收到的模拟信号的噪声建模为高斯噪声,得到等效建模的待解码信号;S3、计算编码增益;S4、利用设定的混沌函数和MAP译码器高斯分布函数的闭合表达式,得到1/2模拟编码和1/3模拟编码的MAP解码闭合表达式;S5、DCT系数矩阵经过IDCT重建得到带噪编码符号的解码输出。与现有技术相比,本发明充分利用信源的先验概率分布信息和已知的接收数据,同时平衡性能和计算复杂度,在实际系统中具有易于使用的优点。
-
-
-
-
-
-
-
-
-