-
公开(公告)号:CN118298964A
公开(公告)日:2024-07-05
申请号:CN202410402635.8
申请日:2024-04-03
Applicant: 中电建建筑集团有限公司 , 浙江大学 , 杭州新中大科技股份有限公司
IPC: G16C20/70 , G16C20/30 , G06N3/0442 , G06N3/045 , G06N3/048 , G06F18/25 , G06F18/15 , G06F123/02
Abstract: 本发明公开了一种基于时间注意力的有毒气体浓度预测方法,其包括获取有毒气体浓度和相关环境因素,有毒气体浓度与环境因素用于表征二维时间序列数据的测量结果及状态参数;根据所述二维时间序列数据做归一化处理,归一化处理用于表征所述基于时间注意力滑动窗口的长短期记忆网络模型;将二维时间序列数据导入长短期记忆网络模型以进行迭代处理;得到结果参数;根据所述结果参数得到有毒气体浓度预测的准确性和预测精度。通过设计了基于长短期记忆网络框架的有毒气体浓度和相关因素的模型,它包含学习变量之间依赖关系的时间注意力滑动窗口模块,可以灵活且高效实现精准的有毒气体浓度的预测和监测,同时该系统能够便携地被部署在边缘计算设备上。
-
公开(公告)号:CN118115740A
公开(公告)日:2024-05-31
申请号:CN202410318086.6
申请日:2024-03-20
Applicant: 浙江大学
IPC: G06V10/26 , G06V10/44 , G06V10/52 , G06V10/86 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06T7/00
Abstract: 本发明公开了一种基于多尺度深度学习的医学影像指代分割方法及装置,包括:获取病人的肿瘤CT图像与相应的文字描述;将文字描述嵌入为若干token,再输入基于Transformer的语言编码器中,形成高维的词向量,得到语言特征;根据肿瘤CT图像与语言特征,通过四个空间分辨率递减的阶段,运用MSFA进行视觉特征编码和多模态特征融合;对于每一个阶段输出的融合视觉特征,应用了双线性插值的上采样,将每一个阶段的多模态特征图输出缩放通道数至统一维度,然后将其拼接,得到最终特征图,再输入全尺度解码器进行解码,得到标志目标物体的像素级别的分割掩码。本发明可以在医疗诊断中,用于辅助肿瘤的识别,以此简化流程。
-
公开(公告)号:CN112633503B
公开(公告)日:2023-08-22
申请号:CN202011493947.2
申请日:2020-12-16
Applicant: 浙江大学
Abstract: 本发明公开了一种基于神经网络的工具变量生成与反事实推理方法及装置。针对之前的基于工具变量的反事实推理(如手写数字识别)方法需要预先定义和可获取的工具变量的问题,本发明直接从可观测变量中学习和解耦出工具变量,大大提升了因果推断效率,节省了时间和成本。本发明首次自动地从可观测变量中提取出工具变量,在算法和运用上有独创性和独特性。将本发明应用于现有的基于工具变量的反事实预测方法,与使用真实工具变量的方法相比性能因果推断有明显提升。本发明着重于从可观测变量中解耦出工具变量的表征,解决了基于工具变量的反事实预测技术需要预先使用先验知识和高昂成本获取工具变量数据的难题,提升了手写数字识别等领域精度。
-
公开(公告)号:CN116129493A
公开(公告)日:2023-05-16
申请号:CN202211643964.9
申请日:2022-12-20
Applicant: 浙江大学
IPC: G06V40/16 , A61B5/02 , G06V10/25 , G06V10/82 , G06V10/30 , G06V10/56 , G06F18/213 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于人脸视频的脉搏波形测量方法及装置、电子设备,包括:从人脸视频中提取原始rPPG信号;构建并训练基于Transformer的神经网络,所述神经网络主要由多个Transformer模块纵向堆叠而成,所述Transformer模块包括:一维Patch Embedding,用于将原始rPPG信号转换维度,生成后续Transformer编码器能够接受的token;包含多头自注意力模块的Transformer编码器,用于促使网络对信号时域全局建立联系;信号复原变换,用于将Transformer编码器的输出转换维度,还原为一维时间信号;将所述原始rPPG信号输入到训练好的基于Transformer的神经网络中进行增强与降噪处理,得到处理后的一维时间信号,即脉搏波形。本发明提升了测量精确度。
-
公开(公告)号:CN112948578B
公开(公告)日:2022-05-17
申请号:CN202110124340.5
申请日:2021-01-29
Applicant: 浙江大学
IPC: G06F16/35 , G06F40/216 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种DGA域名开集分类方法、装置、电子设备及介质,包括:获取待分类的DGA域名;将所述DGA域名分别分割为字符粒度的元素和单词粒度的元素;对所述字符粒度的元素和所述单词粒度的元素分别进行哈希计算,得到字符级别整数编码和单词级别整数编码;将所述字符级别整数编码和单词级别整数编码输入基于自注意力的DGA域名检测网络中,得到域名属于各已知DGA域名家族的概率;采用深度开集分类方法,根据所述概率,识别属于未知DGA域名家族的域名,得出分类结果。
-
公开(公告)号:CN116824213B
公开(公告)日:2024-08-16
申请号:CN202310555362.6
申请日:2023-05-17
Applicant: 杭州新中大科技股份有限公司 , 浙江大学 , 杭州浩联智能科技有限公司
IPC: G06V10/764 , G06V10/82 , G06V10/80 , G06V10/44 , G06V10/10 , G06N3/0464 , G06N3/045
Abstract: 本申请公开了一种基于多视角特征融合的渣土车带泥检测方法及装置,包括获取渣土车在至少两个视角下的目标图像,并将每个目标图像分别输入至卷积神经网络中,得到第一轮廓特征;对初始融合特征编码以及所有第一轮廓特征进行多角度融合编码处理,得到目标融合特征编码以及视觉特征;基于全连通层对目标融合特征编码以及所有视觉特征进行分类处理,并根据预设的权重对处理结果进行加权求和处理,得到目标预测值;根据目标预测值判断渣土车的冲洗情况是否达标。通过对多个视角的目标图像进行识别,可提取出更加丰富的视角特征;并结合多角度融合编码处理的方式,捕捉跨视角融合的特征,不仅更好的改善分类性能,且提高了预测结果的准确性。
-
公开(公告)号:CN118015249A
公开(公告)日:2024-05-10
申请号:CN202410011507.0
申请日:2024-01-04
Applicant: 浙江大学
IPC: G06V10/25 , G06V10/764 , G06V10/766 , G06V10/82 , G06N3/0895
Abstract: 本发明公开了一种基于辅助教学网络的半监督目标检测方法及装置。用于解决难以保证生成的伪标签的质量和模型对困难样本的识别能力不足的问题;本发明在教师‑学生模型的基础上增加一个助理模型,使其和教师模型在随机噪声下进行相同数据的学习,通过教师模型和助理模型的损失累积值计算矫正权重,以此进行伪标签的自适应校正,提高生成伪标签的质量;本发明设计了一个低置信度目标筛选机制,对困难样本进行二次筛选,降低困难样本产生的干扰;本发明主要用于利用少量有标签的样本数据和大量无标签的样本数据训练出高精度的目标检测模型。
-
公开(公告)号:CN116502882B
公开(公告)日:2023-10-20
申请号:CN202310788030.2
申请日:2023-06-30
Applicant: 杭州新中大科技股份有限公司 , 浙江大学 , 杭州浩联智能科技有限公司
IPC: G06Q10/0631 , G06Q10/0633 , G06Q10/10 , G06Q50/08 , G06F18/25
Abstract: 本发明实施例公开了一种基于多模态时序信息融合的工程进度确定方法及装置。其中,方法包括:获取当前工程进度信息,以及与各所述工程进度信息对应的历史工程进度信息;分别根据各所述当前工程进行信息,以及与各所述当前工程进度信息对应的历史工程进度信息确定各时序工程特征;将各所述时序工程特征输入至基于维度解耦的多模态融合模块中,得到融合后的多模态时序信息;根据所述融合后的多模态时序信息确定当前工程进度。本发明实施例的方案,可以基于施工现场的多模态信息进行工程进度的准确确定。
-
公开(公告)号:CN116543190A
公开(公告)日:2023-08-04
申请号:CN202211707585.1
申请日:2022-12-29
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/774 , G06V10/40
Abstract: 本发明公开了一种用于测试时间的图像分类域泛化方法及装置、电子设备,包括:在测试时间,将目标域图像输入由源域数据训练好的深度神经网络模型中,进行首次预测,并构建伪标签,所述深度神经网络模型由特征提取器和线性分类器组成;使用伪原型分类器替代所述线性分类器,依据所述伪标签,使用预测熵值低于设定值的目标域图像样本的特征表示更新伪原型分类器;使用更新后的伪原型分类器进行二次分类,并构建二次伪标签;使用未经目标域图像更新的所述深度神经网络模型进行初始模型预测;根据所述首次预测和所述初始模型预测,对目标域图像样本进行过滤及打分;结合过滤信息、样本分数和二次伪标签,对特征提取器进行更新。
-
公开(公告)号:CN114677535A
公开(公告)日:2022-06-28
申请号:CN202210193844.7
申请日:2022-03-01
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/74 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种域适应图像分类网络的训练方法、图像分类方法及装置,其中域适应图像分类网络的训练方法包括:获取若干对源域图像和目标域图像;提取其中一对源域图像和目标域图像的跨层特征;利用注意力机制计算跨层特征之间的相似度;根据所述跨层特征的多核最大均值差异和所述相似度,计算域对齐泛化损失;根据源域图像和目标域图像的跨层特征,计算分类损失;根据域对齐泛化损失和分类损失,加权计算域适应图像分类网络的总损失;根据总损失,更新域适应图像分类网络的参数;对其余源域图像和目标域图像执行从提取其中一对源域图像和目标域图像的跨层特征至根据总损失更新域适应图像分类网络的参数的步骤,直至跨层对齐损失收敛。
-
-
-
-
-
-
-
-
-