-
公开(公告)号:CN118521930A
公开(公告)日:2024-08-20
申请号:CN202310184577.1
申请日:2023-02-20
Applicant: 杭州海康威视数字技术股份有限公司 , 浙江大学
Abstract: 本发明公开了一种基于人机混合智能的视频像素级标注方法、装置。其步骤如下:1)使用交互式像素标注工具对视频帧进行稀疏的人工标注;2)使用基于像素匹配的卷积神经网络对稀疏标注的实例物体进行自动追踪匹配;3)利用时序变换神经网络自动将稀疏的视频帧像素标注扩展为密集标注;4)进行半自动低质量标注帧检测;人工修复该帧后作为时序变换神经网络的输入,进一步提升密集标注质量,多轮次迭代后达到用户满意的标注精度。本发明适用于大规模视频的像素级语义与实例标注,大幅度提升视频数据标注效率,且准确性好、标注质量高。本发明对于大规模视频数据标注和分析具有十分重要的实际应用价值。
-
公开(公告)号:CN119338966A
公开(公告)日:2025-01-21
申请号:CN202411874568.6
申请日:2024-12-19
Applicant: 浙江大学
IPC: G06T15/00 , G06T17/00 , G06V10/75 , G06V10/774
Abstract: 本发明公开了一种基于高斯溅射的四维高斯模型生成方法、系统及设备,属于计算机视觉处理领域。本发明的方法首先使用预训练的文本到视频扩散模型生成与给定的文本提示一致的目标视频,然后由图像‑网格生成模型将目标视频逐帧转化为一个三维网格模型,对三维网格模型在主视角下的焦距范围内进行渲染,以计算渲染匹配焦距,采用高斯溅射方法训练初始时刻的静态高斯模型,而后训练形变网络,最终由训练好的静态高斯模型和形变网络生成给定时间戳下的四维高斯模型。本发明的方法可以在用明显短的时间内,生成生动的、纹理精细的、几何关系准确的且准确符合用户输入文字语义的高动态4D模型。
-
公开(公告)号:CN116824189A
公开(公告)日:2023-09-29
申请号:CN202310809759.3
申请日:2023-07-03
Applicant: 浙江大学
IPC: G06V10/762 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0895 , G06N3/091 , G06N3/0464 , G06N3/045 , G06N3/042
Abstract: 本发明公开了一种基于空间结构多样性的数据点语义聚类主动学习方法及装置。其步骤如下:1)将原始点云分组为各个超点,随机选取少量的超点进行人工标注,训练一个初步的模型;2)使用基于权重的超点不确定性估计方法和空间‑结构多样性推理方法,来选择将被人工标注的候选超点;3)利用噪声感知迭代标记策略,将纯度低于阈值的候选超点分割成多个子区域处理。将候选超点进行人工标注,并微调模型;4)对剩余的未标注超点计算softmax entropy,结构复杂度,颜色不连续性三个指标,给区域信息评分排名较高的一批未标注超点打上伪标签,成为已标注数据;5)回到步骤2,利用已标注数据重新训练或微调模型,并重复循环,直到人工标注预算耗尽。
-
公开(公告)号:CN112329891A
公开(公告)日:2021-02-05
申请号:CN202011367208.9
申请日:2020-11-27
Applicant: 浙江大学
Abstract: 本申请提供一种双向注意力和判案逻辑结合的辅助判案方法、装置、介质。本发明将判案逻辑和类案知识应用于基于深度学习的法律判决自动预测任务,相比一般的法律判决自动预测算法,本发明对查明事实和原告诉请、原告诉请之间的判案逻辑知识进行了建模,能有效提升算法的可解释性。本发明首次运用判案逻辑知识对法律判决进行自动预测,与其它在该认为上尝试过的模型相比较,本发明在算法和运用上都有自己的独创性和独特性。本发明可以将司法领域专家知识显性地与深度神经网络相结合,提升智能司法判案准确率,并提供判案可解释性。
-
公开(公告)号:CN107049251A
公开(公告)日:2017-08-18
申请号:CN201710191324.1
申请日:2017-03-28
Applicant: 浙江大学台州研究院
IPC: A61B5/00
CPC classification number: A61B5/4519 , A61B5/4528 , A61B5/4576 , A61B5/458
Abstract: 本发明公开了一种上肢运动控制能力评估系统,包括用户信息模块、系统设置模块、关节活动度模块、肌张力模块、肌力模块和生活能力模块;用户信息模块用于编辑用户信息并获取用户上肢运动控制能力评估报告;系统设置模块用于系统功能设置;关节活动度模块用于测试和评估用户上肢关节的活动度;肌张力模块用于测试用户被动肘屈曲和被动肘伸展动作的肌张力;肌力模块用于测试和评估用户上肢和手部动作的肌力;生活能力模块用于测试和评估用户躯体性和工具性生活能力。本发明评测项目集成度高,使用极其方便,成本低。
-
公开(公告)号:CN120071055A
公开(公告)日:2025-05-30
申请号:CN202510546309.9
申请日:2025-04-28
Applicant: 浙江大学
IPC: G06V10/776 , G06V10/74 , G06V10/82 , G06T7/00 , G06T11/00
Abstract: 本发明公开了一种基于多模态大模型的文本到图像生成模型评估方法与系统。本发明包括多层次图像信息提取与图像特征矩阵构建、分层文本提示生成与优化、生成图像批量化生成、交互式图像对比与评分、多维反馈与提示修订多个步骤,通过重复执行这些步骤流程动态调整生成策略,直至满足预设停止条件。最终,根据参考图像与最优生成图像的多维视觉评估结果,全面分析目标生成模型的性能表现。本发明的评估方法通过图像再生成任务,使生成模型能够基于参考图像的内容和风格进行精准生成,克服了现有评估方法在跨模态信息对齐方面的不足,具有较高的应用价值。
-
公开(公告)号:CN119850847A
公开(公告)日:2025-04-18
申请号:CN202510296870.6
申请日:2025-03-13
Applicant: 浙江大学
IPC: G06T17/00 , G06T15/02 , G06N3/0499 , G06N3/048 , G06T3/08
Abstract: 本发明提供了一种基于物理渲染和不确定性估计的三维场景中和谐化对象生成方法,包括:给定三维场景、生成目标对象的文本描述和目标对象在三维场景2D渲染视图中所处位置的矩形框;根据生成目标对象的文本描述,利用多视角图像生成扩散模型构建目标对象几何外观的可变形四面体网格;构建包括材质项预测模块和不确定性项预测模块的特征网络;利用物理渲染技术获取目标对象的渲染图片,对特征网络进行训练优化;根据三维场景、可变形四面体网格和训练后的特征网络输出的材质项得到包含目标对象的多视角场景渲染密集视图和3D模型文件。本发明有效解决了目标对象与场景融合不和谐的问题,增强了目标对象在场景中的真实感和视觉效果。
-
公开(公告)号:CN119295842A
公开(公告)日:2025-01-10
申请号:CN202411827374.0
申请日:2024-12-12
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/82 , G06V10/74 , G06N3/0464 , G06N3/0895
Abstract: 本发明公开了一种基于领域不变的类别特征的可泛化分类方法、系统及设备,属于计算机视觉处理领域。本发明的方法首先针对预设类别的分类任务,从多个环境中采集图像,以构建源域图像数据集,对源域图像数据集采样以及预处理后,构建多个用于训练的批处理样本集合,每个预处理后的图像对应一个真实类别标签,然后再批处理样本集合上训练图像分类模型,最终将待分类的图像输入到训练好的图像分类模型中,输出图像类别的分类结果。本发明可以从输入特征之间寻找到领域不变且类别特殊的稳定特征,并基于此预测类别,可以有效提升图像分类模型的泛化能力。
-
公开(公告)号:CN118296974A
公开(公告)日:2024-07-05
申请号:CN202410726178.8
申请日:2024-06-06
Applicant: 浙江大学
IPC: G06F30/27 , G06F18/214 , G06F18/22 , G06F119/02
Abstract: 本发明公开了一种基于物理场残差学习的流场仿真方法、系统、介质及设备,属于深度学习和物理方程求解交叉领域。该方法包括:首先利用训练数据或其他数据构建物理流场轨迹检索数据库;然后基于物理流场轨迹检索数据库为训练数据中的每条数据对分配一条相似的辅助流场轨迹,基于辅助流场轨迹和原始的训练数据集生成残差训练数据集;接着,基于现有的算子神经网络,在残差训练数据集上训练残差算子神经网络;最后,由训练好的残差算子神经网络预测物理流场轨迹残差,以得到待求解输入函数的数值解。本发明通过物理场残差学习,一方面缓解了原训练数据中的数据偏差,另一方面避免了神经网络的过拟合现象,显著提升了算子神经网络的物理仿真性能。
-
公开(公告)号:CN118038213A
公开(公告)日:2024-05-14
申请号:CN202410179569.2
申请日:2024-02-18
Applicant: 浙江大学
IPC: G06V10/776 , G06V10/764 , G06V10/762 , G06T7/80 , G06T3/06
Abstract: 本申请公开了一种基于标签检查模型的多模态人工标注标签检查方法及装置,包括:基于开放词汇模型识别2D预测框,检查2D图像数据标签漏标错误、标签不贴合错误、标签名错误,然后通过相机内外参和深度聚类算法生成3D目标框,检查3D点云数据标签漏标错误、标签不贴合错误、标签名错误,最后将3D目标框投影到2D图像生成2D投影框,将2D投影框与2D标注框匹配检查2D目标框、3D目标框关联ID错误,该实施例同时检查了2D目标框和3D数据的标签和ID错误,提高检查效率和准确率,从而能够应对大规模的数据生产,降低数据生产的成本。
-
-
-
-
-
-
-
-
-