-
公开(公告)号:CN119027595A
公开(公告)日:2024-11-26
申请号:CN202411506157.1
申请日:2024-10-28
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T17/00 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种X光图像三维重建方法、系统、电子设备及存储介质,所述方法包括利用两个并行的编解码器网络,分别对二维X光图像的冠状面和矢状面进行三维重建,其中,在编码器网络中,利用局部特征增强模块分别提取冠状面X光图像和矢状面X光图像的二维特征图;利用注意力交互模块对冠状面X光图像和矢状面X光图像的二维特征图进行信息交换和融合;利用维度转换单元将所述注意力交互模块处理后的二维特征图转换成三维特征图;在解码器网络中,利用3D反卷积模块通过逐步放大三维特征图并进行三维卷积操作获取三维图像。本发明方法使用两张X光图片即可完成三维CT的重建,减少患者接受的辐射。
-
公开(公告)号:CN118298217A
公开(公告)日:2024-07-05
申请号:CN202410321777.1
申请日:2024-03-20
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明实施例公开了一种细粒度分类模型的训练方法、装置、电子设备及存储介质,涉及细粒度图像分类技术领域,其中,所述方法包括:获取样本图像的数字成像作为训练集;根据深度学习算法构建初始细粒度分类模型;基于孪生网络的思想和所述训练集对初始细粒度分类模型中的特征提取模型进行有监督预训练,充分收敛后基于迁移学习的思想将所述特征提取模型的权重冻结;通过特征识别模型获取各个训练样本的分类结果,根据分类结果与分类标签计算损失迭代优化特征识别模型,优化完成后得到训练完成的细粒度分类模型。本发明解决了现有技术中鉴定人才极度匮乏,细粒度样本的区分能力不足,易发生混淆与误检,导致细粒度样本分类准确度和效率低的问题。
-
公开(公告)号:CN117132671B
公开(公告)日:2024-02-23
申请号:CN202311402700.9
申请日:2023-10-27
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种基于深度自适应隐写网络的多任务隐写方法、系统及介质,所述方法包括以下步骤:在隐藏阶段,发送方基于深度自适应隐写网络采用逐频逐深度提取机制以及自适应空间‑频率提取模块对载体和秘密图像的有效空间、频率信息进行自适应的逐步提取,融合秘密信息和载体信息的有效部分,得到载密图像,并将所述载密图像发送至接收方;在恢复阶段,所述接收方通过恢复网络从所述载密图像中将秘密图像恢复出来。本发明通过在隐藏阶段自适应逐频逐深度地将秘密信息嵌入到载体图像中,显著提升了多个隐写任务的载密图像质量及隐写隐蔽性,同时,由于重要秘密信息的有效嵌入,
-
公开(公告)号:CN117132671A
公开(公告)日:2023-11-28
申请号:CN202311402700.9
申请日:2023-10-27
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种基于深度自适应隐写网络的多任务隐写方法、系统及介质,所述方法包括以下步骤:在隐藏阶段,发送方基于深度自适应隐写网络采用逐频逐深度提取机制以及自适应空间‑频率提取模块对载体和秘密图像的有效空间、频率信息进行自适应的逐步提取,融合秘密信息和载体信息的有效部分,得到载密图像,并将所述载密图像发送至接收方;在恢复阶段,所述接收方通过恢复网络从所述载密图像中将秘密图像恢复出来。本发明通过在隐藏阶段自适应逐频逐深度地将秘密信息嵌入到载体图像中,显著提升了多个隐写任务的载密图像质量及隐写隐蔽性,同时,由于重要秘密信息的有效嵌入,本发明能够恢复阶段中显著提升恢复秘密图像质量及隐写有效性。
-
公开(公告)号:CN117131923A
公开(公告)日:2023-11-28
申请号:CN202311162846.0
申请日:2023-09-06
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N3/094 , G06N3/084 , G06N3/045 , G06N3/0475 , G06F18/214 , G06F18/22 , G06F21/57 , G06F40/295 , G06V10/25 , G06V10/82
Abstract: 本申请公开了一种针对跨模态学习的后门攻击方法及相关装置,方法包括获取待攻击的文本数据和图像数据;基于图像数据中的物体与文本数据的相似度,选取部分关键物体生成图像模态不变组件;基于文本数据中的单词与图像数据的相似度,选取部分关键单词生成文本模态不变组件;基于图像数据和图像模态不变组件生成中毒图像数据;基于文本数据和文本模态不变组件生成中毒文本数据;混合中毒图像数据,中毒文本数据和原始干净数据,生成中毒多模态数据集。本申请通过图像模态不变组件和图像触发生成器生成中毒图像数据,文本模态不变组件和文本触发器生成的中毒文本数据,实现了一个针对跨模态学习的统一的后门攻击框架,并提高了后门攻击的隐蔽性。
-
公开(公告)号:CN116563303B
公开(公告)日:2023-10-27
申请号:CN202310842854.3
申请日:2023-07-11
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供一种场景可泛化的交互式辐射场分割方法,涉及图像处理技术领域,方法包括:获取2D图像中的点击点,根据点击点生成2D交互引导图;对2D交互引导图进行扩散处理,得到3D交互引导图,3D交互引导图中的各个网格点对应的值分别反映3D辐射场的各个网格点与点击点之间的相似性;将3D交互引导图和3D辐射场对应的3D不透明度体素模型连接后输入至3D分割神经网络模型,获取前景概率预测体素模型,前景概率预测体素模型中的各个网格点对应一个前景概率预测值,前景概率预测值反映网格点为前景部分的概率;基于前景概率预测体素模型输出3D场景中的前景部分以实现辐射场分割。本发明可以实现场景可泛化的辐射场分割。
-
公开(公告)号:CN116563840A
公开(公告)日:2023-08-08
申请号:CN202310828211.3
申请日:2023-07-07
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V20/62 , G06V20/70 , G06V30/14 , G06V30/18 , G06V10/82 , G06V30/19 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/0895
Abstract: 本发明提供基于弱监督跨模态对比学习的场景文本检测与识别方法,涉及图像处理技术领域。方法包括:将待识别图像输入至文本识别模型中的第一图像编码器得到第一图像特征图;基于第一图像特征图获取概率特征图、字符位置特征图以及字符语义特征图;基于概率特征图、字符位置特征图和字符语义特征图中确定待识别图像中的文本识别结果;文本识别模型是基于多组包括样本待识别图像以及样本待识别图像对应的第一文本内容标签和文本区域位置标签的第一训练数据训练得到的;文本区域位置标签是基于标签生成模型生成的,标签生成模型基于多组包括样本待标注图像以及样本待标注图像中的第二文本内容标签的第二训练数据训练得到。本发明可以降低标注成本。
-
公开(公告)号:CN116563303A
公开(公告)日:2023-08-08
申请号:CN202310842854.3
申请日:2023-07-11
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供一种场景可泛化的交互式辐射场分割方法,涉及图像处理技术领域,方法包括:获取2D图像中的点击点,根据点击点生成2D交互引导图;对2D交互引导图进行扩散处理,得到3D交互引导图,3D交互引导图中的各个网格点对应的值分别反映3D辐射场的各个网格点与点击点之间的相似性;将3D交互引导图和3D辐射场对应的3D不透明度体素模型连接后输入至3D分割神经网络模型,获取前景概率预测体素模型,前景概率预测体素模型中的各个网格点对应一个前景概率预测值,前景概率预测值反映网格点为前景部分的概率;基于前景概率预测体素模型输出3D场景中的前景部分以实现辐射场分割。本发明可以实现场景可泛化的辐射场分割。
-
公开(公告)号:CN116399314A
公开(公告)日:2023-07-07
申请号:CN202310650448.7
申请日:2023-06-02
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 中冶建筑研究总院(深圳)有限公司 , 中冶建筑研究总院有限公司
Abstract: 本发明提供了一种用于摄影测量的标定装置及其测量方法,涉及摄影测量技术领域,所述标定装置主要包括标定球;所述标定球表面均布有若干等边图形;所述等边图形的颜色与所述标定球的本色不同。本方案通过使用标定球及其测量方法,可以实现单相机测量时的快速标定、测量以及数据拼接,消除了平面标定时信息少、畸变大、操作复杂等问题,并且可以获取三维物体的深度信息,便于进行三维标定,还可以提高图像特征及多视图几何约束的求解精度,从而有效修正三维重建模型的精度。
-
公开(公告)号:CN118364870B
公开(公告)日:2024-11-19
申请号:CN202410796661.3
申请日:2024-06-20
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N3/0455 , G06N3/08 , G06F40/226 , G06F40/284
Abstract: 本发明公开了一种大语言模型的优化方法、装置、电子设备及存储介质,涉及人工智能技术领域,所述大语言模型的优化方法具体包括以下步骤:S10,结合原LLM模型和大模型SFT数据集生成训练数据集;S20,在原LLM模型的主干网络中嵌入旁支网络,以获得新LLM模型,并在旁支网络的输入端输入掩码词元序列;S30,在训练数据集上采用损失函数对新LLM模型进行训练,训练完成后,LLM模型能够在一次推理中预测多个候选词元序列;S40,并行执行候选词元序列的生成和候选词元序列正确性的验证。本发明的有益效果:既节约了资源消耗和时间,又增强了LLM模型的解码能力,还保证了LLM模型输出结果的质量。
-
-
-
-
-
-
-
-
-