-
公开(公告)号:CN117994122B
公开(公告)日:2024-11-26
申请号:CN202410135881.1
申请日:2024-01-31
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06T3/04 , G06T7/90 , G06N3/0464 , G06N3/0475 , G06N3/044 , G06N3/094
Abstract: 本发明涉及计算机视觉技术领域,具体涉及一种基于循环生成对抗网络的图像风格迁移方法;将风格A的图像集和风格B的图像集共同作为训练集,两种风格的图像集分别把对方的风格作为迁移目标,构建一个用于判断图像的风格和是否经过迁移的判别器,两个用于进行风格迁移的生成器;利用推土机距离和梯度惩罚更新判别器,利用循环一致性损失、一致性损失和两个生成器损失更新生成器;通过推土机距离收敛与否判断训练进程;通过实际生成的效果图来调整多优化目标的损失函数的超参数;本发明改善了循环生成对抗网络训练的稳定性,使得训练进程可视化,有效降低了模型训练的难度,可以用于不同数据集的图像风格迁移任务。
-
公开(公告)号:CN114783072B
公开(公告)日:2022-12-30
申请号:CN202210266952.2
申请日:2022-03-17
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06V40/70 , G06V10/40 , G06V10/774 , G06V10/764 , G06V10/80
Abstract: 本发明公开一种基于远域迁移学习的图像识别方法,包括如下步骤:将医学领域的小样本图像作为目标域,同时将与目标域相似度高的无标签图像作为辅助域,将自然场景图像作为源域,通过基于Resnet50的轻量级网络提取各自域的高级语义特征;利用具有域距离度量的卷积自动编码器并通过辅助域作为桥梁对源域和目标域的高级语义特征进行特征融合;通过卷积自动解码器重构各自域的高级语义特征;最后通过全连接层对目标域图像进行识别,整个过程通过多任务损失函数进行优化。本发明改善了模型对高级语义信息的提取能力和稳定性,有效提升了模型远域特征迁移能力,本发明可以用于不同任务的图像识别任务。
-
公开(公告)号:CN114880527A
公开(公告)日:2022-08-09
申请号:CN202210648954.8
申请日:2022-06-09
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06F16/901 , G06F16/906 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于多预测任务的多模态知识图谱表示方法,包括如下步骤:基于预设的TransR模型、CBOW模型以及ResNet模型分别获取多模态知识图谱中结构化模态、语义模态和图像模态数据的向量表示;利用Imagined方法将语义模态数据的向量表示与图像模态的向量表示进行匹配、重构得到混合模态的向量表示;基于结构化模态和混合模态的向量表示构建三个跨模态预测任务,并针对三个跨模态预测任务分别利用标签平滑技术和自适应权重更新方法构建全连接神经网络的子模型;整合面向不同预测任务的多个子模型得到完整训练模型。本发明可以完成多模态数据表示学习以及后续的知识图谱补全任务。
-
公开(公告)号:CN119068306B
公开(公告)日:2025-04-29
申请号:CN202411087561.X
申请日:2024-08-09
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06V10/82 , G06V10/764 , G06V10/74 , G06V10/44 , G06V10/80 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/09 , G06N3/096 , G06N5/04
Abstract: 本发明涉及数据处理技术领域,具体涉及一种基于多视图知识蒸馏的图像识别方法,包括:通过成像设备获取单一目标在不同视角下的多个成像视图;教师网络对多个视图分别进行卷积辅助分支和注意力辅助分支的并行特征提取;将两个分支生成的辅助特征并行输入多视图对位加权模块进行多视图对应位置间的特征融合;利用融合后的特征向量预测目标在单视角和多视角下的类别概率并使用真实标签进行监督;学生模型对多个视图分别进行原型特征提取;利用师生训练框架对学生网络在真实标签和教师预测标签的监督下进行训练,得到轻量化多视图模型;解决了现阶段多视图识别模型参数量大、训练和推理成本较高、推理速度慢的问题。
-
公开(公告)号:CN119068306A
公开(公告)日:2024-12-03
申请号:CN202411087561.X
申请日:2024-08-09
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06V10/82 , G06V10/764 , G06V10/74 , G06V10/44 , G06V10/80 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/09 , G06N3/096 , G06N5/04
Abstract: 本发明涉及数据处理技术领域,具体涉及一种基于多视图知识蒸馏的图像识别方法,包括:通过成像设备获取单一目标在不同视角下的多个成像视图;教师网络对多个视图分别进行卷积辅助分支和注意力辅助分支的并行特征提取;将两个分支生成的辅助特征并行输入多视图对位加权模块进行多视图对应位置间的特征融合;利用融合后的特征向量预测目标在单视角和多视角下的类别概率并使用真实标签进行监督;学生模型对多个视图分别进行原型特征提取;利用师生训练框架对学生网络在真实标签和教师预测标签的监督下进行训练,得到轻量化多视图模型;解决了现阶段多视图识别模型参数量大、训练和推理成本较高、推理速度慢的问题。
-
公开(公告)号:CN117236333A
公开(公告)日:2023-12-15
申请号:CN202311339881.5
申请日:2023-10-17
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06F40/295 , G06N3/0442 , G06N3/08 , G06N3/0464
Abstract: 本发明涉及信息安全技术领域,具体涉及一种基于威胁情报的复杂命名实体识别方法,包括:从不同专门收集威胁情报的网站获取CTI报告,对获取到的数据进行数据清洗,并构建训练模型的数据集;使用预训练模型RoBERT和BiLSTM获取句子中的词级的向量表示和字符级的向量表示,并将获取到的特征进行拼接;利用CBAM注意力机制和空洞卷积融合实体特征,并使用MLP预测词对关系分数,使用解码器获取最终的识别结果;使用AEDA方法进行数据增强;利用Label Smoothing方法使训练数据标签平滑化;使用训练好的模型对获取的数据进行实体检测;本发明解决了现有的威胁情报实体识别方法难以对威胁情报不规则实体进行准确识别,以及对中英混合实体识别困难的问题。
-
公开(公告)号:CN116051804A
公开(公告)日:2023-05-02
申请号:CN202211378299.5
申请日:2022-11-04
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
Abstract: 本方案涉及一种基于多尺度反瓶颈结构的目标检测方法、装置、计算机设备及存储介质。所述方法包括:获取原始图像并降采样处理,得到降采样图像;对降采样图像进行反瓶颈操作,并根据骨干网络生成特征金字塔网络;通过特征金字塔网络得到不同尺度特征图,并利用无锚框像素级检测在不同尺度特征图上针对不同大小的目标进行多级预测;对多级预测结果进行模型训练后对原始图像进行多级预测以及后处理,得到目标检测框。通过多尺度反瓶颈结构与无锚框检测结合的方式实现图像的多尺度检测,可以避免信息流失,提高信息有效性,以解决现阶段目标检测领域中图像噪点和图像失真导致的目标检测困难问题,提高目标检测的效果。
-
公开(公告)号:CN114880527B
公开(公告)日:2023-03-24
申请号:CN202210648954.8
申请日:2022-06-09
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06F16/901 , G06F16/906 , G06F18/241 , G06F18/2415 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本发明公开一种基于多预测任务的多模态知识图谱表示方法,包括如下步骤:基于预设的TransR模型、CBOW模型以及ResNet模型分别获取多模态知识图谱中结构化模态、语义模态和图像模态数据的向量表示;利用Imagined方法将语义模态数据的向量表示与图像模态的向量表示进行匹配、重构得到混合模态的向量表示;基于结构化模态和混合模态的向量表示构建三个跨模态预测任务,并针对三个跨模态预测任务分别利用标签平滑技术和自适应权重更新方法构建全连接神经网络的子模型;整合面向不同预测任务的多个子模型得到完整训练模型。本发明可以完成多模态数据表示学习以及后续的知识图谱补全任务。
-
公开(公告)号:CN120048010A
公开(公告)日:2025-05-27
申请号:CN202510113075.9
申请日:2025-01-24
Applicant: 南京龙垣信息科技有限公司
IPC: G06V40/70 , G06V40/16 , G06V40/20 , G10L17/00 , G10L25/24 , G06V10/774 , G06V10/82 , G06N3/0442 , G06N3/0464
Abstract: 本发明涉及身份识别技术领域,具体涉及一种基于深度学习的多模态数据融合身份认证与安全监控系统;包括身份认证模块、实时分析模块和远程控制模块,身份认证模块用于,收集用户的面部图像、声音以及行为模式多模态数据,并进行多模态数据融合,输出用户的身份认证数据;实时分析模块用于,分别收集实时的视频数据及音频数据,并融合画面检测数据和声音检测数据,输出实时异常行为数据;远程控制模块用于,存储身份认证数据和实时异常行为数据,并采用远程访问的方式传输数据;通过上述方式,实现提高在分析时提高识别精度,减少受环境因素的干扰,从而提高整体身份认证系统的安全性和用户体验。
-
公开(公告)号:CN119479656A
公开(公告)日:2025-02-18
申请号:CN202411649065.9
申请日:2024-11-19
Applicant: 南京龙垣信息科技有限公司
IPC: G10L17/02 , G10L21/0208 , G10L25/24 , G10L17/18 , H04L9/40
Abstract: 本发明涉及声纹识别技术领域,尤其涉及一种匿名说话人身份验证溯源系统,包括音频输入模块、预处理模块、伪造音频检测模块、声纹溯源模块、身份及匿名技术确认模块、正常音频处理模块和身份验证模块,预处理模块与音频输入模块连接,伪造音频检测模块与预处理模块连接,声纹溯源模块和正常音频处理模块均与伪造音频检测模块连接,身份及匿名技术确认模块和身份验证模块分别与声纹溯源模块和正常音频处理模块连接,以此方式解决了现有技术中声纹认证系统在常环境下表现良好,但缺乏足够的机制来识别和防御经过高级匿名技术处理的声音,进而存在伪造音频的检测能力不足、缺乏溯源能力和适应性和灵活性不足的问题的技术问题。
-
-
-
-
-
-
-
-
-