-
公开(公告)号:CN112241468A
公开(公告)日:2021-01-19
申请号:CN202010718382.7
申请日:2020-07-23
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/732 , G06F16/783 , G06K9/00 , G06N3/04
Abstract: 本发明提供了一种基于多头目自注意力机制的跨模态视频检索方法、系统及存储介质,该跨模态视频检索方法包括视频编码步骤、文本编码步骤和联合嵌入步骤,本发明通过有监督训练的形式,充分利用训练多模态数据中的语义信息进行训练,同时引入多头目自注意力机制,捕捉视频和文本内部的细微交互,有选择性地关注多模态数据的关键信息来增强模型的表征能力,更好地挖掘数据语义,保证数据在原始空间和在共享子空间中距离的一致性。本发明的有益效果是:通过实验证明,本发明既可以有效保持数据在原始空间相似性,又能提高检索的准确率。
-
公开(公告)号:CN112185395A
公开(公告)日:2021-01-05
申请号:CN202010920024.4
申请日:2020-09-04
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明提出一种基于差分隐私的联邦声纹识别方法,包括一:在服务端进行通用背景模型UBM预训练得到初始通用背景模型UBM;二:客户端接收预训练后的初始通用背景模型UBM,利用本地的私有语音数据进行初始通用背景模型UBM的学习;三:客户端学习得到的统计量进行差分隐私保护;四:服务端聚合多个客户端上传的差分隐私保护后的统计量,更新初始通用背景模型UBM;五:客户端接收更新后通用背景模型UBM,借助本地私有语音数据调整得到该客户端用户的高斯混合模型GMM,利用更新后通用背景模型UBM和该用户的高斯混合模型GMM判别待验证语音是否为该客户端用户所产生。
-
公开(公告)号:CN112183767A
公开(公告)日:2021-01-05
申请号:CN202011059108.X
申请日:2020-09-30
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本申请实施例公开了一种多密钥下模型聚合的联邦学习方法及相关设备,用于在多方协同训练机器学习模型时,保障各个数据公司的数据样本不被公开。本申请实施例的联邦学习方法采用加法同态加密算法,通过密钥生成中心生成公共密钥参数和主密钥,各参与方通过公共密钥参数生成各自的参与方私钥和参与方公钥,使用各自的参与方公钥对模型参数进行加密后发送到保密节点;而后保密节点为各参与方模型添加随机扰动,从而保证在模型参数聚合过程中各参与方的模型参数的数据隐私。
-
公开(公告)号:CN112052480A
公开(公告)日:2020-12-08
申请号:CN202010953756.3
申请日:2020-09-11
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F21/62
Abstract: 本发明实施例提供了一种模型训练过程中的隐私保护方法、系统及相关设备,用于实现模型训练过程中的隐私保护。本发明实施例方法包括:接收服务端发送的目标模型,并接收服务端发送的选择指令,选择指令用于指示随机选中的部分客户端;被选中的客户端以概率P参与目标模型训练,未被选中的客户端以概率(1‑P)参与目标模型训练;所有确定参与目标模型训练的客户端作为目标客户端,分别采用本地数据对目标模型进行训练,并计算每个训练之后的目标模型的模型参数更新值;按照预设差分隐私算法对每组模型参数更新值进行处理生成更新数据,并将更新数据返回给服务端,以使得服务端根据所有的更新数据生成本轮训练的全局模型。
-
公开(公告)号:CN109815303B
公开(公告)日:2020-10-13
申请号:CN201811654923.3
申请日:2018-12-29
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/29
Abstract: 本申请涉及一种基于位置的移动数据存储系统及其优化方法,在预设的负载和存储预算的情况下,根据查询范围及存储系统中的原始数据,生成用于查询的多个候选副本,并使用查询成本评估模块对上述多个副本构成的副本集合进行评估,并从中选择出一个成本最低或接近最低的副本集合。该系统用于实现对基于位置的移动大数据分布式存储系统的宽查询范围性能的优化,并在此基础上提出了贪婪算法及线性规划舍入算法进一步对存储系统的性能进行进一步的发掘。
-
公开(公告)号:CN110473135A
公开(公告)日:2019-11-19
申请号:CN201910701385.7
申请日:2019-07-31
Applicant: 哈尔滨工业大学(深圳)
IPC: G06T1/00
Abstract: 本发明公开了一种图像处理方法、系统、可读存储介质及智能设备,所述方法包括:获取一目标标记图像,通过对抗生成网络模型对所述目标标记图像进行干扰,以得到至少一干扰图像;通过收敛模型对所述干扰图像进行收敛,将收敛合格的干扰图像作为对抗样本,并将所述对抗样本覆盖于目标标记图像上;对进行对抗样本覆盖的目标标记图像进行图像识别,以得到错误标记图像,每个用户所得到的错误标记图片均不相同;根据所述错误标记图像与当前目标标记图像中目标区域的匹配度确定错误标记图像的目标标记图像。本发明能够解决现有水印易被识别和易被干扰这的问题,提高了用户图像隐私体验的满意度,满足了实际应用需求。
-
公开(公告)号:CN110309331A
公开(公告)日:2019-10-08
申请号:CN201910599265.0
申请日:2019-07-04
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/51 , G06F16/583 , G06F16/31 , G06F16/33 , G06K9/62
Abstract: 本发明专利涉及一种基于自监督的跨模态联合哈希检索方法,该方法包括以下步骤:步骤1:针对图像模态数据进行处理:采用深度卷积神经网络对图像模态的数据进行特征提取,对图片数据进行哈希学习,将深度卷积神经网络的最后一层全连接层的节点个数设置为哈希码的长度;步骤2:针对文本模态数据进行处理:使用词袋模型对文本数据进行建模,建立一个两层的全连接神经网络对文本模态的数据进行特征提取,神经网络的输入是使用词袋模型表示的词向量,第一个全连接层节点的数据与第二个全连接层节点的数据与哈希码的长度相同;步骤3:针对类别标签处理的神经网络:采用自监督的训练方式从标签数据中提取语义特征;步骤4:最小化图像与文本网络所提取的特征与标签网络的语义特征间的距离,使得图像与文本网络的哈希模型能够更充分学习不同模态间的语义特征。
-
公开(公告)号:CN110188194A
公开(公告)日:2019-08-30
申请号:CN201910354263.5
申请日:2019-04-26
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种基于多任务学习模型的假新闻检测方法及系统。在一个实施例中:采用多任务学习模型,对待检测新闻的真实性检测和主题分类这两个任务进行联合训练,并同时返回所述待检测新闻的真实性以及所述待检测新闻的所属主题。本发明实施例的教导,能够同时检测出新闻的真实性以及新闻的所属主题,且提高了假新闻检测和主题分类的准确性。
-
公开(公告)号:CN109284411A
公开(公告)日:2019-01-29
申请号:CN201810402753.3
申请日:2018-04-28
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明涉及图像数据处理领域,特别涉及一种基于有监督超图离散化图像二值编码方法。该方法包括以下步骤:S1.假设一个由n幅图像组成训练集,将训练集所有样本通过学习哈希函数映射到汉明空间的二值化哈希码;S2.定义一个线性多分类模型,采用优化函数对离散化变量进行优化,得出第一目标函数;S3.采用超图对数据哈希码之间的距离度量一致性进行约束,得出第二目标函数;S4.整合第一目标函数和第二目标函数,得到完整的目标函数,采用“位循环坐标下降方法”学习哈希码矩阵,并通过迭代运算优化目标函数。本发明既可以保持数据在原始空间相似性,又能提高检索的准确率。
-
公开(公告)号:CN108510559A
公开(公告)日:2018-09-07
申请号:CN201810288688.6
申请日:2018-03-30
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06T9/00
Abstract: 本发明涉及一种基于有监督多视角离散化的多媒体二值编码方法。该方法包括:S1. 假设一个由n幅图像组成训练集,通过学习得到包含一系列子函数的哈希函数,将样本的两种不同模态的特征映射到经过优化的特征空间中,得到的一系列与哈希子函数对应的哈希值,然后通过二值量化将哈希值转化为二值化哈希码:S2. 基于有监督训练的哈希函数:定义一个线性多分类模型并对模型函数进行优化,采用最小平方损失作为目标函数;S3. 基于最小量化损失的哈希函数:假设一种模态的特征,通过哈希函数优化至量化损失最小;S4. 基于多视角锚图的哈希函数:构造锚图,并采用锚图正则化哈希函数;S5. 优化算法。本发明既可以保持数据在原始空间相似性,又能提高检索的准确率。
-
-
-
-
-
-
-
-
-