-
公开(公告)号:CN118820468A
公开(公告)日:2024-10-22
申请号:CN202410845738.1
申请日:2024-06-27
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
IPC: G06F16/35 , G06F21/60 , G06F40/186
Abstract: 一种数据分类分级系统及其数据分类分级方法,属于数据分类技术领域。为改进现有分类分级手段不足的问题,本发明包括应用层、服务层、基础层、数据源层、组件层,所述应用层连接服务层,所述服务层连接基础层,所述基础层分别连接数据源层、组件层,所述服务层包括分类分级引擎、文件识别引擎、系统服务引擎,所述分类分级引擎包括正则匹配模块、大模型智能识别模块,所述文件识别引擎实现对PDF、PPT等文件内容的识别技术,所述系统服务引擎采用Typescript、React、GraphQL和NestJS构建,用于提供系统的核心功能和用户接口。本发明可实现对结构化数据和非结构化数据进行分类分级。
-
公开(公告)号:CN113961438B
公开(公告)日:2024-04-16
申请号:CN202111240836.5
申请日:2021-10-25
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
IPC: G06F11/34 , G06F18/23213 , G06F18/214 , G06F18/2321
Abstract: 本申请公开了一种基于多粒度多层级的历史行为异常用户检测系统、方法、设备及存储介质,属于数据分析技术领域。解决了现有技术中识别异常种类少导致的漏报问题和正常行为模式偏离较大导致的误报的问题。本申请的多粒度多层次聚类包括层级划分、组间粗粒度聚类、组内细粒度聚类;层级划分:将天数按照多个层级进行逐层划分并对每一层级的组内和组间进行定义;组间粗粒度聚类:对每一层级中的每组构建用户的单组特征向量,进行聚类标记;组内细粒度聚类:对每一层级中每组内的用户构建单日行为特征向量,进行聚类标记;最终综合聚类标记得到用户异常行为标记。本申请减少了异常用户的漏报率和误报率,实现了较高的历史行为异常用户识别率和鲁棒性。
-
公开(公告)号:CN113947212A
公开(公告)日:2022-01-18
申请号:CN202111203824.5
申请日:2021-10-15
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
IPC: G06N20/00 , G06V10/764 , G06K9/62
Abstract: 本申请公开了一种发起方权益保护的联邦提升树模型构建方法、系统、设备及存储介质,属于联邦学习技术领域。解决了在联合训练模型时发起方权益保护的问题。本申请发起方与参与方计算分位区间发送给协调方;协调方计算平均的分位数草图发送给发起方和参与方;发起方和参与方计算局部直方图,并对局部直方图添加噪声,发送给协调方;协调方计算全局直方图,发送给发起方与参与方;发起方和参与方计算分裂点的增益,发送给协调方计算根节点;协调方分裂特征与分裂阈值发送给发起方和参与方;发起方和参与方更新局部直方图;发起方选择多个参与方计算下一层节点,重复以上过程进行训练,得到提升树。本申请保护了数据隐私,实现了联邦学习场景。
-
公开(公告)号:CN113360896B
公开(公告)日:2022-09-20
申请号:CN202110619300.8
申请日:2021-06-03
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
Abstract: 本发明提出了一种横向联邦学习架构下的Free rider攻击检测方法,属于人工智能安全领域。本发明首先,通过模型参数增量处理获取高维样本,对高维样本进行降维处理,抽取三部分特征,将特征合并得到压缩后的样本,在评估网络中计算样本的能量,根据能量判断攻击者,由于Free Rider攻击者生成的模型参数是在原本的全局模型参数的基础上按照训练的轮次加入差分扰动,因此在对其计算本地模型参数增量之后,其增量值等于攻击中加入的差分扰动,估计网络在评估样本的似然性时,其样本能量值的平均值会偏高,因此这样的样本数据会被检测为异常,我们设置阈值判断出Free Rider攻击者。解决了基于横向联邦学习架构下的Free Rider攻击的检测能力差的技术问题。
-
公开(公告)号:CN113360897A
公开(公告)日:2021-09-07
申请号:CN202110620214.9
申请日:2021-06-03
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
Abstract: 本发明提出了一种横向联邦学习架构下的Free Rider攻击方法,属于人工智能安全领域。本发明首先,接收参数服务器发送的全局模型,并对接收的全局模型进行伪装处理,通过对全局模型进行加噪,并添加差分时变扰动处理获取Free rider攻击模型参数,最后将伪装成自己训练得到的模型参数返回给参数服务器。随着迭代轮次的增加,噪声水平呈现一定的收敛性,在实验中,我们调整的噪声水平系数m以及衰减参数γ,用来躲避检测。解决了Free rider攻击方法很容易被参数服务器检测出的技术问题。
-
公开(公告)号:CN118820469A
公开(公告)日:2024-10-22
申请号:CN202410845741.3
申请日:2024-06-27
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
IPC: G06F16/35 , G06F40/247
Abstract: 本发明提出一种数据分类分级方法,属于数据分类分级技术领域。包括:步骤一、用户向服务器上传待分类数据,并选择不提供具体数据的字段;步骤二、服得到数据字段和内容,当数据字段不含模板数据时执行步骤三,否则执行步骤四;步骤三、利用识别模型对数据进行字段扫描,若输出的结果与模板中某一数据唯一对应,则根据模板中的对应关系,确定字段等级,否则认为字段不属于模板范围内,执行步骤四;步骤四、利用识别模型对数据进行字段扫描,根据输出结果与模板中数据进行匹配形成正则规则数组,正则规则数组表征匹配结果;步骤五、执行匹配流程,得到分类等级;本发明提出了权重匹配函数。能够更加准确的对数据类型进行分类分级。
-
公开(公告)号:CN113360896A
公开(公告)日:2021-09-07
申请号:CN202110619300.8
申请日:2021-06-03
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
Abstract: 本发明提出了一种横向联邦学习架构下的Free rider攻击检测方法,属于人工智能安全领域。本发明首先,通过模型参数增量处理获取高维样本,对高维样本进行降维处理,抽取三部分特征,将特征合并得到压缩后的样本,在评估网络中计算样本的能量,根据能量判断攻击者,由于Free Rider攻击者生成的模型参数是在原本的全局模型参数的基础上按照训练的轮次加入差分扰动,因此在对其计算本地模型参数增量之后,其增量值等于攻击中加入的差分扰动,估计网络在评估样本的似然性时,其样本能量值的平均值会偏高,因此这样的样本数据会被检测为异常,我们设置阈值判断出Free Rider攻击者。解决了基于横向联邦学习架构下的Free Rider攻击的检测能力差的技术问题。
-
公开(公告)号:CN113902303B
公开(公告)日:2024-04-16
申请号:CN202111186099.5
申请日:2021-10-12
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
IPC: G06Q10/0635 , G06Q30/016 , G06F16/9535
Abstract: 本申请公开了一种基于用户满意度的隐私模型自动推荐系统、算法、设备及存储介质,属于数据分析技术领域。解决了现有技术中存在的用户如何对隐私模型进行选择问题以及如何配置隐私模型参数的问题。本申请用户满意度的隐私模型自动推荐系统、算法、设备及存储介质创造性地提出历史配置方案资源池的概念,针对熟悉隐私保护知识和不熟悉隐私保护知识的用户,通过正向过程与逆向过程相结合对历史配置方案资源池进行迭代升级。历史配置方案资源池在每次数据匿名化处理过程中,以用户满意度为基准自动推荐配置,确保匿名后数据符合用户满意度要求。本申请为数据的匿名化处理提供更加简便高效的解决方案,提高了匿名后数据的质量,增强了数据保护的能力。
-
公开(公告)号:CN113961438A
公开(公告)日:2022-01-21
申请号:CN202111240836.5
申请日:2021-10-25
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
IPC: G06F11/34 , G06V10/762 , G06V10/774 , G06K9/62
Abstract: 本申请公开了一种基于多粒度多层级的历史行为异常用户检测系统、方法、设备及存储介质,属于数据分析技术领域。解决了现有技术中识别异常种类少导致的漏报问题和正常行为模式偏离较大导致的误报的问题。本申请的多粒度多层次聚类包括层级划分、组间粗粒度聚类、组内细粒度聚类;层级划分:将天数按照多个层级进行逐层划分并对每一层级的组内和组间进行定义;组间粗粒度聚类:对每一层级中的每组构建用户的单组特征向量,进行聚类标记;组内细粒度聚类:对每一层级中每组内的用户构建单日行为特征向量,进行聚类标记;最终综合聚类标记得到用户异常行为标记。本申请减少了异常用户的漏报率和误报率,实现了较高的历史行为异常用户识别率和鲁棒性。
-
公开(公告)号:CN113902303A
公开(公告)日:2022-01-07
申请号:CN202111186099.5
申请日:2021-10-12
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
IPC: G06Q10/06 , G06Q30/00 , G06F16/9535
Abstract: 本申请公开了一种基于用户满意度的隐私模型自动推荐系统、算法、设备及存储介质,属于数据分析技术领域。解决了现有技术中存在的用户如何对隐私模型进行选择问题以及如何配置隐私模型参数的问题。本申请用户满意度的隐私模型自动推荐系统、算法、设备及存储介质创造性地提出历史配置方案资源池的概念,针对熟悉隐私保护知识和不熟悉隐私保护知识的用户,通过正向过程与逆向过程相结合对历史配置方案资源池进行迭代升级。历史配置方案资源池在每次数据匿名化处理过程中,以用户满意度为基准自动推荐配置,确保匿名后数据符合用户满意度要求。本申请为数据的匿名化处理提供更加简便高效的解决方案,提高了匿名后数据的质量,增强了数据保护的能力。
-
-
-
-
-
-
-
-
-