-
公开(公告)号:CN119622001A
公开(公告)日:2025-03-14
申请号:CN202510156421.1
申请日:2025-02-12
Applicant: 之江实验室
IPC: G06F16/36 , G06F16/353 , G06F40/279 , G06F40/30
Abstract: 本说明书公开了一种大模型幻觉测评数据生成方法。在此方法中,可以通过实体识别和关系抽取技术,从预先构建的针对不同领域范围的知识库中提取出结构化的知识图谱,进而可以根据知识图谱中各节点之间的连接关系,结合大语言模型生成幻觉测评数据,以对待测试模型针对非直观或模糊信息时的表现进行测评。同时,以原始实体在知识库中对应的文本数据为依据,提供详尽的参考答案,形成文本对。最终得到一套全面的幻觉测评数据集,用以评估待测试模型的理解力和输出信息的准确性。
-
公开(公告)号:CN119363553A
公开(公告)日:2025-01-24
申请号:CN202411486701.0
申请日:2024-10-23
Applicant: 之江实验室
IPC: H04L41/044 , H04L49/356
Abstract: 本说明书公开了一种智算网络结构及智算网络结构的构建方法。在本说明书提供的智算网络结构中,包括核心层、汇聚层、接入层、客户端;在所述智算网络结构中,每个核心层与每个汇聚层之间相互连接,每个汇聚层按照预设规则与至少部分接入层相互连接,每个接入层按照所述预设规则与至少部分汇聚层相互连接,每个客户端与一个接入层相互连接;其中,所述核心层与所述汇聚层以及所述汇聚层与所述接入层之间采用电交换的形式进行连接,所述接入层与所述客户端之间采用光传输的形式进行连接。采用本结构不仅能够降低光链路的故障率,还极大降低了智算网络结构的构建成本。
-
公开(公告)号:CN118195023A
公开(公告)日:2024-06-14
申请号:CN202311843820.2
申请日:2023-12-27
Applicant: 之江实验室
IPC: G06N20/00 , G06F21/62 , G06F18/214
Abstract: 本说明书公开了一种基于区块链的车联网去中心化联邦学习方法,区块链选择初始节点并初始化模型,初始节点随机选择邻近节点将模型传播;参与节点接收到模型后,先与本地模型进行融合,再使用本地数据进行训练,再将更新的模型随机传播给邻近节点,同时发送至委员会;委员会对收到的模型进行质量检测、共识上链;智能合约周期性自动触发执行并行序列模型聚合;任务发布者检测模型是否收敛,若未达到收敛要求,则重复执行上述步骤;学习任务结束,需求方可直接从区块链将模型下载至本地,利用本地数据完成预测。与传统联邦学习相比,本发明具有更好的隐私保护性、更低的通信和储存成本,能够更好地适配快速变化的车联网网络。
-
公开(公告)号:CN117576522B
公开(公告)日:2024-04-26
申请号:CN202410076456.X
申请日:2024-01-18
Applicant: 之江实验室
IPC: G06V10/774
Abstract: 本说明书公开了一种基于拟态结构动态防御的模型训练方法及装置。所述任务执行方法包括:获取预训练模型,将训练预训练模型所使用的第一图像输入到预训练模型中,得到第一图像对应的识别结果。根据第一图像对应的识别结果以及第一图像对应的实际标签,确定出第二图像。将第二图像输入到预训练模型中,以通过预训练模型中的权重网络层,确定预训练模型中设置的各子识别网络对应的权重,以及通过每个子识别网络,分别对第二图像进行识别,得到各识别结果,并根据确定出的各子识别网络对应的权重,对各识别结果进行加权,得到最终识别结果,以最小化最终识别结果与实际标签之间的偏差为优化目标,对预训练模型进行训练。
-
公开(公告)号:CN117910594A
公开(公告)日:2024-04-19
申请号:CN202410030557.3
申请日:2024-01-08
Applicant: 之江实验室
Abstract: 本说明书公开了一种联邦学习训练方法、装置、介质及设备,客户端获取中心服务器发送的待训练模型和隐私预算。通过本地数据对待训练模型进行训练,得到待训练模型的模型更新。根据预设的裁剪因子对模型更新进行调整,得到裁剪后的模型更新。根据预设的敏感度、隐私预算以及裁剪后的模型更新,确定噪声分布。根据裁剪后的模型更新,对噪声分布进行截断,得到截断后的噪声分布,并对更新后的模型更新进行加噪,得到加噪后的模型更新。将加噪后的模型更新返回中心服务器,使中心服务器更新待训练模型,并继续下发至客户端,直至完成对待训练模型的训练,降低了引入的噪声对联邦学习训练模型的可用性的影响,获得更好的模型精度。
-
公开(公告)号:CN116821053A
公开(公告)日:2023-09-29
申请号:CN202311103374.1
申请日:2023-08-30
Applicant: 之江实验室
Abstract: 本申请涉及一种数据上报方法、装置、计算机设备和存储介质,通过获取文件的待上报数据,提取待上报数据的特征值,根据特征值将待上报数据分类至不同的桶文件中进行存储,在桶文件中根据相似度对待上报数据进行聚类,得到多组待上报数据簇,根据每组待上报数据簇下正常数据样本与恶意数据样本的占比,对每组待上报数据簇进行评分,根据分数选取多组待上报数据簇进行上报,通过聚类减少了重复或者相似的无用数据的上报,通过评分对于上报的数据进行了过滤,解决了相关技术中文件数据上报效率较低的问题,降低存储数据需要的空间,提升了文件数据上报的效率。
-
公开(公告)号:CN116523032B
公开(公告)日:2023-09-29
申请号:CN202310235411.8
申请日:2023-03-13
Applicant: 之江实验室
IPC: G06N3/094 , G06N3/096 , G06V30/19 , G06N3/0464
Abstract: 本发明公开了一种图像文本双端迁移攻击方法、装置和介质,该方法的步骤包括分析攻击目标模型、本地替代模型训练、对抗样本生成和对抗样本迁移,其中,分析攻击目标模型,即对比语言图像预训练模型,其可以接受图像与文本两端输入,之后根据输出向量的相似度进行结果预测;本地替代模型训练为根据目标模型的骨干网络训练替代模型,用于迁移攻击;对抗样本生成为对本地替代模型的进行攻击,进而获得图像和文本的对抗样本;对抗样本迁移为对抗样本输入对比语言图像预训练模型,最终导致网络无法正常工作,网络预测分类错误。本发明从图像和文本两个输入端口进行攻击,同时在本地训练相关模型进行迁移攻击,大幅提高了攻击成功率。
-
公开(公告)号:CN116089955B
公开(公告)日:2023-09-26
申请号:CN202211528529.1
申请日:2022-12-01
Applicant: 之江实验室
Abstract: 本发明公开了一种基于windows操作系统的系统调用去噪方法及装置,该方法基于提取到的系统调用参数,构造进程‑线程亲子关系图谱和时序图,对线程进行行为分析和过滤,保留在磁盘/内存/注册表/网络层面产生增、删、改行为的线程,并对这些进程产生的系统调用生成了系统调用描述文件。该方法能够有效减少在系统调用分析中原始数据的噪声,同时保留系统调用原有的亲缘和时序关系,使得计算机产生的系统调用能够以文本的形式进行描述和比较。
-
公开(公告)号:CN115310053A
公开(公告)日:2022-11-08
申请号:CN202211235205.9
申请日:2022-10-10
Applicant: 之江实验室
Abstract: 本发明提供一种强鲁棒性的图像内容审查保护方法和系统,具体操作为接收用户上传的图像,获取用户的信息;对图像进行统一尺寸的调节;对调节后的图像直接进行图像审核;得到原图像审核结果;对调节后的图像进行内容处理,其中,内容处理是采用了一种高效强鲁棒性的中值滤波器方法;再将内容处理后的图像进行图像审核,得到新图像审核结果;对比步骤原图像审核结果和新图像审核结果;若结果一致,则图像审查通过;若结果不一致,则图像审查不通过。针对容易被不法分子滥用缩放攻击,躲避公众平台内容审查,传播不良信息的行为,通过一种高效强鲁棒性的中值滤波器方法,有效抵御缩放攻击的躲避行为,从而保障公众的平台内容安全。
-
公开(公告)号:CN113591083A
公开(公告)日:2021-11-02
申请号:CN202110805548.3
申请日:2021-07-16
Abstract: 本发明涉及一种基于模糊汇编指令序列的恶意代码家族分类方法,属于计算机网络恶意代码检测技术领域。本方法从不同家族的恶意代码中提取出过滤立即数操作数和常量地址操作数后的模糊汇编指令序列特征,训练用于恶意代码家族分类的长短期记忆网络模型。采用的模糊汇编指令序列较现有的字节码序列和操作码序列,在PE恶意代码家族分类任务中具有更高的准确率。采用的模糊汇编指令序列,使用编写的指令掩码对部分类型操作数进行了屏蔽,向较现有字节码序列特征,降低了输入序列的长度,在LSTM模型训练和检测家族环节具有更低的时间成本。相较现有的操作码序列特征,增强了对不同恶意代码家族的刻画能力,具有更好的检测结果。
-
-
-
-
-
-
-
-
-