一种基于检索增强的大语言模型生成方法

    公开(公告)号:CN119782470A

    公开(公告)日:2025-04-08

    申请号:CN202411861746.1

    申请日:2024-12-17

    Abstract: 一种基于检索增强的大语言模型生成方法,属于计算机领域,包括:根据输入问题检索相似文档摘要,将输入问题和文档摘要转换为高维向量空间中的点,检索相关文档并将其转换为结构化的知识图谱,生成子问题并从中提取关键信息,将其转换为关键词,再调用大语言模型进行少样本学习生成联想提示词;结合联想提示词和子问题生成查询命令;通过执行查询命令获得子知识图谱信息并将其转换为文本和文本压缩转换;将转换后的文本与问题输入到GPT‑4大语言模型中生成自然语言答案。本发明能更准确地处理复杂问题中的多层次信息和复杂数据,提高在大规模数据集和复杂文档处理中的准确性、效率和质量,提供准确且连贯的回答,降低运行成本和资源消耗。

    一种基于预训练语言模型的鲁棒的多模态主动学习方法

    公开(公告)号:CN115221947B

    公开(公告)日:2025-03-28

    申请号:CN202210727770.0

    申请日:2022-06-22

    Abstract: 本发明公开了一种基于预训练语言模型的鲁棒的多模态主动学习方法,采用两阶段的混合策略,首先在不确定性度量方面采用基于动量蒸馏的掩码语言损失作为不确定性代理,其继承了ALPS这类冷启动的主动学习策略将掩码语言损失作为度量标准的优点,从输入质量本身考虑样本的不确定性。同时充分考虑样本受具体下游任务的影响,提出一种动量蒸馏方法度量预训练损失在具体任务上的变化。此外针对主动选择策略容易受集体异常值影响的问题,采用了模型训练时预测的伪标签概率和其他标签概率的间距作为异常值指示器,并将这一异常值指示器的值作为聚类初始化选择的一个依据,从而在多样性聚类时减少了异常值的选择,提升了主动选择算法的鲁棒性。

    一种边缘设备上的高效视频流隐私保护方法

    公开(公告)号:CN117156068A

    公开(公告)日:2023-12-01

    申请号:CN202311192623.9

    申请日:2023-09-15

    Abstract: 本发明公开了一种边缘设备上的高效视频流隐私保护方法,在生成对抗网络的基础上,通过自适应图像分块处理和分辨率调整可以根据边缘设备的计算资源限制自动调整,每次处理时仅将高分辨率图片的一部分进行处理,从而降低算法的峰值内存消耗。并且输出的图片格式与大小相比输入没有显著变化,能够在不影响存储和带宽消耗的情况下直接传输到后端进行后续的各类处理,减少了不必要的开销,提升了算法的总体效率。相比于其他的边缘视觉隐私保护系统来说,奔放更加节省计算开销,对不同的边缘设备可以进行自适应调整,具有更广泛的适用性;同时,在隐私保护和语义信息保留的平衡上本发明也具有更好的效果。

    一种基于测试时域适应的可插拔伪造人脸的检测方法

    公开(公告)号:CN120048008A

    公开(公告)日:2025-05-27

    申请号:CN202510115842.X

    申请日:2025-01-24

    Abstract: 本发明提供一种基于测试时域适应的可插拔伪造人脸的检测方法,使用一个在源域训练完成的检测器作为基础检测器,通过可插拔适应模块提高所述基础检测器在目标域的测试准确率;基于测试时域适应的可插拔深度伪造检测模块,在测试阶段提升现有检测器的泛化性能,无需知晓检测器的结构同时不需要重新训练检测器,在测试时域适应过程中,基础检测器的参数冻结不变,只更新特征转换层的参数,旧的特征可以更好的适应新的伪造数据,通过加权其最近邻样本的结果,可以降低预测方差,构建了预测一致性约束用以缓解特征转换层在更新时所受到了噪声样本的影响。

    一种基于通道特征选择的有目标对抗攻击增强方法

    公开(公告)号:CN118736395A

    公开(公告)日:2024-10-01

    申请号:CN202410769117.X

    申请日:2024-06-14

    Abstract: 一种基于通道特征选择的有目标对抗攻击增强方法,属于人工智能安全技术领域,包括:通过Grad‑CAM算法计算出热力图,得到显著区域,将显著区域补齐为显著图;从显著图中随机裁剪以得到局部图像,将局部图像缩放到与原始图像相同的尺寸,将原始图像和局部图像加上相同的对抗扰动输入CNN中,并应用通道特征选择方法,通过损失优化对抗扰动。本发明可在针对性攻击的情况下更大程度地提升对抗样本的可转移性;本发明开创性地将模型注意力应用于针对性的对抗攻击,使扰动学习到如何将原始图像的显著特征更好地转移到目标类别中去。本发明专注于提高对抗样本的可转移性,从而提高黑盒攻击的成功率。

    一种基于自适应隐私预算的推荐方法

    公开(公告)号:CN118132841A

    公开(公告)日:2024-06-04

    申请号:CN202410251428.7

    申请日:2024-03-05

    Abstract: 本发明公开了一种基于自适应隐私预算的推荐方法。首先基于评分时间计算每个评分的总隐私预算,对不同时间段的数据根据其重要程度进行不同强度的隐私保护,避免引入不必要的噪声,导致推荐质量降低。然后改进了梯度下降中分配隐私预算的方式,提出一种自适应隐私预算梯度下降策略,在每次迭代更仔细地分配隐私预算,优化推荐算法结果。对于梯度较大的情况,分配较小的隐私预算以增加噪声,从而更好地保护用户隐私;而对于梯度较小的情况,则分配较大的隐私预算,以减少噪声的干扰,从而提高模型的精确性。本文发明在Movielens‑1M数据集上与现有算法进行比较,实验结果表明该算法保障了用户的隐私安全并且提高了推荐质量。

    一种基于双域图卷积神经网络的内部威胁异常检测方法

    公开(公告)号:CN116484363A

    公开(公告)日:2023-07-25

    申请号:CN202211391970.X

    申请日:2022-11-08

    Abstract: 本发明公开了一种基于双域图卷积神经网络的内部威胁异常检测方法,包括如下步骤:S1、基于用户之间的交互信息构建始邻接矩阵,根据原始特征矩阵和结构信息,通过加权特征相似度函数构建特征域的邻接矩阵和特征矩阵;S2、分别通过拓扑域卷积和特征域卷操作,在拓扑域和特征域上传播节点特征,以学习相应的图嵌入;S3、根据从拓扑域和特征域中提取的图嵌入,对用户行为和操作进行矢量化,利用注意力机制来学习这两个图嵌入中每个节点的重要性权重,并自适应地传播,生成最终的节点嵌入。本发明在传统的图卷积神经网络的基础上,提出双域图卷积神经网络模型,同时考虑到了节点的结构信息和特征信息,提高内部威胁检测的准确率,降低误报率。

    基于CNN-Linformer模型的浏览器识别方法

    公开(公告)号:CN116310728A

    公开(公告)日:2023-06-23

    申请号:CN202310311808.0

    申请日:2023-03-28

    Abstract: 本发明公开了一种基于CNN‑Linformer模型的浏览器识别方法,先通过CNN提取输入数据的时序特征,再通过Linformer的线性注意力聚焦重要的特征,提高了模型的准确率,并通过多头注意力对数据进行并行计算,提高了模型的训练速度。同时,通过删除Linformer中的解码器部分、输入嵌入部分和位置编码部分对Linformer进行简化,降低了模型的复杂度进而提高计算的速度。此外,本发明针对现有的其他方法没有全面考虑各种伪指纹技术带来准确率下降的问题,利用了随机化属性值和添加噪声两种伪指纹技术对原始数据集进行数据增强,然后使用含有正常指纹和伪指纹的增强数据集对CNN‑Linformer模型进行了训练。本方法具有准确率高和识别速度快的优点,在伪指纹场景下具有良好的鲁棒性。

    一种基于自适应MDS分数的深度伪造视频检测方法

    公开(公告)号:CN114387675A

    公开(公告)日:2022-04-22

    申请号:CN202210040177.9

    申请日:2022-01-14

    Abstract: 本发明公开了一种基于自适应MDS分数的深度伪造视频检测方法,包括以下步骤:S1、提取训练集中每个视频的视觉流和音频流;S2、通过训练获得真假两种视频的平均MDS得分,同时建立检测模型;S3、将测试视频输入检测模型,计算测试视频的MDS分数,比较其与两种视频平均MDS得分的距离,测试视频MDS分数离哪一类视频MDS分数更接近则被判定为对应类别。本发明的基于自适应MDS分数的深度伪造视频检测方法,相对于一般的固定门限的方法,解释性更强,准确率也更高,同时让分类的依据更加接近于训练用的训练数据,只要让网络结构进行一个轮次的训练,就可以得到比较接近当前数据集的合理判断依据,更加方便快捷,提高检测效率。

Patent Agency Ranking