利用双向梯度引导的扩散模型生成脱敏文本方法

    公开(公告)号:CN118468332A

    公开(公告)日:2024-08-09

    申请号:CN202410489308.0

    申请日:2024-04-23

    Abstract: 本发明涉及利用双向梯度引导的扩散模型生成脱敏文本方法,属于计算机应用技术领域。本发明基于文本数据生成词嵌入向量,运用差分隐私随机梯度方法训练目标模型和攻击模型,记录二者的梯度方向;对词嵌入向量添加高斯噪声生成加噪数据;利用扩散模型对加噪数据进行逆扩散采样以生成预测词嵌入向量,联合目标模型和攻击模型的梯度方向指导扩散模型参数更新;用BERT模型将预测词嵌入向量转换为脱敏文本数据。本发明针对现有方法忽略敏感词的上下文语义及语义关联问题,提出利用双向梯度引导的扩散模型生成脱敏文本方法,利用逆扩散过程捕获原始语义,通过梯度方向引导扩散模型减弱文本中敏感信息的影响,有效提升脱敏文本数据的可用性和隐私保护效果。

    结合聚类与图注意力机制的多粒度语义融合文本匹配方法

    公开(公告)号:CN115062103A

    公开(公告)日:2022-09-16

    申请号:CN202210534825.6

    申请日:2022-05-17

    Abstract: 本发明涉及结合聚类与图注意力机制的多粒度语义融合文本匹配方法,属于自然语言处理与机器学习领域。本发明首先对实体、句子和主题三种不同粒度的语义信息分别建模得到相应的嵌入向量,实体和主题建模过程中引入外部语义知识;然后分别聚类实体、主题嵌入向量,使用聚类中心作为所在聚类中所有向量的统一表示;接着,利用图注意力机制学习句子级语义与实体、主题级语义之间的关联权重;最后,将训练后的句子向量作为句子的最终表示,进一步进行文本匹配任务。本发明能够有效提高特定领域短文本句子对的匹配效果,在一定程度上解决了待匹配文本过短且包含特定领域词汇导致语义稀疏,匹配准确率低的问题。

    关联拓扑网络动态特征的互联网自治域类型映射方法

    公开(公告)号:CN116208503A

    公开(公告)日:2023-06-02

    申请号:CN202310126432.6

    申请日:2023-02-16

    Abstract: 本发明涉及关联拓扑网络动态特征的互联网自治域类型映射方法,属于计算机与信息科学领域。本发明首先通过whois数据库获取自治域注册信息;其次利用BERT提取注册信息语义特征,同时根据注册信息中的特定自治域属性计算不同自治域间的相似度;然后结合特定自治域属性和自治域间的相似度生成自治域拓扑网络,并利用时间注意力机制提取拓扑网络动态特征;最后融合语义特征和拓扑网络动态特征进行互联网自治域类型映射。本发明针对自治域注册信息不完整的问题,提出并利用一种自治域拓扑网络动态特征提取方法,提高了互联网自治域类型映射的准确率。

    时序异质图嵌入的互联网AS关系推断方法

    公开(公告)号:CN117171637A

    公开(公告)日:2023-12-05

    申请号:CN202311013557.4

    申请日:2023-08-11

    Abstract: 本发明涉及时序异质图嵌入的互联网AS关系推断方法,属于网络空间安全与深度学习领域。首先在AS注册信息和BGP报文中提取特定AS属性和AS关系,构造以AS为节点、AS关系为边的时序异质图;然后基于时序异质图通过Hawkes过程提取节点时序特征,同时依据AS关系对时序异质图进行子图拆分,并通过图注意力网络提取节点交互特征;最后融合节点的时序特征和交互特征,并利用MLP分类器进行AS关系推断。本发明针对基于图神经网络的AS关系推断方法无差别建模不同AS关系以及忽略时间依赖特征的问题,提出一种利用时序异质图嵌入的AS关系推断方法,捕获AS间多类型关系并关注路由交换的时序特征,提升AS关系分类精确率。

    融合ICT供应链网络拓扑特征的产品份额趋势预测方法

    公开(公告)号:CN111489192A

    公开(公告)日:2020-08-04

    申请号:CN202010233687.9

    申请日:2020-03-27

    Abstract: 本发明涉及融合ICT供应链网络拓扑特征的产品份额趋势预测方法,属于自然语言处理与机器学习领域。主要解决市场趋势受到供应链网络行业特征和份额分布的双重影响,且历史敏感性强的问题。首先利用霍克斯过程对时序属性信息进行建模,学习得到时间拓扑嵌入向量表示;其次对多行业复用供应链网络拓扑结构进行嵌入,学习得到供应商节点份额拓扑嵌入向量表示;最后供应商节点的时间拓扑嵌入向量和供应商节点份额拓扑嵌入向量,训练市场趋势预测模型,实现对市场趋势的预测。对招投标平台收集到的265家供应商近三年来的数据进行了实验,结果表明本发明能达到较好的分类效果,进一步提升了产品份额趋势预测的准确率。

Patent Agency Ranking