一种串匹配场景下数据集生成方法、设备和可读存储介质

    公开(公告)号:CN107515897A

    公开(公告)日:2017-12-26

    申请号:CN201710589808.1

    申请日:2017-07-19

    CPC classification number: G06F16/90344

    Abstract: 本发明涉及一种串匹配场景下数据集生成方法、设备和可读存储介质。该方法包括以下步骤:1)独立地生成模式串的每个字符,形成预设规模和预设长度的随机模式串集合;2)根据已生成的随机模式串集合,构造指定命中水平的文本数据集;3)输出生成的随机模式串集合和文本数据集。该设备包括通过总线连接的接收器、处理器、存储器和发送器,所述存储器用于存储串匹配场景下数据集生成指令。本发明能够生成预设规模预设长度的随机模式串集合,根据已生成的随机模式串集合可以构造指定命中水平的文本数据集,该随机模式串集合和文本数据集能够用于串匹配算法的功能测试和性能测试,对串匹配算法的进一步研究和性能提升有重要的作用。

    一种基于多视图蒸馏增强的实体链接方法

    公开(公告)号:CN118760772A

    公开(公告)日:2024-10-11

    申请号:CN202410736212.X

    申请日:2024-06-07

    Abstract: 本发明公开了一种基于多视图蒸馏增强的实体链接方法。本方法包括:1)多视图实体表征:将每个实体原本篇章级的文本描述分成多个句子级的视图,对每一视图独立地经过语言模型进行编码,得到每一句子视图对应的向量表征;从中选择一个和提及最相关的视图的向量表征作为实体的向量表征,以避免与提及无关的信息被引入到实体表征中;2)多视图蒸馏增强:在引入了细粒度的视图表征后,通过交叉对齐和自对齐机制,分别在原始的实体层次以及细粒度的视图层次两个维度上对齐学生模型和教师模型间的相关性分数分布,从而促进教师模型到学生模型的细粒度知识蒸馏。本发明促进了实体链接系统的整体性能的提升。

    一种基于元伪标签的半监督恶意域名检测方法及系统

    公开(公告)号:CN118646570A

    公开(公告)日:2024-09-13

    申请号:CN202410715623.0

    申请日:2024-06-04

    Abstract: 本发明公开了一种基于元伪标签的半监督恶意域名检测方法及系统,属于网络安全领域。本发明从DNS流量中提取域名之间的关联关系并建立域名关联图,提取域名特征并作为域名关联图中节点的初始化向量;将由金标签节点和无标签节点输入到伪标签生成器,推测出无标签节点上的伪标签,得到伪标签节点;将金标签节点和伪标签节点输入到域名分类器中,预测出良性域名和恶意域名;通过对伪标签生成器和域名分类器进行循环迭代训练,优化域名分类器的内循环参数和伪标签生成器的外循环参数;利用训练好的域名分类器对网络DNS流量中的恶意域名进行检测。本发明能够检测出隐藏在孤立节点中的恶意域名。

    一种基于多粒度情感的对话推荐方法及系统

    公开(公告)号:CN115630145A

    公开(公告)日:2023-01-20

    申请号:CN202211175448.8

    申请日:2022-09-26

    Abstract: 本发明公开了一种基于多粒度情感的对话推荐方法及系统。本方法为:1)利用对话推荐系统中的编码器对历史对话上下文语句进行语义编码;其中,所述语义编码包括历史对话上下文语义向量编码和多粒度情感感知向量编码;所述历史对话上下文语义向量编码方法为:使用词向量嵌入矩阵和位置嵌入矩阵将历史对话上下文中的每个文本单元表示为对应的文本单元语义向量,得到历史对话上下文的语义表示向量;所述多粒度情感感知向量编码方法为:对历史对话上下文中的情感词进行编码得到历史对话上下文的多粒度情感感知向量;2)对语义编码进行线性变换映射,并将映射结果与历史对话上下文进行拼接后输入对话推荐系统中的解码器,得到推荐的回复语句。

    一种基于卷积神经网络的用户属性推断方法和装置

    公开(公告)号:CN108492200B

    公开(公告)日:2022-06-17

    申请号:CN201810124041.X

    申请日:2018-02-07

    Abstract: 本发明涉及一种基于卷积神经网络的用户属性推断方法和装置。该方法根据用户节点的属性和好友关系,建立自中心网络;然后采用卷积神经网络提取所述自中心网络中用户节点的属性信息和好友关系中所包含的隐藏信息,利用所述隐藏信息推断出用户的缺失属性。针对好友关系无法直接获取或获取难度较大的社交网络,采用神经网络仅利用用户的属性信息对缺失的属性进行分类预测。本发明可以很好的避免人为定义相似度函数的局限性,而且通过卷积核的卷积操作能够更好的表现出不同属性间以及不同的属性维度间的关系,从而能够高效、准确地进行用户缺失属性推断。

Patent Agency Ranking