一种注意力机制下基于特征表征的点击率预估模型

    公开(公告)号:CN113887694B

    公开(公告)日:2025-03-04

    申请号:CN202010629307.3

    申请日:2020-07-01

    Inventor: 杨卫东 杜博亚

    Abstract: 为了根据待测对象的对象特征完成点击率预估,可作为数据精排环节应用于企业级推荐系统、搜索系统和在线广告系统等领域。本发明提供一种注意力机制下基于特征表征的点击率预估模型,该模型包括:特征嵌入层,用于将连续型特征和离散型特征进行矢量化处理进而形成堆叠特征、显式特征交叉网络,通过注意力交叉网络将堆叠特征进行显式特征组合、隐式特征交叉网络,通过多层感知机将堆叠特征进行隐式特征组合以及预估概率输出层,根据接收到的组合特征对点击率进行预估。其中,注意力交叉网络消除了预估模型对人工特征工程的依赖,同时注意力机制的引入,区分了各组合特征对模型预估的重要性,消除了无用、冗余特征对模型的影响。

    基于多测量值的贝叶斯张量补全算法

    公开(公告)号:CN114756813A

    公开(公告)日:2022-07-15

    申请号:CN202210331188.2

    申请日:2022-03-31

    Inventor: 杨卫东 王小航

    Abstract: 本发明提供一种基于多测量值的贝叶斯张量补全算法,将多测量值数据用多个张量表示,并设定张量的每个张量元素的每个测量值服从高斯分布;然后对张量进行CP分解,得到相应的因子矩阵,并设定因子矩阵的参数服从共轭先验分布;进而采用吉布斯抽样法对各参数的后验条件分布分别抽样,输出张量的估计值,基于张量的估计值对多测量值数据中的缺失值进行插值,从而实现数据补全。综上所述,本发明的补全方法针对于测量精度低、成本高且某些区域反复测量多次的测量数据,采用吉布斯抽样法结合CP分解实现数据补全,相比现有技术中的补全方法,由于本发明的方法可以利用全部测量数据的信息,因此能够提供更准确的估计值,从而实现更精确的数据补全。

    基于关键字的RDF聚合查询方法
    3.
    发明公开

    公开(公告)号:CN114253998A

    公开(公告)日:2022-03-29

    申请号:CN202011006567.1

    申请日:2020-09-23

    Inventor: 马晓芳 杨卫东

    Abstract: 本发明提供了基于关键字的RDF聚合查询方法,其特征在于,包括如下步骤:基于RDF模式图以及聚合字典对关键字进行匹配得到关键元素组以及聚合信息;然后获取多个候选查询解释;再根据侯勋查询解释在RDF模式图上进行扩展得到查询结构图;接着利用查询结构图以及聚合信息得到多个候选查询意图,并利用意图分数计算方法依次对候选查询意图进行评分并排序;将分数最高的多个候选查询意图转换为SPARQL查询语句并执行得到查询结果。本发明支持包含聚合操作的关键字查询以及不包含聚合操作的一般关键字查询,使得RDF数据上的关键字查询更加高效、准确。

    网络安全知识图谱的嵌入表示方法及装置

    公开(公告)号:CN113495963B

    公开(公告)日:2023-03-14

    申请号:CN202010194889.7

    申请日:2020-03-19

    Inventor: 张佳敏 杨卫东

    Abstract: 本发明提供一种网络安全知识图谱的嵌入表示方法及装置,其特征在于,包括如下步骤:网络安全数据预处理步骤,基于预先构建的网络安全知识图谱本体对网络安全数据进行整理形成结构化数据;网络安全数据集构建步骤,基于结构化数据对实体和关系进行索引标注,并计算附加信息作为训练权重,从而构建出含有训练权重的网络安全数据集;嵌入算法模型选取及配置步骤,选定需要进行对比实验的嵌入算法并输入配置参数从而形成一个训练任务;嵌入算法模型训练步骤,执行训练任务;嵌入算法模型测试步骤,基于嵌入表示结果进行链接预测;训练结果分析以及显示步骤,显示给用户查看从而让该用户分析确认。

    基于知识图谱构建规章的本体模型的方法

    公开(公告)号:CN113407725B

    公开(公告)日:2022-03-18

    申请号:CN202010185109.2

    申请日:2020-03-17

    Inventor: 刘宏刚 杨卫东

    Abstract: 本发明提供一种基于知识图谱构建规章的本体模型的方法,用于通过知识图谱对规章文本进行处理从而形成一个本体模型,其特征在于,包括如下步骤:步骤S1,获取规章文本并进行划分;步骤S2,将主语、宾语分别构建为第一图节点以及第二图节点;步骤S3,将谓语以及宾语中的连接词构建为关系图节点;步骤S4,为第一图节点、第二图节点以及关系图节点分别构建关系链接;步骤S5,在规章文本存在索引号时,将该索引号构建为索引图节点,并为索引图节点构建一个第三关系连接并分别与第一图节点、第二图节点以及关系图节点链接;步骤S6,对规章文本进行抽象并确定对应实体类别以及关系类别;步骤S7,基于实体类别、关系类别以及规章文本构建本体模型。

    领域实体抽取方法、计算机设备、计算机可读介质及处理器

    公开(公告)号:CN113496120A

    公开(公告)日:2021-10-12

    申请号:CN202010194752.1

    申请日:2020-03-19

    Abstract: 本发明提供一种领域实体抽取方法、计算机设备、计算机可读介质及处理器,用于构建一个能够对漏洞描述文本中的领域实体进行自动抽取的命名实体识别模型,其特征在于,包括如下步骤:步骤S1,构建领域实体库;步骤S2,构建外部字典;步骤S3,基于所述实体库以及所述外部字典对所述漏洞描述文本进行实体匹配从而抽取出每个所述漏洞描述文本中的所有领域实体;步骤S4,使用词性标注工具标注出每个所述漏洞描述文本中各个文本单词的词性;步骤S5,将所述漏洞描述文本、对应的所述领域实体以及所述文本单词的词性构建为训练用数据集并训练出命名实体识别模型。

    网络安全知识图谱的嵌入表示方法及装置

    公开(公告)号:CN113495963A

    公开(公告)日:2021-10-12

    申请号:CN202010194889.7

    申请日:2020-03-19

    Inventor: 张佳敏 杨卫东

    Abstract: 本发明提供一种网络安全知识图谱的嵌入表示方法及装置,其特征在于,包括如下步骤:网络安全数据预处理步骤,基于预先构建的网络安全知识图谱本体对网络安全数据进行整理形成结构化数据;网络安全数据集构建步骤,基于结构化数据对实体和关系进行索引标注,并计算附加信息作为训练权重,从而构建出含有训练权重的网络安全数据集;嵌入算法模型选取及配置步骤,选定需要进行对比实验的嵌入算法并输入配置参数从而形成一个训练任务;嵌入算法模型训练步骤,执行训练任务;嵌入算法模型测试步骤,基于嵌入表示结果进行链接预测;训练结果分析以及显示步骤,显示给用户查看从而让该用户分析确认。

    领域实体抽取方法、计算机设备、计算机可读介质及处理器

    公开(公告)号:CN113496120B

    公开(公告)日:2022-07-29

    申请号:CN202010194752.1

    申请日:2020-03-19

    Abstract: 本发明提供一种领域实体抽取方法、计算机设备、计算机可读介质及处理器,用于构建一个能够对漏洞描述文本中的领域实体进行自动抽取的命名实体识别模型,其特征在于,包括如下步骤:步骤S1,构建领域实体库;步骤S2,构建外部字典;步骤S3,基于所述实体库以及所述外部字典对所述漏洞描述文本进行实体匹配从而抽取出每个所述漏洞描述文本中的所有领域实体;步骤S4,使用词性标注工具标注出每个所述漏洞描述文本中各个文本单词的词性;步骤S5,将所述漏洞描述文本、对应的所述领域实体以及所述文本单词的词性构建为训练用数据集并训练出命名实体识别模型。

    基于知识图谱构建规章的本体模型的方法

    公开(公告)号:CN113407725A

    公开(公告)日:2021-09-17

    申请号:CN202010185109.2

    申请日:2020-03-17

    Inventor: 刘宏刚 杨卫东

    Abstract: 本发明提供一种基于知识图谱构建规章的本体模型的方法,用于通过知识图谱对规章文本进行处理从而形成一个本体模型,其特征在于,包括如下步骤:步骤S1,获取规章文本并进行划分;步骤S2,将主语、宾语分别构建为第一图节点以及第二图节点;步骤S3,将谓语以及宾语中的连接词构建为关系图节点;步骤S4,为第一图节点、第二图节点以及关系图节点分别构建关系链接;步骤S5,在规章文本存在索引号时,将该索引号构建为索引图节点,并为索引图节点构建一个第三关系连接并分别与第一图节点、第二图节点以及关系图节点链接;步骤S6,对规章文本进行抽象并确定对应实体类别以及关系类别;步骤S7,基于实体类别、关系类别以及规章文本构建本体模型。

    基于神经网络的异常检测方法
    10.
    发明公开

    公开(公告)号:CN115115019A

    公开(公告)日:2022-09-27

    申请号:CN202110296482.X

    申请日:2021-03-19

    Inventor: 杨卫东

    Abstract: 本发明提供了一种基于神经网络的异常检测方法,用于对多维时序数据中的异常数据进行自动化检测,包括以下步骤:步骤1,根据多维时序数据的长短设置长、中、短三个时间窗口长度,将多维时序数据根据时间窗口长度划分为多个时间窗口数据并根据划分后时间窗口长度计算相关性矩阵作为对应时间窗口数据的信号矩阵;步骤2,通过卷积神经网络对信号矩阵的空间信息进行提取,并对信号矩阵进行编码;步骤3,通过卷积长短记忆神经网络对信号矩阵的时序信息进行提取,并添加到编码后的信号矩阵;步骤4,将编码后的信号矩阵通过卷积神经网络与卷积长短记忆神经网络进行解码得到还原矩阵,对还原矩阵与信号矩阵计算重建误差,并设定阈值进行异常数据判定。

Patent Agency Ranking