一种基于生成对抗网络的文本隐写方法

    公开(公告)号:CN108923922B

    公开(公告)日:2021-04-23

    申请号:CN201810833603.8

    申请日:2018-07-26

    Abstract: 本发明公开了一种基于生成对抗网络的文本隐写方法,该模型将文本隐写看作是一个文本序列生成过程,通过密钥映射表将秘密文本有效地隐写于生成文本中,同时保证了生成文本有较高的质量,在对抗训练中使用策略梯度优化生成器,最后使得生成模型可以生成高质量隐写文本,相比于传统的训练方法,对抗学习过程可以让模型更好地拟合整个语料库的分布,生成更为合理的短语搭配和长文本。

    一种网络谣言识别方法及系统

    公开(公告)号:CN112231562A

    公开(公告)日:2021-01-15

    申请号:CN202011099869.8

    申请日:2020-10-15

    Abstract: 本发明涉及一种网络谣言识别方法即系统,方法包括:根据包含谣言信息的多个文本得到文本特征矩阵;构建传播图结构,图结构中的节点为多个文本,图结构中的邻接矩阵为谣言信息在多个文本之间的转发和评论关系;构建图卷积神经网络模型;图卷积神经网络模型的输入为文本特征矩阵和邻接矩阵,图卷积神经网络模型的输出为谣言特征矩阵;根据谣言特征矩阵训练神经网络模型,得到谣言识别模型;根据谣言识别模型识别网络谣言。本发明根据谣言在多个文本之间的转发和评论关系训练图卷积神经网络模型,根据谣言特征矩阵训练神经网络模型,有效的捕获了谣言信息广泛且分散的传播特征,可以有效识别谣言信息。

    拼音作为特征的中文语音识别后的文本神经网络纠错模型

    公开(公告)号:CN110765772A

    公开(公告)日:2020-02-07

    申请号:CN201910968667.3

    申请日:2019-10-12

    Abstract: 本发明公开一种拼音作为特征的中文语音识别后的文本神经网络纠错模型,包括:1)构建中文语音识别后的文本纠错平行语料库;2)构建拼音编码,将训练集的句子对转化为拼音,通过词嵌入方法编码为拼音编码;3)构建神经网络输入特征,模型输入特征包括三部分:词向量编码,位置编码和拼音编码;4)构建深度卷积的编码器解码器神经网络。由于中文语音识别后的文本错误主要是中文拼音出错,并且一般是局部错误,使用拼音编码作为网络输入的一部分,又使用深度卷积编码器解码器模型,深度卷积编码器对序列局部信息进行有效提取,在解码过程中,使用了拼音特征,又在局部序列进行纠错,从而极大提高了中文语音识别准确度。

    一种基于生成对抗网络的文本隐写方法

    公开(公告)号:CN108923922A

    公开(公告)日:2018-11-30

    申请号:CN201810833603.8

    申请日:2018-07-26

    Abstract: 本发明公开了一种基于生成对抗网络的文本隐写方法,该模型将文本隐写看作是一个文本序列生成过程,通过密钥映射表将秘密文本有效地隐写于生成文本中,同时保证了生成文本有较高的质量,在对抗训练中使用策略梯度优化生成器,最后使得生成模型可以生成高质量隐写文本,相比于传统的训练方法,对抗学习过程可以让模型更好地拟合整个语料库的分布,生成更为合理的短语搭配和长文本。

    一种基于动态卷积网络的微生物基因序列分类模型的方法

    公开(公告)号:CN108009402A

    公开(公告)日:2018-05-08

    申请号:CN201710609781.8

    申请日:2017-07-25

    Abstract: 本发明一种基于动态卷积网络的微生物基因序列分类模型的方法:步骤一:获取已有分类结果的微生物基因序列数据;步骤二:数据预处理;步骤三:构建动态卷积网络结构框架;步骤四:把准备好的数据输入步骤三建立的动态卷积网络,用反向传播,随机梯度下降法迭代100次,训练动态卷积网络;以多分类交叉熵为代价函数,最终得到分类算法模型;步骤五:将需要分类的分词序列输入到步骤四已训练好的动态卷积网络模型,得到分类结果。本发明方法不用人工处理数据和抽取特征,模型自动抽取抽象特征完成分类任务,算法效率和准确度高,可有效应用于生物信息分析与处理。

    一种基于编辑距离以及词频和词向量的实体关系识别方法

    公开(公告)号:CN106066856A

    公开(公告)日:2016-11-02

    申请号:CN201610349298.6

    申请日:2016-05-24

    CPC classification number: G06F16/951 G06F17/2715 G06F17/2775

    Abstract: 本发明涉及一种基于编辑距离以及词频和词向量的实体关系识别方法:步骤一:获取文本数据;步骤二:采用分词软件进行分词,对分词后的文本进行每个词个数的统计;步骤三:调整词向量的维数、窗口大小,进行词向量的训练;步骤四:利用训练好的词向量,对词进行聚合;步骤五:对步骤四中获得的实体进行编辑距离的计算,结合步骤一中得到的词频,进而得到给定实体词的别名或简称;基于编辑距离,在步骤四的基础上,计算给定实体词到其它实体的d[i,j]值,结合步骤一获取每个实体词的个数;经加权平均得到G(X),即:获取给定实体词的前n个最可能的简称,通过比重可以看出其关系强度,便可得到给定实体词的别名或简称。

    一种基于超图的文本分类方法

    公开(公告)号:CN111125358B

    公开(公告)日:2023-07-11

    申请号:CN201911302220.9

    申请日:2019-12-17

    Abstract: 本发明公开一种基于超图的文本分类方法,包括:步骤一、构建语料库和语料库的关键词库,基于语料库生成超图,得到超图的超边和结点;步骤二、基于共现窗口计算关键词的邻接矩阵;步骤三、对语料库中的每一个文档通过超边向量表示,形成超边矩阵;步骤四、计算超边之间的相似度,构建超边的相似度矩阵;步骤五、构建由词向量组成的超图结点特征矩阵;步骤六、使用图神经网络模型对超边进行分类,得到语料库中每个文档类别的第一次预测概率;步骤七、基于文档的真实标签,采用随机梯度下降算法更新图神经网络模型的参数矩阵,完成语料库中无标签文本的分类;本发明实现了对语料库中无标签文本的准确分类。

    一种基于无监督图神经网络结构的文本向量生成方法

    公开(公告)号:CN110705260B

    公开(公告)日:2023-04-18

    申请号:CN201910905090.1

    申请日:2019-09-24

    Abstract: 本发明公开一种基于无监督图神经网络结构的文本向量生成方法,利用停用词语料对收集的所有文本语料做去停用词处理,从处理后的语料中选取关键词,计算并保存文本关键词权重以及关键词间权重,构建文本‑关键词网络邻接矩阵;其次利用训练好的词向量作为单词节点特征,文档内出现关键词计算文本初始节点特征,得到文本‑关键词网络特征矩阵;最后构建与正样本相对应的负样本邻接矩阵和特征矩阵,利用损失函数与构建的网络模型步骤、梯度下降使损失收敛,取收敛后的文本节点特征向量,得到基于无监督GNN的文本表示向量。本发明充分考虑到了语料库中非连续的全局词共现和长距离语义以及单个文档对所有文档‑关键词集合的总相关性。

    一种针对多重关系的知识图谱链接补全方法及系统

    公开(公告)号:CN114064627A

    公开(公告)日:2022-02-18

    申请号:CN202111406286.X

    申请日:2021-11-24

    Abstract: 本发明涉及一种一种针对多重关系的知识图谱链接补全方法及系统,方法包括:获取待补全的知识图谱三元组数据;将所述待补全的知识图谱三元组数据输入知识图谱链接补全模型,得到三元组补全结果;所述知识图谱链接补全模型是根据知识图谱数据构建的;所述知识图谱链接补全模型包括图卷积神经层、多关系注意力网络层和链路预测层;所述图卷积神经层的输出端和所述多关系注意力网络层的输出端均与所述链路预测层连接。本发明能够有效挖掘知识图谱结构特征与多关系特征,快速准确地完成知识图谱补全任务。

Patent Agency Ranking