-
公开(公告)号:CN109948152B
公开(公告)日:2020-07-17
申请号:CN201910168386.X
申请日:2019-03-06
Applicant: 北京工商大学
IPC: G06F40/232 , G06F40/253 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于LSTM的中文文本语法纠错模型的方法,首先收集大量的中文文本语料用以计算5‑gram语言模型,保存的语言模型将会用作数据处理过程和模型输出的结果选择,然后收集语法纠错平行语料数据,语法纠错平行语料数据用作训练LSTM神经网络模型,实现模型对错误句子到正确句子的序列翻译过程;其次用保存好的5‑gram语言模型对平行语料数据进行预处理,修改掉明显的错误,最后构建LSTM神经网络并用预处理后的数据进行训练,训练结束保存网络参数,并用已训练好的网络,输出语法正确的文本序列。本发明数据容易获取,过程简单有效,LSTM神经网络自动抽取抽象特征,完成语法纠错任务,算法效率和准确度都相对较高,应用于中文学习过程和语音识别后端处理。
-
公开(公告)号:CN111639787B
公开(公告)日:2024-03-15
申请号:CN202010347235.3
申请日:2020-04-28
Applicant: 北京工商大学
IPC: G06F18/20 , G06N3/042 , G06F18/10 , G06N3/0464 , G06N3/084
Abstract: 本发明公开一种基于图卷积网络的时空数据预测方法,包括如下步骤:获取时空数据作为预测任务的对象;对获取到的时空数据进行处理得到数据集;构建基于图卷积网络的时空数据预测模型;将得到的训练样本和验证样本作为构建模型的输入,执行训练算法,得到模型参数,确定基于图卷积网络的时空数据模型;输入待测时间和空间,执行基于图卷积网络的时空数据模型,从而得到期待的预测结果。本发明可以有效的捕获时空数据中的时间属性和空间结构特征,从而提高时空数据预测任务的准确性,在疾病监控、交通管理等多种领域都具有非常重要的应用价值。
-
公开(公告)号:CN112256941B
公开(公告)日:2023-10-13
申请号:CN202011123548.7
申请日:2020-10-20
Applicant: 北京工商大学
IPC: G06F16/951 , G06F16/906 , G06Q50/00
Abstract: 本发明公开一种基于局部信息的社交网络重构方法,步骤一:数据预处理;步骤二:根据节点属性和网络拓扑结构添加占位符节点;所述的占位符节点是为了定位缺失点而存在的一种临时性节点;步骤三:对步骤二所添加的占位符节点进行聚类,用以确定缺失点的具体数目和位置,消除多余的占位符节点,增加网络重构准确性;步骤四:使用链路预测算法确定网络中的缺失边;步骤五:根据上述步骤的处理结果重新构建网络结构。本发明方法可以有效的确定缺失点的位置,并且先解决缺失点的问题可以很好的为后续缺失边的补足做有效支撑,提高预测准确性;可使得舆情传播的相关研究更加高效,有效控制不良舆情传播造成的严重影响和危害。
-
公开(公告)号:CN112329439B
公开(公告)日:2021-11-19
申请号:CN202011291703.6
申请日:2020-11-18
Applicant: 北京工商大学 , 北京市疾病预防控制中心
IPC: G06F40/211 , G06F40/216 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/26
Abstract: 本发明涉及一种基于图卷积神经网络模型的食品安全事件检测方法及系统。该方法包括:对从食品安全相关网站获取的数据进行预处理;根据预处理后的数据构建文本分类模型;获取待预测的食品安全事件数据;将所述待预测的食品安全事件数据输入至所述文本分类模型中,得到食品安全事件的分类结果。本发明能够根据国家食品安全事件分级标准,对获取的食品安全事件进行快速准确的分类。
-
公开(公告)号:CN108923922B
公开(公告)日:2021-04-23
申请号:CN201810833603.8
申请日:2018-07-26
Applicant: 北京工商大学
Abstract: 本发明公开了一种基于生成对抗网络的文本隐写方法,该模型将文本隐写看作是一个文本序列生成过程,通过密钥映射表将秘密文本有效地隐写于生成文本中,同时保证了生成文本有较高的质量,在对抗训练中使用策略梯度优化生成器,最后使得生成模型可以生成高质量隐写文本,相比于传统的训练方法,对抗学习过程可以让模型更好地拟合整个语料库的分布,生成更为合理的短语搭配和长文本。
-
公开(公告)号:CN112231562A
公开(公告)日:2021-01-15
申请号:CN202011099869.8
申请日:2020-10-15
Applicant: 北京工商大学
IPC: G06F16/9535 , G06F40/216 , G06F40/30 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明涉及一种网络谣言识别方法即系统,方法包括:根据包含谣言信息的多个文本得到文本特征矩阵;构建传播图结构,图结构中的节点为多个文本,图结构中的邻接矩阵为谣言信息在多个文本之间的转发和评论关系;构建图卷积神经网络模型;图卷积神经网络模型的输入为文本特征矩阵和邻接矩阵,图卷积神经网络模型的输出为谣言特征矩阵;根据谣言特征矩阵训练神经网络模型,得到谣言识别模型;根据谣言识别模型识别网络谣言。本发明根据谣言在多个文本之间的转发和评论关系训练图卷积神经网络模型,根据谣言特征矩阵训练神经网络模型,有效的捕获了谣言信息广泛且分散的传播特征,可以有效识别谣言信息。
-
公开(公告)号:CN110765772A
公开(公告)日:2020-02-07
申请号:CN201910968667.3
申请日:2019-10-12
Applicant: 北京工商大学
IPC: G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种拼音作为特征的中文语音识别后的文本神经网络纠错模型,包括:1)构建中文语音识别后的文本纠错平行语料库;2)构建拼音编码,将训练集的句子对转化为拼音,通过词嵌入方法编码为拼音编码;3)构建神经网络输入特征,模型输入特征包括三部分:词向量编码,位置编码和拼音编码;4)构建深度卷积的编码器解码器神经网络。由于中文语音识别后的文本错误主要是中文拼音出错,并且一般是局部错误,使用拼音编码作为网络输入的一部分,又使用深度卷积编码器解码器模型,深度卷积编码器对序列局部信息进行有效提取,在解码过程中,使用了拼音特征,又在局部序列进行纠错,从而极大提高了中文语音识别准确度。
-
公开(公告)号:CN110677284A
公开(公告)日:2020-01-10
申请号:CN201910904558.5
申请日:2019-09-24
Applicant: 北京工商大学
IPC: H04L12/24 , G06F16/901 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于元路径的异构网络链路预测的方法,利用元路径处理异构网络丰富且复杂的语义,从网络中抽取元路径实例并学习网络节点权重,综合网络拓扑特征以更新网络节点嵌入,利用更新的网络节点嵌入,可以做分类、聚类及链路预测等工作,在实际生活中应用性高,能够有效提高异构网络的分类、聚类及链路预测等工作的准确率。
-
公开(公告)号:CN108923922A
公开(公告)日:2018-11-30
申请号:CN201810833603.8
申请日:2018-07-26
Applicant: 北京工商大学
Abstract: 本发明公开了一种基于生成对抗网络的文本隐写方法,该模型将文本隐写看作是一个文本序列生成过程,通过密钥映射表将秘密文本有效地隐写于生成文本中,同时保证了生成文本有较高的质量,在对抗训练中使用策略梯度优化生成器,最后使得生成模型可以生成高质量隐写文本,相比于传统的训练方法,对抗学习过程可以让模型更好地拟合整个语料库的分布,生成更为合理的短语搭配和长文本。
-
公开(公告)号:CN108009402A
公开(公告)日:2018-05-08
申请号:CN201710609781.8
申请日:2017-07-25
Applicant: 北京工商大学
IPC: G06F19/24
Abstract: 本发明一种基于动态卷积网络的微生物基因序列分类模型的方法:步骤一:获取已有分类结果的微生物基因序列数据;步骤二:数据预处理;步骤三:构建动态卷积网络结构框架;步骤四:把准备好的数据输入步骤三建立的动态卷积网络,用反向传播,随机梯度下降法迭代100次,训练动态卷积网络;以多分类交叉熵为代价函数,最终得到分类算法模型;步骤五:将需要分类的分词序列输入到步骤四已训练好的动态卷积网络模型,得到分类结果。本发明方法不用人工处理数据和抽取特征,模型自动抽取抽象特征完成分类任务,算法效率和准确度高,可有效应用于生物信息分析与处理。
-
-
-
-
-
-
-
-
-