-
公开(公告)号:CN109918666B
公开(公告)日:2024-03-15
申请号:CN201910168357.3
申请日:2019-03-06
Applicant: 北京工商大学
IPC: G06F40/253 , G06F40/289 , G06F16/33 , G06N3/02 , G06N3/08
Abstract: 本发明提出一种基于神经网络的中文标点符号添加方法,包括以下步骤:构造标点符号添加的训练数据集、基于神经网络构建中文标点符号添加方法、利用标点符号训练数据集来训练神经网络、利用训练好的神经网络对中文标点符号进行恢复、勘误;本发明从大数据出发,构建深度神经网络模型来对中文标点符号恢复、勘误,突破了传统的大量人工检测的局限,神经网络在大量训练集一经训练完成,就可以对各种题材的文本进行标点符号的恢复勘误,经大量文本训练过后的神经网络,标点符号预测的准确率在95%以上,精确率在85%以上,召回率在85%以上,f1值在85%以上,符合工业要求水平,本发明可应用于对语音合成文字后的文本进行标点符号勘误。
-
公开(公告)号:CN110677284A
公开(公告)日:2020-01-10
申请号:CN201910904558.5
申请日:2019-09-24
Applicant: 北京工商大学
IPC: H04L12/24 , G06F16/901 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于元路径的异构网络链路预测的方法,利用元路径处理异构网络丰富且复杂的语义,从网络中抽取元路径实例并学习网络节点权重,综合网络拓扑特征以更新网络节点嵌入,利用更新的网络节点嵌入,可以做分类、聚类及链路预测等工作,在实际生活中应用性高,能够有效提高异构网络的分类、聚类及链路预测等工作的准确率。
-
公开(公告)号:CN110677284B
公开(公告)日:2022-06-17
申请号:CN201910904558.5
申请日:2019-09-24
Applicant: 北京工商大学
IPC: H04L41/147 , H04L41/14 , H04L41/12 , G06F16/901 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于元路径的异构网络链路预测的方法,利用元路径处理异构网络丰富且复杂的语义,从网络中抽取元路径实例并学习网络节点权重,综合网络拓扑特征以更新网络节点嵌入,利用更新的网络节点嵌入,可以做分类、聚类及链路预测等工作,在实际生活中应用性高,能够有效提高异构网络的分类、聚类及链路预测等工作的准确率。
-
公开(公告)号:CN110717042A
公开(公告)日:2020-01-21
申请号:CN201910904571.0
申请日:2019-09-24
Applicant: 北京工商大学
Abstract: 本发明公开一种构建文档-关键词异构网络模型方法,包括:获取大量文本语料作为语料库;获取相应停用词语料;对获取的所有文本进行去停用词处理;计算和保存每个单词词频;计算和保存关键词间互信息;计算和保存文档-词的权重;构建文档-词异构网络。与现有技术相比,本发明的有益效果是:本发明所提供的一种构建文档-关键词异构网络模型方法,构建语料库的文本语料和停用词语料容易获取,关键词处理过程简单有效,边缘权重易于计算获得,可将无结构化或半结构化的文本文档转换成能够被各种处理算法识别与计算的结构化形式,可以将本发明应用于文本特征提取或者文本聚类后端处理领域,从而为人们提供有价值的信息。
-
公开(公告)号:CN109918666A
公开(公告)日:2019-06-21
申请号:CN201910168357.3
申请日:2019-03-06
Applicant: 北京工商大学
Abstract: 本发明提出一种基于神经网络的中文标点符号添加方法,包括以下步骤:构造标点符号添加的训练数据集、基于神经网络构建中文标点符号添加方法、利用标点符号训练数据集来训练神经网络、利用训练好的神经网络对中文标点符号进行恢复、勘误;本发明从大数据出发,构建深度神经网络模型来对中文标点符号恢复、勘误,突破了传统的大量人工检测的局限,神经网络在大量训练集一经训练完成,就可以对各种题材的文本进行标点符号的恢复勘误,经大量文本训练过后的神经网络,标点符号预测的准确率在95%以上,精确率在85%以上,召回率在85%以上,f1值在85%以上,符合工业要求水平,本发明可应用于对语音合成文字后的文本进行标点符号勘误。
-
-
-
-