一种构建文档-关键词异构网络模型方法

    公开(公告)号:CN110717042A

    公开(公告)日:2020-01-21

    申请号:CN201910904571.0

    申请日:2019-09-24

    Abstract: 本发明公开一种构建文档-关键词异构网络模型方法,包括:获取大量文本语料作为语料库;获取相应停用词语料;对获取的所有文本进行去停用词处理;计算和保存每个单词词频;计算和保存关键词间互信息;计算和保存文档-词的权重;构建文档-词异构网络。与现有技术相比,本发明的有益效果是:本发明所提供的一种构建文档-关键词异构网络模型方法,构建语料库的文本语料和停用词语料容易获取,关键词处理过程简单有效,边缘权重易于计算获得,可将无结构化或半结构化的文本文档转换成能够被各种处理算法识别与计算的结构化形式,可以将本发明应用于文本特征提取或者文本聚类后端处理领域,从而为人们提供有价值的信息。

    一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法

    公开(公告)号:CN110688484A

    公开(公告)日:2020-01-14

    申请号:CN201910905103.5

    申请日:2019-09-24

    Abstract: 本发明公开一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法,包括:S1、选取需要检测的微博言论数据集,通过文本特征处理构建不平衡数据集,构建分类模型;指定分类模型在参数ω上的先验分布,对参数ω随机初始化,得到初始参数向量ω0;S2、计算参数为ω0的分类模型对各类别子数据集的间隔似然值;S3、计算分类模型在参数ω0上的后验概率;S4、采样新参数点;S5、记录采样到的参数序列;S6、分类模型计算待测言论特征属于各类别的概率分布向量p,预测待测言论特征的类别为p中概率最高的类别;本发明不需大量数据支撑训练过程,克服了异常类样本过拟合的问题,从而有效提高了异常类言论数量过少时数据集的分类精度。

    一种用于电子安全的高压变换电路

    公开(公告)号:CN102390342B

    公开(公告)日:2013-08-14

    申请号:CN201110360420.7

    申请日:2011-11-15

    Abstract: 本申请公开了一种用于电子安全的高压变换电路,包括主电路和量子型控制电路两部分,其中,主电路由逆变驱动电路、压电变压器和输出电路组成,逆变驱动电路包括开关网络和输入匹配网络,输出电路包括输出匹配网络、整流电路以及负载电路;所述量子模式控制电路由分压采样电路、参考比较电路和逻辑控制电路组成,采样电路将高压电容的输出电压通过分压送入参考比较电路,与预设参考电压的上下限进行比较,并输出相应的高低电平,逻辑控制电路部分负责分频产生选定的、具有固定占空比的开关频率信号,并连同比较电路的输出信号,调制后输出到功率开关的驱动电路端。

    一种基于无监督图神经网络结构的文本向量生成方法

    公开(公告)号:CN110705260A

    公开(公告)日:2020-01-17

    申请号:CN201910905090.1

    申请日:2019-09-24

    Abstract: 本发明公开一种基于无监督图神经网络结构的文本向量生成方法,利用停用词语料对收集的所有文本语料做去停用词处理,从处理后的语料中选取关键词,计算并保存文本关键词权重以及关键词间权重,构建文本-关键词网络邻接矩阵;其次利用训练好的词向量作为单词节点特征,文档内出现关键词计算文本初始节点特征,得到文本-关键词网络特征矩阵;最后构建与正样本相对应的负样本邻接矩阵和特征矩阵,利用损失函数与构建的网络模型步骤、梯度下降使损失收敛,取收敛后的文本节点特征向量,得到基于无监督GNN的文本表示向量。本发明充分考虑到了语料库中非连续的全局词共现和长距离语义以及单个文档对所有文档-关键词集合的总相关性。

    一种基于无监督图神经网络结构的文本向量生成方法

    公开(公告)号:CN110705260B

    公开(公告)日:2023-04-18

    申请号:CN201910905090.1

    申请日:2019-09-24

    Abstract: 本发明公开一种基于无监督图神经网络结构的文本向量生成方法,利用停用词语料对收集的所有文本语料做去停用词处理,从处理后的语料中选取关键词,计算并保存文本关键词权重以及关键词间权重,构建文本‑关键词网络邻接矩阵;其次利用训练好的词向量作为单词节点特征,文档内出现关键词计算文本初始节点特征,得到文本‑关键词网络特征矩阵;最后构建与正样本相对应的负样本邻接矩阵和特征矩阵,利用损失函数与构建的网络模型步骤、梯度下降使损失收敛,取收敛后的文本节点特征向量,得到基于无监督GNN的文本表示向量。本发明充分考虑到了语料库中非连续的全局词共现和长距离语义以及单个文档对所有文档‑关键词集合的总相关性。

    一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法

    公开(公告)号:CN110688484B

    公开(公告)日:2021-12-31

    申请号:CN201910905103.5

    申请日:2019-09-24

    Abstract: 本发明公开一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法,包括:S1、选取需要检测的微博言论数据集,通过文本特征处理构建不平衡数据集,构建分类模型;指定分类模型在参数ω上的先验分布,对参数ω随机初始化,得到初始参数向量ω0;S2、计算参数为ω0的分类模型对各类别子数据集的间隔似然值;S3、计算分类模型在参数ω0上的后验概率;S4、采样新参数点;S5、记录采样到的参数序列;S6、分类模型计算待测言论特征属于各类别的概率分布向量p,预测待测言论特征的类别为p中概率最高的类别;本发明不需大量数据支撑训练过程,克服了异常类样本过拟合的问题,从而有效提高了异常类言论数量过少时数据集的分类精度。

    从新闻文档中抽取社会网络的方法和系统

    公开(公告)号:CN102508830A

    公开(公告)日:2012-06-20

    申请号:CN201110384750.X

    申请日:2011-11-28

    Abstract: 本发明公开一种基于语义分析的网络新闻信息中社会网络自动抽取方法,包括:文档预处理;把经过预处理的新闻文档根据句义完整性进行语篇划分,形成话语片段;对划分之后的各个话语片断进行主动词识别;对于每个话语片段中的主动词识别其施事论元和受事论元;把施事论元和受事论元之间进行有向连接,并进行关系动词的标注,形成实体关系;将所有实体关系进行合并,得到整个事件的社会网络;输出抽取的社会网络。本发明提供的方法实现了对网络新闻中社会网络更加有效的抽取和表示,可用于网络新闻的社会网络抽取、网络新闻的监控等方面,也可用于新闻热点的发现、以及建立新闻热点索引等方面。

    一种用于电子安全的高压变换电路

    公开(公告)号:CN102390342A

    公开(公告)日:2012-03-28

    申请号:CN201110360420.7

    申请日:2011-11-15

    Abstract: 本申请公开了一种用于电子安全的高压变换电路,包括主电路和量子型控制电路两部分,其中,主电路由逆变驱动电路、压电变压器和输出电路组成,逆变驱动电路包括开关网络和输入匹配网络,输出电路包括输出匹配网络、整流电路以及负载电路;所述量子模式控制电路由分压采样电路、参考比较电路和逻辑控制电路组成,采样电路将高压电容的输出电压通过分压送入参考比较电路,与预设参考电压的上下限进行比较,并输出相应的高低电平,逻辑控制电路部分负责分频产生选定的、具有固定占空比的开关频率信号,并连同比较电路的输出信号,调制后输出到功率开关的驱动电路端。

Patent Agency Ranking