一种弱标注环境下的分段式语义标注方法

    公开(公告)号:CN110888991B

    公开(公告)日:2023-12-01

    申请号:CN201911190029.X

    申请日:2019-11-28

    Abstract: 本发明提供的是一种弱标注环境下的分段式语义标注方法。(1)输入待标注文本,使用数据挖掘算法自动化构建文本主题相关的“类别‑实体‑关系‑扩展”四层领域本体;(2)使用已构建的四层领域本体对弱标记文本进行语义标注;(3)采用加入注意力机制的卷积神经网络对已标注的段落文本进行段落句群划分;(4)综合使用词袋模型验证句群划分准确性并对新生成的句群的标注信息进行筛选。本发明对历史、文学、娱乐、计算机等不同领域的文本均具有较好的标注和句群划分效果,解决了多学科弱标记资源文本无法准确处理和分析的问题,可以帮助用户缩小检索范围,快速找到搜索结果,提高搜索准确性。

    一种基于深度学习的文本情感分析方法

    公开(公告)号:CN110889282B

    公开(公告)日:2023-03-21

    申请号:CN201911189487.1

    申请日:2019-11-28

    Abstract: 本发明提供了一种基于深度学习的文本情感分析方法。(1)输入文本数据,去除停用词,提取关键字,形成关键字集合。(2)通过构建关键字共现图,形成稠密的子图;获取子图和文档中句子的向量表示,进而将句子分配给子图;设计子图与子图之间的边缘连接和边缘权重,形成文档的拓扑交互图表达;(3)将拓扑交互图作为Emo‑GCN模型的输入,进行抽取节点特征变换,然后融合局部结构信息,获得节点聚合矩阵。将聚合的信息做非线性变换。Emo‑GCN模型采用层级结构,逐层抽取特征。本发明采用新颖的拓扑交互图表达文本信息进而使用图卷积神经网络进行文本情感分析,并且仍然具备强大的适应性。该方法应用于产品推荐、市场预测、决策调整。

    一种基于角点检测的医学图像处理方法

    公开(公告)号:CN108830842B

    公开(公告)日:2022-01-07

    申请号:CN201810561043.5

    申请日:2018-06-04

    Abstract: 本发明提供的是一种基于角点检测的医学图像处理方法。一:对医学图像进行预处理;二:提取Harris角点;三:计算尺度归一化算子,检测每个点在某一个尺度响应值是否达到最大,获得提取的角点矩阵;四:获得了图像的角点矩阵之后将获得的点在图像中绘制出来,之后将角点矩阵传给聚类算法,进行聚类处理;五:给出一个K值,按照Kmeans算法进行聚类处理,用相似度矩阵作为判别函数,相似度低于阈值的类,不再进行合并。本发明无论是效果还是处理效率,亦或是在实际中的应用方面,均表现出了优越性与极大的适用价值。

    一种基于内容相关的数值型数据一致性清洗方法

    公开(公告)号:CN110968576A

    公开(公告)日:2020-04-07

    申请号:CN201911189468.9

    申请日:2019-11-28

    Abstract: 本发明提供的是一种基于内容相关的数值型数据一致性清洗方法。(1)利用CNFD对数据进行规则发现和合并;(2)使用CNFD-detect算法检测数据中存在的不一致数据;(3)使用CNFD-repair算法对数据中不一致数据进行修复;(4)对于修复过的数据进行再次检测和修复。本发明采用CNFD-detect算法检测出不一致数据,判断规则是否可能发生死锁,若是则将可能发生死锁规则放在一起,统一赋值再进行修复,若否则直接修复;对修复后的数据迭代进行检测,以解决修复产生新的不一致矛盾。本发明在数据一致性清洗方向,无论是错误检测率还是错误修复率,或是实际中的应用方面,均表现出了优越性和极好的适应性。

    一种基于深度学习的文本情感分析方法

    公开(公告)号:CN110889282A

    公开(公告)日:2020-03-17

    申请号:CN201911189487.1

    申请日:2019-11-28

    Abstract: 本发明提供了一种基于深度学习的文本情感分析方法。(1)输入文本数据,去除停用词,提取关键字,形成关键字集合。(2)通过构建关键字共现图,形成稠密的子图;获取子图和文档中句子的向量表示,进而将句子分配给子图;设计子图与子图之间的边缘连接和边缘权重,形成文档的拓扑交互图表达;(3)将拓扑交互图作为Emo-GCN模型的输入,进行抽取节点特征变换,然后融合局部结构信息,获得节点聚合矩阵。将聚合的信息做非线性变换。Emo-GCN模型采用层级结构,逐层抽取特征。本发明采用新颖的拓扑交互图表达文本信息进而使用图卷积神经网络进行文本情感分析,并且仍然具备强大的适应性。该方法应用于产品推荐、市场预测、决策调整,具有极高的商业价值。

    基于谱特征和ELM的语音情感识别方法

    公开(公告)号:CN110827857A

    公开(公告)日:2020-02-21

    申请号:CN201911189489.0

    申请日:2019-11-28

    Abstract: 本发明提供的是一种基于谱特征和ELM的语音情感识别方法。原始语音信号进行基本特征提取包括韵律特征、音质特征;利用Teager能量算子TEO算法提取梅尔频率倒谱系数MFCC和耳蜗滤波倒谱系数CFCC,二者加权得到teCMFCC特征,并与基本特征值进行融合,构建特征矩阵;用Fisher准则和相关分析对特征进行选择降维,保留语音信号的个性特征;建立极限学习机ELM决策树模型,完成语音情感识别分类。本发明强调了语音信号的非线性特征,具有很好的鲁棒性,在中国科学院自动化研究所录制的CASIA中文情感语料库上进行实验,验证提出的基于谱特征和ELM的语音情感识别算法对中文语音信号具有很好的分类识别精度。

    一种社会网络用户参与主题行为分析方法

    公开(公告)号:CN103838806B

    公开(公告)日:2017-04-12

    申请号:CN201310470139.8

    申请日:2013-10-10

    Abstract: 本发明涉及的是一种社会网络用户参与主题的行为分析方法。本发明包括:定义主题相似性,关键词相似性,并建立“用户—主题—关键词”三个层次的网络模型;设计具有最大区分度的“关键词”选择算法;给出用户行为分析的相关定义和计算公式,具体包括:用户主动参与主题行为,被动参与主题行为,主题传播力以及主题影响力,并对用户参与主题的行为进行分析。本发明用网络模型完整的记录了用户在社会网络中的行为,并设计了具有最大区分度的关键词选择算法,保证了用户行为分析的效率。

    分布式系统中多层次测度网络关系构建方法

    公开(公告)号:CN102111295A

    公开(公告)日:2011-06-29

    申请号:CN201110001347.4

    申请日:2011-01-06

    Abstract: 本发明提供的是一种分布式系统中多层次测度网络关系构建方法。根据测度属性的类型对测度参数进行分层;构造任意两个测度属性对之间的概率转移矩阵;构建同一个层次中测度属性的网络关系模型;构建不同层次间测度参数的网络关系模型。本发明的优点在于:可以动态的更新分布式系统的测度参数之间的转移关系,并构建测度参数的立体层次网络模型。

    一种轻量级个性化搜索引擎及其搜索方法

    公开(公告)号:CN101127043A

    公开(公告)日:2008-02-20

    申请号:CN200710072608.5

    申请日:2007-08-03

    Abstract: 本发明提供的是一种轻量级个性化搜索引擎及其搜索方法。由信息抓取模块、信息检索模块和用户个性分析模块三部分连接组成,其中信息抓取模块由抓取程序和索引程序组成,因特网信息资源和Web库接入信息抓取模块,信息抓取模块的输出连接用户个性分析模块,用户兴趣记录与查询关键字输入信息检索模块,信息检索模块与用户个性分析模块,信息检索模块与用户个性分析模块结合提供个性化检索服务。本发明的服务器端不需要增加存储开销,充分利用客户端的资源来实现个性化的搜索。通过客户端的存储与服务器端的用户行为跟踪引擎的结合,本发明给出了针对用户不同需求,符合用户兴趣的个性化搜索引擎的解决方案。

Patent Agency Ranking