一种基于异质图注意力网络的文档级关系抽取方法

    公开(公告)号:CN114648017A

    公开(公告)日:2022-06-21

    申请号:CN202210386134.6

    申请日:2022-04-13

    Abstract: 一种基于异质图注意力网络的文档级关系抽取方法,具体涉及一种基于异质图注意力网络的文档级实体关系的抽取方法,本发明为了解决现有的图神经网络在获取节点表示时忽略了图中节点和边,导致关系抽取的准确率低的问题,它包括以下步骤:S1、获取文档文本;S2、建立文档级关系抽取模型,将S1中获取的文档文本输入文档级关系抽取模型内进行训练,输出所述文档文本的关系,得到训练好的文档级关系抽取模型;S3、将待抽取文档级关系的文档文本输入S2中训练好的文档级关系抽取模型内,得到对应的文档文本的关系。属于计算机技术领域。

    一种基于多特征融合的商品评论情感分析方法

    公开(公告)号:CN112861541B

    公开(公告)日:2022-06-17

    申请号:CN202011476049.6

    申请日:2020-12-15

    Abstract: 本发明提供了一种基于多特征融合的商品评论情感分析方法。对数据集进行噪音过滤,进行文本的分词、词性筛选,统计词频,得到预处理后的文本;对文本中的词语使用word2Vec进行词向量表示;使用基于词语共现度的方法,结合凝聚层次聚类算法挖掘商品评论中的有关属性的情感词;针对描述商品属性的情感词进行情感词典扩充,确定新词的情感倾向;将否定词典、连词词典、程度词典等文本特征、用户特征、商品特征进行多特征进行有机融合来确定文本的情感倾向,以此构建半监督训练集;根据构建的训练集,对文本进行基于SVM的情感分类。本发明提出的基于多特征融合的情感分类方法能够有效提高分类的准确度,在产品跟踪、服务反馈、意见挖掘以及舆情监控等方面有着重要的应用价值。

    基于主动学习的微博流行度预测方法

    公开(公告)号:CN109492776B

    公开(公告)日:2022-05-17

    申请号:CN201811393919.6

    申请日:2018-11-21

    Abstract: 本发明提供一种基于主动学习的微博流行度预测方法,包括如下步骤:利用新浪微博API爬取相关微博数据集;利用K‑Means算法将未标记数据集初始化训练集L;对训练数据进行特征提取得到特征向量;根据提取的特征向量训练基于支持向量机的主动学习的改进的模型,根据训练的多分类模型从未标记的样本集中选择出既有不确定性又具有多样性和代表性的样本;将筛选出的样本称为信息向量,交给专家标记;将标记的训练数据加入到初始训练集L中,循环此过程直到模型的性能达到稳定状态为止得到微博流行度预测模型。本发明减少了冗余性问题并降低了异常值问题,减少了训练样本的标记数量,同时也使得在训练数据少的情况下也得到很好的预测效果。

    一种基于神经网络的多模态情感分类方法

    公开(公告)号:CN113988201A

    公开(公告)日:2022-01-28

    申请号:CN202111294685.1

    申请日:2021-11-03

    Abstract: 一种基于神经网络的多模态情感分类方法,具体涉及一种基于多模态情感分类的神经网络模型的分类方法,本发明为了解决传统的情感分类方法大多针对单一类型的数据,并不能处理社交网络坏境下多模态的混合信息的问题,它包括提取待预测情感图片中的多模态数据;提取多模态数据中各单模态的原始向量;根据各模态的原始向量计算各模态的指导向量;获得各模态的重构特征向量;利用注意力机制对得到的各模态的重构特征向量进行加权平均,生成融合特征向量;将得到的融合特征向量输入至情感分类模型中,输出分类结果。本发明用于对社交网络坏境下多模态的混合信息进行情感分类,属于自然语言处领域。

    一种基于多特征融合的微博突发事件检测方法

    公开(公告)号:CN112528024A

    公开(公告)日:2021-03-19

    申请号:CN202011481477.8

    申请日:2020-12-15

    Abstract: 本发明提供了一种基于多特征融合的微博突发事件检测方法。对数据集进行噪音过滤;进行文本的分词,进行词性筛选,统计词频,得到预处理后的文本;对预处理结果进行突发词提取,结合词语的基础权重、突发权重、词语所受微博影响、用户影响力的计算结果进行加权求和得到词语的突发度,根据突发度进行词语的筛选,选出的词语作为突发词放入突发词集;对突发词集中的词语进行基于词语共现度的相似性计算,根据结果构建相似度矩阵;对相似度矩阵中的词语进行凝聚式层次聚类,根据聚类结果得到突发事件检测结果。本发明提出的突发词提取方法能够提高突发词提取的精准度,进而有效提高突发事件检测的准确率,为网络舆情监控、突发事件处理以及社会安全管理提供良好支撑。

    一种服务资源弹性扩缩容处理方法

    公开(公告)号:CN112527498A

    公开(公告)日:2021-03-19

    申请号:CN202011406463.X

    申请日:2020-12-03

    Abstract: 本发明提供了一种服务资源弹性扩缩容处理方法。对微服务监控平台智能汇聚的多元微服务数据集进行面向定向服务类型负载实时监控的历史多元数据指标抓取;对抓取到的面向定向服务类型负载历史多元数据指标进行数据预处理,得到低噪、高可用的指标数据集合;对预处理后的面向定向服务类型负载历史多元数据指标数据集进行基于线性回归的弹性伸缩容预测;对基于线性回归服务弹性伸缩容预测结果进行服务资源弹性伸缩处理策略匹配。本发明提出方法能有效解决服务扩缩容度量指标阈值固定、扩缩反应滞后等问题,是提高扩缩反应速度和资源利用率的重要途径,为服务的稳定运行进一步提供了有力保障。

    一种基于船舶数值虚拟试验的报告自动生成方法

    公开(公告)号:CN110991156A

    公开(公告)日:2020-04-10

    申请号:CN201911142359.1

    申请日:2019-11-20

    Abstract: 本发明是一种基于船舶数值虚拟试验的报告自动生成方法。本发明本发明主要包括:框架设计、数据处理、后处理、数据替换和框架集成。本发明提出的基于船舶数值虚拟试验的报告自动生成方法,可以将在网页进行虚拟试验时所生成的json文件或相关的数据文件通过智能抽取,自动将其转换成对应的图像、表格、文本,并生成试验报告。这种试验报告自动生成的方法不但可以准确的表达数据之间的关系,还可以展现出各种试验结果。使试验结果具有更好的通用性和一致性,并且提高了生成试验报告的效率。

    一种弱标注环境下的分段式语义标注方法

    公开(公告)号:CN110888991A

    公开(公告)日:2020-03-17

    申请号:CN201911190029.X

    申请日:2019-11-28

    Abstract: 本发明提供的是一种弱标注环境下的分段式语义标注方法。(1)输入待标注文本,使用数据挖掘算法自动化构建文本主题相关的“类别-实体-关系-扩展”四层领域本体;(2)使用已构建的四层领域本体对弱标记文本进行语义标注;(3)采用加入注意力机制的卷积神经网络对已标注的段落文本进行段落句群划分;(4)综合使用词袋模型验证句群划分准确性并对新生成的句群的标注信息进行筛选。本发明对历史、文学、娱乐、计算机等不同领域的文本均具有较好的标注和句群划分效果,解决了多学科弱标记资源文本无法准确处理和分析的问题,可以帮助用户缩小检索范围,快速找到搜索结果,提高搜索准确性。

    一种基于微博用户自身和行为价值二阶的影响力评估方法

    公开(公告)号:CN109492924A

    公开(公告)日:2019-03-19

    申请号:CN201811393912.4

    申请日:2018-11-21

    Abstract: 一种基于微博用户自身和行为价值二阶的影响力评估方法,属于计算机数据挖掘技术领域。包括:(1)利用爬虫技术和微博官方API接口采集微博数据;(2)对采集后的数据处理,得出所需用户的特征向量;(3)通过用户所有粉丝的自身价值来计算该用户的自身价值;(4)通过用户所有推送转发者的行为价值来计算用户的行为价值;(5)综合用户的自身与行为价值计算用户最终的影响力。本发明通过对用户粉丝数量、质量的计算和用户推送微博的转发者行为质量的计算,即避免了僵尸粉、推销商造成的虚假影响力又突出了推送较少但质量极高的用户的隐藏影响力;对于发现微博平台中信息的传播规律、广告投放、病毒式营销和舆情管控等工作具有重要意义。

    一种基于角点检测的医学图像处理方法

    公开(公告)号:CN108830842A

    公开(公告)日:2018-11-16

    申请号:CN201810561043.5

    申请日:2018-06-04

    Abstract: 本发明提供的是一种基于角点检测的医学图像处理方法。一:对医学图像进行预处理;二:提取Harris角点;三:计算尺度归一化算子,检测每个点在某一个尺度响应值是否达到最大,获得提取的角点矩阵;四:获得了图像的角点矩阵之后将获得的点在图像中绘制出来,之后将角点矩阵传给聚类算法,进行聚类处理;五:给出一个K值,按照Kmeans算法进行聚类处理,用相似度矩阵作为判别函数,相似度低于阈值的类,不再进行合并。本发明无论是效果还是处理效率,亦或是在实际中的应用方面,均表现出了优越性与极大的适用价值。

Patent Agency Ranking