一种采用决策树的数据分类方法和系统

    公开(公告)号:CN102214213A

    公开(公告)日:2011-10-12

    申请号:CN201110143821.7

    申请日:2011-05-31

    Inventor: 庄福振 何清

    Abstract: 本发明公开了一种采用决策树的数据分类方法和系统。所述方法,包括下列步骤:基于MapReduce机制,并行计算训练数据中包含的每个属性的信息增益,选出最佳的分裂决策属性作为节点构造决策树;根据所述决策树,对输入的数据记录进行分类。其实现了基于MapReduce的并行决策树ID3算法,不仅可以处理大规模数据集,而且并行效率高,即实现构建决策树中节点内部以及同一层节点之间的并行计算。

    一种金融大数据场景下的细粒度情感分析方法及装置

    公开(公告)号:CN118297073A

    公开(公告)日:2024-07-05

    申请号:CN202410370432.5

    申请日:2024-03-28

    Abstract: 本发明提出一种金融大数据场景下的细粒度情感分析方法和装置,包括:构建包括多级事件类型集的金融事件标签体系;通过大模型识别金融文本中公司实体;以该金融文本和该公司实体作为该大模型的输入,指导该大模型从该金融事件标签体系中的第一级事件类型集中选择事件;以该金融文本、该公司实体和选择的事件作为大模型的输入,指导该大模型从选择的事件对应的第二级事件类型集中选择事件;使用该金融文本和选择的一二级事件作为该大模型输入,指导该大模型从情感极性列表中选择情感作为该公司实体对应选择的一二级事件的情感分析结果。

    基于细粒度领域自适应的跨领域图像分类方法及系统

    公开(公告)号:CN111259941B

    公开(公告)日:2023-09-26

    申请号:CN202010025566.5

    申请日:2020-01-10

    Abstract: 本发明提出一种基于细粒度领域自适应的跨领域图像分类方法及系统,包括:依次输入源领域图片和目标领域图片至卷积神经网络,分别得到源领域图片的源特征向量和目标领域图片的目标特征向量;依次输入源特征向量和目标特征向量至多层全连接层,在每个全连接层使用局部最大均值差异损失衡量源领域和目标领域的特征差异,将源特征向量经过多层全连接层处理后送入分类器获得预测标签,预测标签结合预标记的类别标签得到交叉熵,交叉熵和特征差异作为分类损失函数;最小化分类损失函数,直到分类损失函数收敛,保存当前卷积神经网络作为图像特征提取网络,将目标领域中待分类图片输入至图像特征提取网络,得到待分类图片的图像分类结果。

    语言处理方法、装置、设备及存储介质

    公开(公告)号:CN110147881B

    公开(公告)日:2022-11-22

    申请号:CN201810206125.8

    申请日:2018-03-13

    Abstract: 本发明是关于一种语言处理方法、装置、设备及存储介质,属于数据处理技术领域。所述方法包括:将源语句进行预处理,生成第一向量;从第一参考向量集中,获取与第一向量间相似度大于第一阈值的第一参考向量;利用第一神经网络,对第一向量及第一参考向量进行解码处理,确定与源语句对应的目标语句,其中,所述第一参考向量集中的参考向量,为在所述第一神经网络训练阶段,对训练数据中的问题语句学习后生成的向量。由此,实现了在进行语言处理过程中,使得神经网络的解码过程,融入了当前源语句与训练样本间的关联关系,从而提高了获取的目标语句的准确性,有效改善了语言处理装对低频源语句处理的准确性。

    一种分布式的趋同行为挖掘方法与系统

    公开(公告)号:CN108563715B

    公开(公告)日:2020-12-04

    申请号:CN201810271602.9

    申请日:2018-03-29

    Abstract: 本发明涉及一种分布式的趋同行为挖掘方法和系统,包括:获取由四元组数据组成的数据集合,四元组数据包括对象、事件、时间点和权重,将数据集合按照事件类型划分为多个事件集合;为事件集合构建索引树,根据事件集合中的时间点确定索引树的时间总长,根据线段树划分法将时间总长拆分为时间段,索引树的每个节点对应时间段中每个对象的权重和,存储索引树至分布式数据库;获取待查询对象的待查询事件和待查询时间段,在分布式数据库查找与待查询事件相对应的索引树,作为待查询索引树,在待查询索引树中查询待查询时间段中每个对象的权重和,作为待查询对象的趋同程度,选择趋同程度最高的对象作为挖掘结果。

    一种基于知识图谱的小样本图片识别方法及系统

    公开(公告)号:CN112766354B

    公开(公告)日:2023-11-24

    申请号:CN202110041403.0

    申请日:2021-01-13

    Abstract: 本发明提出一种基于知识图谱的小样本图片识别方法及系统,包括:获取包含训练图片集中所有种类标签的知识图谱,通过图神经网络对知识图谱进行特征提取,得到知识图谱的节点特征,通过求和网络对节点特征和训练图片集的均值特征进行求和处理,得到各组训练图片集的最终训练特征;以与最终测试特征相似度最高的最终训练特征对应种类标签为训练图片集的识别结果,并以训练图片集的类别标签作为训练目标,优化更新卷积神经网络、图神经网络和求和网络,保存当前卷积神经网络、图神经网络和求和网络作为图片识别模型;将待识别图片输入图片识别模型,得到待识别图片的种类作为图片识别结果。

    一种基于知识图谱的小样本图片识别方法及系统

    公开(公告)号:CN112766354A

    公开(公告)日:2021-05-07

    申请号:CN202110041403.0

    申请日:2021-01-13

    Abstract: 本发明提出一种基于知识图谱的小样本图片识别方法及系统,包括:获取包含训练图片集中所有种类标签的知识图谱,通过图神经网络对知识图谱进行特征提取,得到知识图谱的节点特征,通过求和网络对节点特征和训练图片集的均值特征进行求和处理,得到各组训练图片集的最终训练特征;以与最终测试特征相似度最高的最终训练特征对应种类标签为训练图片集的识别结果,并以训练图片集的类别标签作为训练目标,优化更新卷积神经网络、图神经网络和求和网络,保存当前卷积神经网络、图神经网络和求和网络作为图片识别模型;将待识别图片输入图片识别模型,得到待识别图片的种类作为图片识别结果。

Patent Agency Ranking