-
公开(公告)号:CN102214213A
公开(公告)日:2011-10-12
申请号:CN201110143821.7
申请日:2011-05-31
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明公开了一种采用决策树的数据分类方法和系统。所述方法,包括下列步骤:基于MapReduce机制,并行计算训练数据中包含的每个属性的信息增益,选出最佳的分裂决策属性作为节点构造决策树;根据所述决策树,对输入的数据记录进行分类。其实现了基于MapReduce的并行决策树ID3算法,不仅可以处理大规模数据集,而且并行效率高,即实现构建决策树中节点内部以及同一层节点之间的并行计算。
-
公开(公告)号:CN118297073A
公开(公告)日:2024-07-05
申请号:CN202410370432.5
申请日:2024-03-28
Applicant: 中国科学院计算技术研究所
IPC: G06F40/30 , G06F40/295 , G06Q40/04
Abstract: 本发明提出一种金融大数据场景下的细粒度情感分析方法和装置,包括:构建包括多级事件类型集的金融事件标签体系;通过大模型识别金融文本中公司实体;以该金融文本和该公司实体作为该大模型的输入,指导该大模型从该金融事件标签体系中的第一级事件类型集中选择事件;以该金融文本、该公司实体和选择的事件作为大模型的输入,指导该大模型从选择的事件对应的第二级事件类型集中选择事件;使用该金融文本和选择的一二级事件作为该大模型输入,指导该大模型从情感极性列表中选择情感作为该公司实体对应选择的一二级事件的情感分析结果。
-
公开(公告)号:CN111259941B
公开(公告)日:2023-09-26
申请号:CN202010025566.5
申请日:2020-01-10
Applicant: 中国科学院计算技术研究所
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提出一种基于细粒度领域自适应的跨领域图像分类方法及系统,包括:依次输入源领域图片和目标领域图片至卷积神经网络,分别得到源领域图片的源特征向量和目标领域图片的目标特征向量;依次输入源特征向量和目标特征向量至多层全连接层,在每个全连接层使用局部最大均值差异损失衡量源领域和目标领域的特征差异,将源特征向量经过多层全连接层处理后送入分类器获得预测标签,预测标签结合预标记的类别标签得到交叉熵,交叉熵和特征差异作为分类损失函数;最小化分类损失函数,直到分类损失函数收敛,保存当前卷积神经网络作为图像特征提取网络,将目标领域中待分类图片输入至图像特征提取网络,得到待分类图片的图像分类结果。
-
公开(公告)号:CN111259933B
公开(公告)日:2023-06-13
申请号:CN202010022431.3
申请日:2020-01-09
Applicant: 中国科学院计算技术研究所
IPC: G06F18/2431 , G06N5/01 , G06F16/27 , G06F16/28 , G06F16/2458
Abstract: 本发明提出一种基于分布式并行决策树的高维特征数据分类方法及系统。实现了基于Spark的面向高维特征数据的并行决策树算法,该并行算法并行程度高,可以处理大规模数据集,不仅在决策树中同一层节点之间进行并行计算,而且能够在特征层面上进行并行计算,提高了高维数据的并行程度,能够有效减少高维特征的处理时间。
-
公开(公告)号:CN110147881B
公开(公告)日:2022-11-22
申请号:CN201810206125.8
申请日:2018-03-13
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院计算技术研究所
Abstract: 本发明是关于一种语言处理方法、装置、设备及存储介质,属于数据处理技术领域。所述方法包括:将源语句进行预处理,生成第一向量;从第一参考向量集中,获取与第一向量间相似度大于第一阈值的第一参考向量;利用第一神经网络,对第一向量及第一参考向量进行解码处理,确定与源语句对应的目标语句,其中,所述第一参考向量集中的参考向量,为在所述第一神经网络训练阶段,对训练数据中的问题语句学习后生成的向量。由此,实现了在进行语言处理过程中,使得神经网络的解码过程,融入了当前源语句与训练样本间的关联关系,从而提高了获取的目标语句的准确性,有效改善了语言处理装对低频源语句处理的准确性。
-
公开(公告)号:CN115329183A
公开(公告)日:2022-11-11
申请号:CN202110507498.0
申请日:2021-05-10
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院计算技术研究所
IPC: G06F16/9535 , G06F16/906 , G06Q30/02 , G06Q30/06 , G06N3/08
Abstract: 本申请实施例公开了一种数据处理方法、装置、存储介质及设备。方法包括:获取样本推荐对象集合中的N个候选推荐对象,将每个候选推荐对象分别对应的对象特征,以及被推荐用户对应的用户特征输入初始预测模型中,通过初始预测模型预测目标推荐对象;根据目标推荐对象对应的用户反馈标签以及目标推荐对象对应的预测推荐特征,确定初始预测模型对应的候选模型参数以及候选模型参数对应的调整度;根据候选模型参数以及调整度,确定初始预测模型对应的目标模型参数;根据目标模型参数,对初始预测模型进行参数更新,将满足收敛条件的初始预测模型确定目标预测模型。通过本申请,可以提高目标预测模型进行对象推荐的预测准确率。
-
公开(公告)号:CN108563715B
公开(公告)日:2020-12-04
申请号:CN201810271602.9
申请日:2018-03-29
Applicant: 中国科学院计算技术研究所
IPC: G06F16/2458 , G06F16/22 , G06F8/30
Abstract: 本发明涉及一种分布式的趋同行为挖掘方法和系统,包括:获取由四元组数据组成的数据集合,四元组数据包括对象、事件、时间点和权重,将数据集合按照事件类型划分为多个事件集合;为事件集合构建索引树,根据事件集合中的时间点确定索引树的时间总长,根据线段树划分法将时间总长拆分为时间段,索引树的每个节点对应时间段中每个对象的权重和,存储索引树至分布式数据库;获取待查询对象的待查询事件和待查询时间段,在分布式数据库查找与待查询事件相对应的索引树,作为待查询索引树,在待查询索引树中查询待查询时间段中每个对象的权重和,作为待查询对象的趋同程度,选择趋同程度最高的对象作为挖掘结果。
-
公开(公告)号:CN111460454A
公开(公告)日:2020-07-28
申请号:CN202010176290.0
申请日:2020-03-13
Applicant: 中国科学院计算技术研究所
IPC: G06F21/57 , G06F8/75 , G06F40/194 , G06N3/04
Abstract: 本发明提出一种基于栈指令序列的智能合约相似度检索方法及系统,包括:在以太坊虚拟机上获得待检测的智能合约被执行时的栈指令序列,通过神经网络建模该栈指令序列进而将该智能合约向量化,得到该智能合约的向量表示,并通过向量相似度分析,检索得到与该向量表示最相似的智能合约。该向量相似度分析可作为安全检测的提供依据。
-
公开(公告)号:CN112766354B
公开(公告)日:2023-11-24
申请号:CN202110041403.0
申请日:2021-01-13
Applicant: 中国科学院计算技术研究所
IPC: G06V10/764 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/042 , G06N3/0985
Abstract: 本发明提出一种基于知识图谱的小样本图片识别方法及系统,包括:获取包含训练图片集中所有种类标签的知识图谱,通过图神经网络对知识图谱进行特征提取,得到知识图谱的节点特征,通过求和网络对节点特征和训练图片集的均值特征进行求和处理,得到各组训练图片集的最终训练特征;以与最终测试特征相似度最高的最终训练特征对应种类标签为训练图片集的识别结果,并以训练图片集的类别标签作为训练目标,优化更新卷积神经网络、图神经网络和求和网络,保存当前卷积神经网络、图神经网络和求和网络作为图片识别模型;将待识别图片输入图片识别模型,得到待识别图片的种类作为图片识别结果。
-
公开(公告)号:CN112766354A
公开(公告)日:2021-05-07
申请号:CN202110041403.0
申请日:2021-01-13
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于知识图谱的小样本图片识别方法及系统,包括:获取包含训练图片集中所有种类标签的知识图谱,通过图神经网络对知识图谱进行特征提取,得到知识图谱的节点特征,通过求和网络对节点特征和训练图片集的均值特征进行求和处理,得到各组训练图片集的最终训练特征;以与最终测试特征相似度最高的最终训练特征对应种类标签为训练图片集的识别结果,并以训练图片集的类别标签作为训练目标,优化更新卷积神经网络、图神经网络和求和网络,保存当前卷积神经网络、图神经网络和求和网络作为图片识别模型;将待识别图片输入图片识别模型,得到待识别图片的种类作为图片识别结果。
-
-
-
-
-
-
-
-
-