面向情报大数据的决策树增量学习方法

    公开(公告)号:CN107194468A

    公开(公告)日:2017-09-22

    申请号:CN201710259763.1

    申请日:2017-04-19

    CPC classification number: G06N20/00

    Abstract: 本发明提供的是一种面向情报大数据的决策树增量学习方法。在分裂结点之前,把结点中每个候选属性的多个属性值分别合并成两组,选择信息增益最大的候选属性将结点分为两个分支。在选择下一个将要分裂的结点方面,为所有候选分裂结点计算对应的结点分裂度量值,并且总是选择结点分裂度量值最大的候选结点作为下一个分裂结点。IID5R增加了评估分类属性质量的功能。本发明将NOLCDT与IID5R相结合,提出了一个混合分类器算法HCS,主要有两个阶段组成:构建初始决策树和增量学习。根据NOLCDT建立初始决策树,然后使用IID5R进行增量学习。HCS算法综合了决策树以及增量学习方法的优点,既便于理解又适于增量学习。

    基于上下文感知和复杂语义关联的数据空间建模方法

    公开(公告)号:CN106021297A

    公开(公告)日:2016-10-12

    申请号:CN201610289513.8

    申请日:2016-05-04

    CPC classification number: G06F17/30908

    Abstract: 基于上下文感知和复杂语义关联的数据空间建模方法,本发明涉及数据空间建模方法。本发明的目的是为了解决现有方法存在以下缺陷:1)上下文感知性较弱;2)语义关系表达能力弱;3)语义关联推理能力弱。通过以下技术方案实现的:步骤一、构建一种半结构化图模型,称之为上下文感知的复杂语义关联网络模型COSAN;步骤二、根据上下文感知的复杂语义关联网络模型COSAN表示上下文感知的解释对象;步骤三、根据上下文感知的解释对象得出上下文感知的基本语义关联和复杂多元语义关联;步骤四、根据上下文感知的基本语义关联和复杂多元语义关联得出语义关联推理规则。本发明应用于数据空间建模领域。

    路网中面向集合的空间关键词查询方法

    公开(公告)号:CN105868336A

    公开(公告)日:2016-08-17

    申请号:CN201610182802.8

    申请日:2016-03-28

    Abstract: 路网中面向集合的空间关键词查询方法,属于空间关键词查询技术领域。本发明的提出是为了实现对于用户的提出的空间关键词查询能够快速返回多条最佳路线供用户选择。技术要点:本发明所提出的路网中面向集合受查询方向约束的空间关键词查询给出了两种情况,即面向无主关键词的查询和主关键词优先的查询。无主关键词的查询即从查询点出发按照道路网在可查询范围内扩展查询。主关键词优先的查询,首先在可查询范围内以一种迭代替换的方式进行扩展查询直到查询到主关键词对象,若还有关键词没有被已查询到的空间对象所覆盖,则以面向无主关键词的查询方式继续进行扩展查询。分别对以上两种查询进行了实验,证明了所提方法的有效性。

    路网中面向集合的空间关键词查询方法

    公开(公告)号:CN105868336B

    公开(公告)日:2019-11-29

    申请号:CN201610182802.8

    申请日:2016-03-28

    Abstract: 路网中面向集合的空间关键词查询方法,属于空间关键词查询技术领域。本发明的提出是为了实现对于用户的提出的空间关键词查询能够快速返回多条最佳路线供用户选择。技术要点:本发明所提出的路网中面向集合受查询方向约束的空间关键词查询给出了两种情况,即面向无主关键词的查询和主关键词优先的查询。无主关键词的查询即从查询点出发按照道路网在可查询范围内扩展查询。主关键词优先的查询,首先在可查询范围内以一种迭代替换的方式进行扩展查询直到查询到主关键词对象,若还有关键词没有被已查询到的空间对象所覆盖,则以面向无主关键词的查询方式继续进行扩展查询。分别对以上两种查询进行了实验,证明了所提方法的有效性。

    一种改进的分层级联的支持向量机并行化方法

    公开(公告)号:CN107194411A

    公开(公告)日:2017-09-22

    申请号:CN201710237933.6

    申请日:2017-04-13

    CPC classification number: G06K9/6257 G06K9/6269

    Abstract: 本发明提供的是一种改进的分层级联的支持向量机并行化方法。通过改进的Cascade SVM算法得到了优化:首先,改进算法中c的引入,用于在层级训练过程中,衡量每一层训练中得到的模型支持向量个数的变化情况。其次,通过调整模型训练过程中的合并策略和层次结构,每层训练得到的支持向量的合并方式由两两合并,优化调整为全部合并之后再进行平均切分,这样避免了两两进行合并方式中存在过滤非边界样本不足的缺点。本发明可以保证不失分类精度的前提下,同时借助当前主流的Spark并行框架,有效地缩短模型训练时间,提高模型的训练和分类效率。

    基于卷积神经网络的水下目标特征提取方法

    公开(公告)号:CN107194404A

    公开(公告)日:2017-09-22

    申请号:CN201710237910.5

    申请日:2017-04-13

    CPC classification number: G06K9/4628 G06K9/6262 G06N3/0454 G06N3/084

    Abstract: 本发明提供的是一种基于卷积神经网络的水下目标特征提取方法。1、将原始辐射噪声信号的采样序列,分成25个连续部分,每个部分再设置25个采样点;2、将第j段数据信号的采样样本做归一化和中心化处理;进行短时傅里叶变换得到LoFAR图;4、将向量赋值到已有3维张量中;5、将得到特征向量输入到全连接层进行分类并计算与标签数据的误差,检查损失误差是否低于误差阈值,若低于则停止网络训练,否则进入步骤6;6、使用梯度下降方法对网络从后向前逐层进行参数调整,并转入步骤2。本发明方法的识别率与传统卷积神经网络算法相比,对特征图层进行了空间信息多维度的加权操作,来弥补因全连接层的一维向量化所带来的空间信息丢失的缺陷。

    一种基于电路图元素隐喻的主题演化可视化方法

    公开(公告)号:CN106227911A

    公开(公告)日:2016-12-14

    申请号:CN201610487736.5

    申请日:2016-06-28

    CPC classification number: G06F17/5081

    Abstract: 本发明属于数据可视化分析领域,具体涉及一种基于电路图元素隐喻的主题演化可视化方法。包括:数据预处理,对文本数据进行预处理,进行分词、去停词操作,将文本集合处理成词库;采用LDA算法对文本集合进行处理,抽取主题,并记录与主题对应的词、文本以及时间和地点信息;以焊盘图标隐喻主题中的词,即词盘,词盘采用空心饼图形式表示,表示在此时间段内此词所处的地理分布比例等。该方法主要能够展示主题的内容、主题的强度随时间的变化及主题与主题间的演化关系以方便用户对主题的演化过程进行分析,还可展示各时段内同一主题强度的地理分布。

    面向数据空间的实体分类方法

    公开(公告)号:CN106067029A

    公开(公告)日:2016-11-02

    申请号:CN201610348890.4

    申请日:2016-05-24

    CPC classification number: G06K9/6223 G06K9/6267

    Abstract: 面向数据空间的实体分类方法,属于自然语言处理领域。演化环境下,存在无法通过假设实体为静止状态,而对实体进行分类的问题。一种面向数据空间的实体分类方法,首先,针对演化的数据空间实体,提出改进的、演化的K‑Means聚类框架,即定义基于轮廓值和KL‑散度的目标代价函数;其次,设计了一种新颖的数据空间实体相似性度量方法;然后,根据启发式规则,提出演化的K‑Means聚类算法。此外,进一步扩展本章提出的演化聚类框架,以处理簇数量随时间发生变化或者快照实体随时间加入或移除的情况。本发明不仅能高质量地捕获当前实体聚类结果,还能健壮地反映历史聚簇情况。

    基于图划分策略的数据库模式抽象方法

    公开(公告)号:CN105956012A

    公开(公告)日:2016-09-21

    申请号:CN201610251897.4

    申请日:2016-04-21

    CPC classification number: G06F17/30598

    Abstract: 基于图划分策略的数据库模式抽象方法,本发明涉及数据库模式抽象方法。本发明是要解决忽略了表与表之间的结构紧密性、用户查询偏好信息以及现有方法对模式抽象结果中主题类簇的个数无法做出准确预测的问题,而提出的基于图划分策略的数据库模式抽象方法。该方法是通过一、构建关系数据库的拓扑紧密性矩阵T;二、计算得到表间相似性矩阵ADB;三、得到最终的数据表ti和数据表tj间的相似性计算结果;四、得到最终的表重要性度量结果;五、利用类簇代表检测算法得到结果集合R;六、将数据表ti和数据表tj划分到主题类簇等步骤实现的。本发明应用于数据库模式抽象领域。

Patent Agency Ranking