一种用于SWF文件的半结构化数据模型构建方法及装置

    公开(公告)号:CN106802953A

    公开(公告)日:2017-06-06

    申请号:CN201710033834.6

    申请日:2017-01-16

    CPC classification number: G06F16/80

    Abstract: 本发明实施例提供了一种用于SWF文件的半结构化数据模型构建方法及装置,方法包括:构建初始半结构化数据模型;针对待存储的SWF文件的文件体,获得文件体中的各个对象的类别标识,并确定各包含相同类别标识对象的对象分组;针对各对象分组,根据该对象分组内包含的各对象的大小,确定该对象分组的存储空间;在文件体子树中构建各对象分组对应的类别子树;并根据各对象分组的存储空间,确定各类别子树的存储空间。应用本发明实施例,能够根据各个对象的大小,确定对象分组的存储空间,进而能够根据对象分组的存储空间,确定各类别子树的存储空间,从而能够解决现有技术中存在的半结构化数据模型存储空间冗余的问题。

    一种面向数据分类的特征权重确定方法及装置

    公开(公告)号:CN106682229A

    公开(公告)日:2017-05-17

    申请号:CN201710012564.0

    申请日:2017-01-09

    CPC classification number: G06F16/285

    Abstract: 本发明实施例提供了一种面向数据分类的特征权重确定方法及装置,方法包括:获取各类别的训练数据,初始化每个训练数据的当前特征权重为相同值,获取预设的执行数量;依次执行循环次数为执行数量的下列步骤:将各训练数据的当前特征权重确定为对应各训练数据的第一特征权重;针对每个训练数据,将该训练数据作为第一训练数据,并计算第一训练数据与其他各训练数据的欧式距离;根据计算的欧式距离,确定其他各训练数据的样本权重;根据其他各训练数据的样本权重、第一训练数据的第一特征权重、以及预先构建的多目标优化函数,确定第一训练数据的当前特征权重。应用本发明实施例,可以确定每个训练数据的特征权重,进而能够准确的对数据进行分类。

Patent Agency Ranking