自属数据库的建模装置及方法、信息处理系统及方法

    公开(公告)号:CN107944006A

    公开(公告)日:2018-04-20

    申请号:CN201711286299.1

    申请日:2017-12-07

    Inventor: 李彦辰

    CPC classification number: G06F17/30294

    Abstract: 本发明提供了一种自属数据库的建模装置及方法、信息处理系统及方法,该装置包括:语音录入模块,用于用户录入自属语音参数并发送给绑定标注模块;文字录入模块,用于用户录入自属文字参数并发送给绑定标注模块;国家标准录入模块,用于录入国家标准语音参数和文字参数并发送给绑定标注模块;绑定标注模块,用于将自属语音参数、自属文字参数与国家标准语音参数、国家标准文字参数匹配并进行绑定标注,并将绑定标注结果发送至数据库;数据库,用于实时存储和更新绑定标注结果。本发明具有结构简单、使用安全方便的优点。

    数据库构建装置、数据库构建方法以及数据库构建程序

    公开(公告)号:CN107533505A

    公开(公告)日:2018-01-02

    申请号:CN201780001385.5

    申请日:2017-02-13

    Inventor: 多谷健嗣

    CPC classification number: G06F17/30294 G06F12/00 G06F17/30312 G06F17/30557

    Abstract: 本发明在提高用于构建数据库的工作的效率时,促进构成该数据库的数据的成立条件的显现。数据库构建装置(62)具有原文件存储部(82)、构成数据确定信息存储部(92)、数据库构建部(90)。数据库构建部(90)将接下来叙述的原数据(120)中的任一个原数据(120)作为数据库的至少一部分,与构成数据确定信息相关联并存储在数据库存储装置(60)中。在原文件中,该原数据(120)与原数据确定信息(122)中的、由构成数据确定信息存储部(92)所存储的原数据确定信息(122)建立有对应关系。原数据确定信息(122)表示多种原数据成立条件。构成数据确定信息表示多种数据库构成数据成立条件。

    一种利用相关系数进行药品库数据处理的方法

    公开(公告)号:CN106979934A

    公开(公告)日:2017-07-25

    申请号:CN201710389822.7

    申请日:2017-05-27

    CPC classification number: G01N21/359 G06F17/30294 G06F17/30536 G06F17/30595

    Abstract: 一种利用相关系数进行药品库数据处理的方法,具体为一种取自药品的近红外光谱数据整合、构建成库并应用于未知药品理化指标快速测定的方法,包括药品近红外光谱库的构建和应用光谱库快速、准确分析待测药品品质两大部分。其基本思路是,按剂型划分药品数据,分剂型建立药品近红外光谱库,在同一剂型前提下,利用药品近红外光谱间相关系数绘制所有样品有序分布图即频数与相关系数柱状图,完成光谱库的构建;并基于相关系数确定待测品种的相似品种和可参考样本,将已知理化值和近红外光谱的相似品种和可参考样本统一建模,获得待测品质所需指标的快速定量模型,实现近红外光谱库的应用,适用于同一剂型下所有品种、所有指标的检测。

    一种油藏的数字字典的构建方法

    公开(公告)号:CN106933832A

    公开(公告)日:2017-07-07

    申请号:CN201511017721.4

    申请日:2015-12-30

    CPC classification number: G06F17/30294

    Abstract: 本发明涉及一种油藏的数字字典的构建方法,根据油藏专业领域内的实体对象、描述实体对象的属性信息以及油藏开发常用的名词生成对应的标准数据信息;将标准数据信息按照规定的格式存储到关系型数据库中,完成数字字典的构建。油藏数字字典将油藏开发中的实体对象、描述实体对象的属性信息以及油藏开发常用的名词进行了统一的解释与定义,并且可以方便的查询,方便了油藏专家的工作与信息查询;本发明的油藏数字字典将油藏领域的专业知识统一化,实现了跨域数据的信息融合,打破了传统油藏开发中的信息壁垒,使油藏开发更加高效,节约时间。

    强变量提取方法及装置
    7.
    发明公开

    公开(公告)号:CN106095942A

    公开(公告)日:2016-11-09

    申请号:CN201610416751.0

    申请日:2016-06-12

    CPC classification number: G06F17/30294 G06F17/30539 G06F17/30598

    Abstract: 本发明公开了一种强变量提取方法及装置;方法包括:基于基础变量池中的基础变量构造强变量,形成用于第k轮迭代训练的强变量候选集;基于所述强变量候选集对特征筛选模型进行第k轮迭代训练,k为取值依次增大的正整数,且k取值满足k≥1;将所述特征筛选模型输出的特征并入到入选特征集合,所述输出的特征为对所述特征筛选模型进行第k轮迭代训练后在所述强变量候选集中提取的强变量;基于第k轮迭代训练后所述特征筛选模型的残差确定需要对所述特征筛选模型进行第k+1轮迭代训练;筛除所述基础变量池中用于构造所述入选特征集合中的特征所使用的基础变量。实施本发明,能够从弱变量中有效提取强变量。

    一种C-Mn钢工业大数据的挖掘方法

    公开(公告)号:CN105740467A

    公开(公告)日:2016-07-06

    申请号:CN201610127406.5

    申请日:2016-03-07

    Applicant: 东北大学

    CPC classification number: G06F17/30536 G06F17/30294 G06F17/30598

    Abstract: 本发明提出一种C?Mn钢工业大数据的挖掘方法,属于钢铁工业生产和数据统计建模的交叉技术领域,该方法包括数据样本选取、钢卷归并、相似工艺聚类和训练数据均匀化;本发明通过选择多个钢牌号的数据,使数据样本中包含了较为全面的参数信息,反映出更客观的物理冶金规律,使模型具有更广泛的适用性;通过对检测钢坯成分的判断和采用聚类的方法,将相似工艺的多组数据校正为一组数据,精简数据量,删除冗余数据;在此过程中剔除了异常数据,减小了误差,使数据的规律性更为显著;通过统计训练数据三种力学性能的分布,调整了训练数据的分布均衡性;采用均衡的数据训练神经网络,可以使网络模型学习到均衡的信息,提高了模型的规律性和准确性。

    一种对提取的Web表格数据进行集成的方法及装置

    公开(公告)号:CN105677874A

    公开(公告)日:2016-06-15

    申请号:CN201610016013.7

    申请日:2016-01-11

    CPC classification number: G06F17/30306 G06F17/30294

    Abstract: 本发明公开了对提取的Web表格数据进行集成的方法及装置,能够提高对Web表格数据进行集成形成的数据库准确性。包括:获取Web表格语料库;获取每个表格的候选语义;计算每个表格的候选语义与数据语义的不一致性;若不一致性大于第一预定阈值,表格候选语义不正确,利用众包确认该表格的候选语义,根据该表格语义似然值和众包反馈结果重新计算该表格候选语义,并重新计算不一致性;若不一致性大于第二预定阈值小于第一预定阈值,利用知识库和众包模式确认该表格中数据正确性,重新计算不一致性;若不一致性小于第二预定阈值,该表格候选语义正确,对该表格中的数据进行标注;确定所有表格候选语义均正确时,进行模式映射和数据清洗。

    一种关系型数据库数据分发的方法

    公开(公告)号:CN105045912A

    公开(公告)日:2015-11-11

    申请号:CN201510495208.X

    申请日:2015-08-13

    Inventor: 魏建斌

    CPC classification number: G06F17/30292 G06F17/30294 G06F17/30595

    Abstract: 本发明公开了一种关系型数据库数据分发的方法,属于计算机数据分发领域,设计的步骤,即针对关系型数据库进行建模,将其描述为数据内容和数据描述两种元数据;分发的步骤,即将数据进行解析执行。本发明的一种关系型数据库数据分发的方法与现有技术相比,通过提供一种不使用SQL的方式来交付关系型数据库的数据,减少ERP软件开发过程中SQL编写的繁琐性,降低软件交付引起的生产环境数据出错的几率。

Patent Agency Ranking