基于Data Vault模型的数据仓库构建方法、装置、设备及介质

    公开(公告)号:CN119557381B

    公开(公告)日:2025-04-11

    申请号:CN202510122603.7

    申请日:2025-01-26

    Abstract: 本申请涉及数据仓库构建的技术领域,尤其涉及基于Data Vault模型的数据仓库构建方法、装置、设备及介质。本申请首先获取源系统的元数据信息,通过语义分析提取业务主题标识;然后基于预设的模板库进行智能匹配,确定对应的Hub实体模型;接着对数据内容进行深度分析,识别业务键和关联关系;最后通过关联映射形成完整的Data Vault模型结构;通过模板库和映射机制实现了模型构建的标准化和自动化,显著提升了数据仓库建模的质量和效率。

    一种银行数智模型赋能平台及数智化系统

    公开(公告)号:CN119398901A

    公开(公告)日:2025-02-07

    申请号:CN202411975884.2

    申请日:2024-12-31

    Abstract: 本申请涉及数智化的技术领域,尤其涉及一种银行数智模型赋能平台及数智化系统。本申请首先通过基准阈值获取模块建立各类模型的性能基准标准,然后基于模型稳定系数获取模块对历史数据进行深度分析,量化模型在不同场景下的稳定性特征,继而通过监控阈值更新模块将稳定系数与基准阈值相结合生成动态阈值,最后由阈值调整模块实现监控标准的自适应更新,能够根据模型的历史表现特征和当前业务场景自动调整监控策略,显著提升了模型监控的准确性和实用性。

    一种基于聚类算法的网络信息处理方法

    公开(公告)号:CN114970649B

    公开(公告)日:2024-07-26

    申请号:CN202110201619.9

    申请日:2021-02-23

    Abstract: 本发明公开了一种基于聚类算法的网络信息处理方法,涉及信息处理技术领域。具体包括获取初始数据,设定所述初始数据的中心点,根据所述中心点将初始数据划分成至少两个初始簇;计算各初始簇中的数据与该初始簇的中心点之间的距离并形成距离矩阵,根据该距离矩阵获取数据相似性的权重;根据数据相似性的权重对参数进行调整和数据更新并生成新的簇。旨在自动对不完整的多数据形态信息将信息进行分类,以将缺少部分信息的同类数据融合在一起,以得到包含所有信息的数据,方便信息提取和应用。

    一种基于稀疏表示的图像检索方法和装置

    公开(公告)号:CN108182188A

    公开(公告)日:2018-06-19

    申请号:CN201611123413.4

    申请日:2016-12-08

    Abstract: 本发明提供了一种基于稀疏表示的图像检索方法和装置,该方法包括步骤S1,输入图像集,对图像集中的输入图像进行预处理;步骤S2,采用群稀疏特征选择策略,选择出输入图像和图像数据库的特征信息,构成图像特征库;步骤S3,根据输入图像的特征和图像数据库中的特征进行特定的度量比较,计算出相似度,得出初次匹配结果;步骤S4,根据相似度的大小输出与输入图像相似的图像。与现有技术比较本发明的有益效果在于:提取的特征采用了图像的颜色、纹理和方向特征,可以更加准确地表达图像的真实内容,改善图像检索的性能。采用群稀疏特征选择策略提出了一种特征选优的方法,可以自主选择最优特征进行特征匹配,提高了图像检索系统的精度。

    一种基于随机森林算法的网页排序方法

    公开(公告)号:CN108182186A

    公开(公告)日:2018-06-19

    申请号:CN201611122793.X

    申请日:2016-12-08

    Abstract: 本发明提供一种基于随机森林算法的网页排序方法,包括:获取搜索网页对应的关键词和关键备选词;计算所述搜索网页对应的关键词或者关键备选词词频和权重;计算搜索网页质量相关指标PR值;计算搜索网页的枢纽值和权威值;计算最近浏览网页与所述搜索网页的相关性与最近浏览网页的关键词以及关键备选词的TF-IDF值乘积;计算输出指标:规定访问时间以上的搜索网页用户网页浏览次数与满足条件的网页停留时间某一函数的乘积是否大于设定的阀值;建立随机森林模型并记录相应结果;计算最终的所述搜索网页得分并排序。与现有技术相比,本发明的利用随机森林的方法对传统的HITS算法进行一定程度上的改良,提升用户的搜索体验,使得信息来得更好更准。

    一种基于Adaboosting算法思想的图像去噪方法及装置

    公开(公告)号:CN108154480A

    公开(公告)日:2018-06-12

    申请号:CN201611103030.0

    申请日:2016-12-05

    Abstract: 本发明公开一种基于Adaboosting算法思想的图像去噪方法,其包括:步骤a,选定滤波器集合F以及参数范围;步骤b,初始化像素权重;步骤c,进入循环处理,计算每个循环对应的滤波器清晰度误差、对应的滤波器权重以及更新后各个像素的权重;步骤d,生成‘强去噪图像’;步骤e,改变滤波器类型。还公开了一种与基于Adaboosting算法思想的图像去噪方法相对应的装置。这样,采用Adaboost图像去噪法,考虑了各个‘弱滤波器’的效果,找到最优的滤波器组合,Adaboost图像去噪法有效解决单一滤波器不能解决的多噪声,未知噪声的图像问题,该方法为图像去噪乃至于图像处理其他方面提供了一个有效的解决方向。

    一种聚类分析方法及装置
    17.
    发明公开

    公开(公告)号:CN108154162A

    公开(公告)日:2018-06-12

    申请号:CN201611103950.2

    申请日:2016-12-05

    CPC classification number: G06K9/6223

    Abstract: 本发明提供一种聚类分析方法和装置,该聚类分析装置包括:数据获取模块、第一聚类模块、样本数据确定模块、筛选样本模块、计算模块和第二聚类模块。与现有技术相比,本发明提供的一种聚类分析方法和装置,计算两个类的类间距离时采用的是筛选出的两个类中的代表数据对象两两之间的距离,而不是两个类中所有的数据对象,从而节约了所耗费的时间和资源。对于类中代表数据的筛选是根据选择距离簇中心较近和最密集的数据对象为原则,可以提高取样估计的准确性,避免了簇边缘上容易出现误差的数据对象,从而减少了类中可能包含不属于该类的数据对象的概率,提高了聚类效果。

    一种Data Vault模型数据仓库自动构建的方法及装置

    公开(公告)号:CN104866576B

    公开(公告)日:2018-03-02

    申请号:CN201510272096.1

    申请日:2015-05-25

    Abstract: 本发明提供一种Data Vault模型数据仓库自动构建的方法及装置,该构建装置包括表查询装置和建表装置,所述表查询装置包括第一初始化单元、搜索单元、判断单元、写入单元、匹配单元和记录单元;所述建表装置包括第一处理单元、第二初始化单元、第二处理单元和建表单元。该构建方法包括表查询步骤和建表步骤。本发明提供的一种Data Vault模型数据仓库自动构建的方法及装置,可以利用对字段名和表与表之间的关联关系探索所需的中心表之间的关系,建立中心表、链接表和附属表之间的逻辑关系,从数据库表中抽取表并构建企业数据仓库,从而节省了企业级数据仓库构建人员构建企业数据仓库时进行逻辑分析的时间。

    基于Data Vault模型的数据仓库构建方法、装置、设备及介质

    公开(公告)号:CN119557381A

    公开(公告)日:2025-03-04

    申请号:CN202510122603.7

    申请日:2025-01-26

    Abstract: 本申请涉及数据仓库构建的技术领域,尤其涉及基于Data Vault模型的数据仓库构建方法、装置、设备及介质。本申请首先获取源系统的元数据信息,通过语义分析提取业务主题标识;然后基于预设的模板库进行智能匹配,确定对应的Hub实体模型;接着对数据内容进行深度分析,识别业务键和关联关系;最后通过关联映射形成完整的Data Vault模型结构;通过模板库和映射机制实现了模型构建的标准化和自动化,显著提升了数据仓库建模的质量和效率。

    医疗敏感数据采集脱敏方法
    20.
    发明公开

    公开(公告)号:CN116756750A

    公开(公告)日:2023-09-15

    申请号:CN202310605428.8

    申请日:2023-05-25

    Inventor: 许飞月 王羽飞

    Abstract: 本发明涉及一种医疗敏感数据采集脱敏方法,包括:获取摄像设备返回的视频流数据;对视频流数据中的敏感数据进行屏蔽,得到脱敏数据流;响应于外部输入的拍照指令,根据脱敏数据流生成脱敏图片,且处理敏感数据得到隐私码;将脱敏图片和隐私码进行加密,得到加密文件并将加密文件保存在存储设备中。针对大多数移动端设备公私兼用的情况导致本地存储面临内部外部的数据泄露风险,采集医疗数据的同时确保采集数据的安全性和私密性。区别于传统采集类移动端应用,采集的视频流数据在整个采集流程中都做了脱敏处理(包括实时拍摄时的画面),并生成的脱敏图片以及隐私码进行打包处理,确保在本地存储时以及传输时数据的安全性。

Patent Agency Ranking