-
公开(公告)号:CN108268876A
公开(公告)日:2018-07-10
申请号:CN201611257674.5
申请日:2016-12-30
Applicant: 广东精点数据科技股份有限公司
IPC: G06K9/62
CPC classification number: G06K9/6221 , G06K9/6223
Abstract: 本发明提供一种基于聚类的近似重复记录的检测方法及装置,该方法包括步骤S1:使用Canopy聚类先对近似重复记录进行“粗”聚类;步骤S2:对Canopy内的点进行基于K-means的聚类,得到近似重复记录;步骤S3:清洗近似重复记录。与现有技术相比:本发明提供了一种基于聚类的近似重复记录的检测方法及装置,通过Canopy聚类方法和K-means聚类方法来聚类近似重复记录,保证了较高的检测近似重复记录的精确程度,提高了检测近似重复记录的效率;本发明创建的Canopy不会太大且Canopy之间重叠的不多,这样大大减少了后续需要计算相似性的对象的个数,从而降低了计算量,减小了内存需求;本发明中的K-means算法中的阈值通过Canopy个数来确定,减少了选择阈值的盲目性。
-
公开(公告)号:CN108268462A
公开(公告)日:2018-07-10
申请号:CN201611254042.3
申请日:2016-12-30
Applicant: 广东精点数据科技股份有限公司
IPC: G06F17/30
Abstract: 本发明提供一种关系完整性的数据质量检测系统,其包括:元数据处理模块,用于从待检测数据所在的数据库中读取待检测数据的逻辑数据结构,并通过用户交互和自动检测发现潜在的数据关系来生成关系完整性规则模板;模板处理模块,用于在资源库中存储和提取所述元数据处理模块得到的关系完整性规则模板;问题处理模块,用于发现、展示和处理关系完整性数据问题。本发明提供的一种关系完整性的数据质量检测系统,可以解决复杂的关系完整性数据问题的检测,并通过用户辅助和一定自动化生成质量检测模板,为后续增量数据的检测提供便利,相比人工检测节省了大量时间和精力。
-
公开(公告)号:CN107104271A
公开(公告)日:2017-08-29
申请号:CN201710225713.1
申请日:2017-04-07
Applicant: 广东精点数据科技股份有限公司
Abstract: 本发明属于无线电收发装置领域,本发明针对,在低频(小于100MHz)段内,常规的单极子天线的带宽的技术问题,具体公开了一种低频加载天线,包括:单极子天线,单极子天线上连接有馈线;集总加载部,集总加载部与单极子天线串联;阻抗变换部,用于实现单极子天线的馈电端的阻抗等于馈线的特性阻抗;其中,集总加载部包括电感和电阻,电感和电阻与单极子天线串联。
-
公开(公告)号:CN107092006A
公开(公告)日:2017-08-25
申请号:CN201710225711.2
申请日:2017-04-07
Applicant: 广东精点数据科技股份有限公司
IPC: G01S3/14
Abstract: 本专利属于阵列信号处理领域,本发明针对现有的MUSIC算法,在向量空间的特征分解部分运算量大的技术问题,具体公开了用于DOA估计的阵列信号处理方法,包括如下步骤:接收步骤:利用传感器组成阵列接收目标信号;处理步骤:对接收到的目标信号进行滤波、放大,然后构造空间向量矩阵;计数步骤:对用于接收目标信号的传感器进行计数;求解步骤:根据计数步骤所得的值,选取QR算法或者Jacobi算法,求解空间向量矩阵特征值和特征向量;搜索步骤:谱峰搜索获得定位参数;显示步骤:将定位结果由显示电路显示。用于DOA估计的阵列信号处理系统,包括:接收传感器阵列、信号预处理模块、算法执行模块、定位结果显示模块。
-
公开(公告)号:CN107069233A
公开(公告)日:2017-08-18
申请号:CN201611232554.X
申请日:2016-12-28
Applicant: 广东精点数据科技股份有限公司
Abstract: 本申请公开了一种具有低RCS特性的微带贴片天线,包括天线本体,所述天线本体包括辐射贴片,还包括贴敷在辐射贴片周围的多组极化旋转片模块,每组极化旋转片模块均包括多个行列排列的极化旋转片单元,各组极化旋转片模块均沿同一旋转方向呈90度旋转排布,其中所述的极化旋转片单元包括中间的介质板、位于介质板下部的金属底板以及位于介质板上部的金属贴片,各极化旋转片模块内的金属贴片的朝向一致,所述的金属贴片包括两个一体相接的呈中心对称的贴片单元,每个贴片单元均包括从内向外首尾一体相接的第一贴片和第二贴片,第一贴片和第二贴片均包括直片段和与直片段交叉形成箭头状的两个尾片段。
-
公开(公告)号:CN119557381B
公开(公告)日:2025-04-11
申请号:CN202510122603.7
申请日:2025-01-26
Applicant: 广东精点数据科技股份有限公司
Abstract: 本申请涉及数据仓库构建的技术领域,尤其涉及基于Data Vault模型的数据仓库构建方法、装置、设备及介质。本申请首先获取源系统的元数据信息,通过语义分析提取业务主题标识;然后基于预设的模板库进行智能匹配,确定对应的Hub实体模型;接着对数据内容进行深度分析,识别业务键和关联关系;最后通过关联映射形成完整的Data Vault模型结构;通过模板库和映射机制实现了模型构建的标准化和自动化,显著提升了数据仓库建模的质量和效率。
-
公开(公告)号:CN119398901A
公开(公告)日:2025-02-07
申请号:CN202411975884.2
申请日:2024-12-31
Applicant: 广东精点数据科技股份有限公司
IPC: G06Q40/02
Abstract: 本申请涉及数智化的技术领域,尤其涉及一种银行数智模型赋能平台及数智化系统。本申请首先通过基准阈值获取模块建立各类模型的性能基准标准,然后基于模型稳定系数获取模块对历史数据进行深度分析,量化模型在不同场景下的稳定性特征,继而通过监控阈值更新模块将稳定系数与基准阈值相结合生成动态阈值,最后由阈值调整模块实现监控标准的自适应更新,能够根据模型的历史表现特征和当前业务场景自动调整监控策略,显著提升了模型监控的准确性和实用性。
-
公开(公告)号:CN118552303A
公开(公告)日:2024-08-27
申请号:CN202410989674.2
申请日:2024-07-23
Applicant: 广东精点数据科技股份有限公司
IPC: G06Q40/03 , G06F40/186 , G06F40/295 , G06N5/022 , G06F18/22 , G06F18/23213
Abstract: 本申请提供一种面向金融大数据融合分析方法,包括:根据不同贷款中介群体的消费贷期限偏好占比、抵押商品类型差异化占比、还款方式偏好占比和风险水平,并通过正交表实验设计方法,生成与贷款中介群体相匹配的最优消费贷产品方案,包括消费贷金额、期限、利率和还款方式;根据最优消费贷产品方案,通过条件随机场算法,构建申请材料识别模型,对贷款中介提交的申请材料进行结构化提取,通过命名实体识别对关键要素信息进行识别,并与预设申请模板进行比对,采用编辑距离算法识别出填写缺失或不合规之处,生成申请审核报告。
-
公开(公告)号:CN114970649B
公开(公告)日:2024-07-26
申请号:CN202110201619.9
申请日:2021-02-23
Applicant: 广东精点数据科技股份有限公司
IPC: G06F18/23213 , G06F18/22
Abstract: 本发明公开了一种基于聚类算法的网络信息处理方法,涉及信息处理技术领域。具体包括获取初始数据,设定所述初始数据的中心点,根据所述中心点将初始数据划分成至少两个初始簇;计算各初始簇中的数据与该初始簇的中心点之间的距离并形成距离矩阵,根据该距离矩阵获取数据相似性的权重;根据数据相似性的权重对参数进行调整和数据更新并生成新的簇。旨在自动对不完整的多数据形态信息将信息进行分类,以将缺少部分信息的同类数据融合在一起,以得到包含所有信息的数据,方便信息提取和应用。
-
公开(公告)号:CN107480435B
公开(公告)日:2020-12-08
申请号:CN201710641052.0
申请日:2017-07-31
Applicant: 广东精点数据科技股份有限公司
IPC: G06F16/2458 , G16H50/50 , G16H50/70
Abstract: 本专利属于医疗大数据处理领域,本发明的解决的技术问题在于提供一种应用于临床数据的自动搜索机器学习方法,其具有快速提取临床数据、为医疗行业研究者提供最优算法、方便医疗行业研究者调整参数且具有学习能力的功能,包括如下步骤:S1:临床参数提取,将临床参数记录在EAV文件或者EXCEL文件中;S2:参数筛选,用MapReduce框架支持在SPARK上执行枢轴,在SPARK上执行枢轴用来提取有效的临床参数;S3:在机器内预制若干的推荐算法模型,然后建立SQL语句执行可视化查询,根据EAV文件或者EXCEL文件内容向用户展示可调用的相关算法,机器通过S4自主确定推荐算法模型及推荐算法参数。还公开了一种应用于临床数据的自动搜索机器学习系统。
-
-
-
-
-
-
-
-
-