-
公开(公告)号:CN112559807A
公开(公告)日:2021-03-26
申请号:CN202011410948.6
申请日:2020-12-03
Applicant: 浙江邦盛科技有限公司
IPC: G06F16/901 , G06F16/903
Abstract: 本发明公开了一种基于多源点并行探索的图模式匹配方法,可用于图数据库中确定点出发的图模式模糊查询。本发明根据层次结构将待查询的模式图分解,以图层为单位进行图遍历查询,可以显著减少探索深度,提高并行探索性能。本发明提出中心模式集和边缘模式集的概念,用于控制探索流程,将探索任务由子图为中心转变为以点为中心,可将算法实现于通用分布式图计算平台。本发明提出了一种合并多源点探索结果的匹配结果精炼方法,通过指定多个辅助源点进行重复探索,利用不同视角带来的图层差异加强对匹配结果的约束,提高匹配精度。
-
公开(公告)号:CN110659022B
公开(公告)日:2020-09-04
申请号:CN201910765411.2
申请日:2019-08-19
Applicant: 浙江邦盛科技有限公司
IPC: G06F8/30
Abstract: 本发明公开了一种基于Java自动调用Python脚本的方法,使用java自动启动、关闭python service端。java通过http访问来调用python文件,python文件可集成所有需要调用的python脚本。同时java自动封装好参数调用对应的python脚本并自动注入函数参数。本发明可自管理所有的python进程,负载均衡。本发明方法能够兼容各个python版本,能够通过配置调用所有的python脚本及里面的函数,不需要修改代码,上手简单,部署方便,不需要额外的web容器。
-
公开(公告)号:CN111461216A
公开(公告)日:2020-07-28
申请号:CN202010244378.1
申请日:2020-03-31
Applicant: 浙江邦盛科技有限公司
Abstract: 本发明公开了一种基于机器学习的案件风险识别方法,首先对案件进行分析,提取出有效案件特征列表,并利用随机欠采样的方式抽取白样本,平衡数据中的黑白样本比;然后基于交易流水、账户基本信息、客户基本信息等数据加工特征宽表,并基于特征宽表对随机森林算法进行训练,提取能够有效区分黑白样本的重要特征列表。最后基于重要特征宽表对随机森林算法进行训练与预测,得到最终可疑的账户集合,并针对可疑账户进行核查验证。本发明首次将机器学习有监督算法应用于小样本银行案件风险场景,不仅能够准确识别风险账户,还能够解析出有效的规则,为银行案件风险场景下的规则制定和防控思路提供参考依据。
-
公开(公告)号:CN111105043A
公开(公告)日:2020-05-05
申请号:CN201911321039.2
申请日:2019-12-19
Applicant: 浙江邦盛科技有限公司
Abstract: 本发明公开了一种基于指标维度实施银行业案件和操作风险防控的方法,该方法利用专家经验对银行业案件或者操作风险事件进行研究,还原风险场景,提炼风险特征,并回溯业务流程中的操作缺陷和管理漏洞,然后解析风险规则,生成相关指标。指标进而用于规则配置、风险画像、机器学习模型训练和智能规则输出。本发明首次将指标用于银行的案防领域,实现对具有相关风险特征的账户、可疑的交易或者异常的业务操作进行监控、画像和预警。
-
公开(公告)号:CN110222337A
公开(公告)日:2019-09-10
申请号:CN201910448338.6
申请日:2019-05-28
Applicant: 浙江邦盛科技有限公司
Abstract: 本发明公开了一种基于transformer和CRF的中文地址分词方法。该方法首先将地址文本编码转换为文本信息矩阵;然后将文本信息矩阵作为输入传到transformer神经网络;最后利用条件随机场CRF对transformer神经网络的输出进行标注,得到地址分词标注序列。与传统基于规则的分词方法相比,该方法用数值向量表征地址文本可以使文本信息更加丰富,具有较好的准确率和鲁棒性,对未出现过的新地址数据也可以正确分词。在中文地址分词领域,该方法具有极大的研究意义和使用价值。
-
公开(公告)号:CN109948007A
公开(公告)日:2019-06-28
申请号:CN201910219682.8
申请日:2019-03-21
Applicant: 浙江邦盛科技有限公司
IPC: G06F16/9035 , G06Q40/04
Abstract: 本发明公开了一种对时序数据统计最大连续递增次数与递增次数的处理方法,本发明预先对数据序列分组,然后计算每个分组的最大连续递增与递减次数、首元素、尾元素、从首元素开始的连续递增与递减次数、以尾元素为止的连续递增与递减次数及每个分组的元素个数,把中间结果存储在相应时间戳上,查询时根据指定时间戳快速得到计算结果;由于只存储计算后的中间结果,内存耗费降低,存储效率提高,因为提前计算好了中间结果,所以在查询时响应速度极快;最为重要的是,这部分结果跟着系统时间移动而不断变化,能够达到时间窗口平滑移动的目的。本发明适用于时序数据处理技术等数据分析领域,能够显著提升计算时序数据最大连续递增与递减次数的速度。
-
公开(公告)号:CN108681936A
公开(公告)日:2018-10-19
申请号:CN201810382121.5
申请日:2018-04-26
Applicant: 浙江邦盛科技有限公司
CPC classification number: G06Q30/0609
Abstract: 本发明公开了一种基于模块度和平衡标签传播的欺诈团伙识别方法,包括:利用ID特征结合用户自身已知的欺诈标识,对所有用户计算两两相似度,建立相似度矩阵,通过相似度矩阵建立关联图;对建立的图运行Louvain算法得出每个节点所属的社区及层级信息;以每个节点所属的社区、层级信息及欺诈标识作为每个节点初始的社区信息,运行平衡标签传播过程得到每个节点最终所属社区,再根据是否归属共同社区划分网络,根据传播获得的欺诈标识划分欺诈团伙。本发明首次将基于模块度和平衡标签传播的欺诈团伙识别方法应用到申请反欺诈和交易反欺诈领域,利用交易关联等信息构建关联图谱,综合社团模块度信息,利用平衡标签传播算法检测欺诈社团,防范潜在欺诈交易。
-
公开(公告)号:CN106682067B
公开(公告)日:2018-05-01
申请号:CN201610981804.3
申请日:2016-11-08
Applicant: 浙江邦盛科技有限公司
Abstract: 本发明公开了一种基于交易数据的机器学习反欺诈监测系统,包括管理平台、ETL模块、采样引擎、流处理引擎、训练引擎、预测引擎和决策引擎;流处理引擎通过流式大数据处理对庞大的交易原始数据进行特征的快速提取和计算,从海量原始数据中得到有代表性的特征,充分提取数据中的信息。模型训练模块使用多种针对资金损失率、黑样本查全率优化过的机器学习模型和集成学习框架,得到的是针对某个指标优化的复合模型,克服了单个模型带来的过拟合、不稳定的缺陷,提高了模型的稳定性和泛化能力;模型训练模块通过预先设置的更新时间,自动获取最新数据并重新训练模型,从而使模型始终保持有效性,避免欺诈变异带来的模型失效问题。
-
公开(公告)号:CN113434547A
公开(公告)日:2021-09-24
申请号:CN202110703269.6
申请日:2021-06-24
Applicant: 浙江邦盛科技有限公司
IPC: G06F16/2455 , G06F16/27
Abstract: 本发明公开了一种毫秒级时序流数据精准切片方法。该方法分为四个部分:精准切片的创建、精准切片的聚合、聚合数据的持久化存储和毫秒级切片的查询。首先对时序流数据的处理,包括毫秒级精准切片的创建以及毫秒级精准切片内聚合计算和存储,其次是对时序流数据的查询。本发明提出的毫秒级时序流数据精准切片方法能够在毫秒级时间范围内精准地实时处理用户流式数据,利用不同时序下的切片聚合技术提升系统吞吐量和应对海量数据的高可用性,并根据时间局部性原则将切片聚合数据存入分布式数据库从而高效利用内存空间,最后优化设计了针对时序流数据的查询接口。
-
公开(公告)号:CN113268545A
公开(公告)日:2021-08-17
申请号:CN202110619958.9
申请日:2021-06-03
Applicant: 浙江邦盛科技有限公司
Abstract: 本发明公开了一种增量合并与全量相结合的集群节点间键值数据异步复制方法,该处理方法主要分为五个部分:键值数据复制操作类型的定义、键值对修改请求的合并、增量数据的复制、全量复制的探测和全量复制。本发明键值数据异步复制方法使用异步复制机制保证了数据复制的高吞吐和低延迟,使用版本号进度追踪的机制探测是否需要执行全量复制,并使用请求合并和全量复制的机制降低数据复制带来的网络带宽开销,默认情况下为增量复制,即复制合并后的指标修改请求,但当备节点数据新旧程度远远落后于主节点,主节点会触发全量复制,将本地保存的数据复制到备节点上,从而降低了追赶时间。
-
-
-
-
-
-
-
-
-