-
公开(公告)号:CN108765127A
公开(公告)日:2018-11-06
申请号:CN201810382123.4
申请日:2018-04-26
Applicant: 浙江邦盛科技有限公司
IPC: G06Q40/02
CPC classification number: G06Q40/025
Abstract: 本发明公开了一种基于蒙特卡罗搜索的信用评分卡特征选择方法,包括:在信用风险评级场景,获得信用评分特征数据;初始化蒙特卡罗搜索树;选择未被完全扩展节点,使用偏回归平方和指标进行复合策略扩展;在扩展后的树结构基础上,在随机模拟策略中引入偏回归平方和划定随机选择域,生成模拟路径;基于每一条路径所选择的特征分别使用交叉验证方法进行逻辑回归建模,并计算相关统计量;基于UCB公式选择最佳路径。采用本发明提出的信用评分卡特征选择方法,可以极大地提升信用评分卡的建模效果,保证信用评分卡的建模特征最优,从根本上自动化信用评分卡构建的特征选择过程,可以广泛应用在信用风险控制领域。
-
公开(公告)号:CN106529963B
公开(公告)日:2018-02-16
申请号:CN201611057305.1
申请日:2016-11-26
Applicant: 浙江邦盛科技有限公司
Abstract: 本发明公开了一种用于移动设备安全认证的系统及方法,该系统包括前端采集SDK模块、设备指纹持久化模块、设备指纹服务模块和设备指纹验证模块;所述设备指纹服务模块接收前端采集SDK模块的请求,识别前端采集SDK模块的类型,校验请求内容,查询或生成原始设备指纹码,加密原始设备指纹码后将其返回给请求的前端采集SDK模块;所述设备指纹验证模块校验设备指纹服务模块生成的密文设备指纹码是否合法。本发明可以有效为设备提供唯一的设备指纹码,用于区别其他设备;通过给原始设备指纹码添加加密、校验过程,排查设备指纹码是否非法,是否被篡改等情况;能够有效保护原始设备指纹,提高设备指纹码的安全性及准确性。
-
公开(公告)号:CN107563884A
公开(公告)日:2018-01-09
申请号:CN201710633146.3
申请日:2017-07-28
Applicant: 浙江邦盛科技有限公司
Abstract: 本发明公开了一种降低资产损失率的方法。该方法能根据疑似欺诈交易金额的不同,智能调整欺诈检测的阈值。当疑似欺诈交易金额比较大的时候,更加谨慎地判断该笔交易存在欺诈的可能,而对于疑似欺诈金额比较小的交易,智能调节阈值,合理降低报警率,节省人工核对成本。这样,可以让企业将因欺诈而产生的资产损失降到最低,而不是仅仅提升识别欺诈的覆盖率。本发明不依赖特定的风险控制系统,故该方法具有很好的移植性,简明易懂,容易实现。
-
公开(公告)号:CN104636318B
公开(公告)日:2017-07-14
申请号:CN201510083970.7
申请日:2015-02-15
Applicant: 浙江邦盛科技有限公司
Abstract: 本发明公开了一种大数据方差标准差的分布式或增量计算方法,将大集合的方差计算拆分为计算子集的方差、和、计数以及平均值,并通过子集计算得出的上述变量合并计算出大集合的最终方差及标准差;本发明能够处理超大数据集合(无法存储与内存中)的方差及标准差;针对超大数据集合,可以通过该方法将大集合拆分为若干子集,并发布到不同的机器上计算子集的上述变量,最后由其中一个机器完成所有子集的合并计算功能,从而能够达到分布式计算的目的,缩短超大数据集合的方差标准差计算时间;本发明更适用于海量的数据系统,在海量数据系统中,很多传统的方法无法完成大数据的方差标准差计算。
-
公开(公告)号:CN110008544B
公开(公告)日:2020-07-03
申请号:CN201910219684.7
申请日:2019-03-21
Applicant: 浙江邦盛科技有限公司
IPC: G06F16/2455 , G06F16/245
Abstract: 本发明公开了一种查询时序数据递增次数与递减次数的处理方法,本发明预先对数据序列分组,然后计算每个分组的累计递增与递减次数、首元素、尾元素,把中间结果存储在相应时间戳上,查询时根据指定的时间戳快速得到计算结果;首先,中间结果的存储位置灵活多变,满足各种场景的需求;由于存储结果是计算后的中间结果,内存耗费降低,存储效率很高,因为已经提前计算好了中间结果,所以在获取对应的递增次数与递减次数时响应速度极快;最为重要的是,这部分结果跟着系统时间移动而不断变化,能够达到所需的递增次数与递减次数随时间窗口平滑移动的目的。本发明适用于时序数据处理技术等数据分析领域,能够显著提升统计递增次数与递减次数的速度。
-
公开(公告)号:CN111090619A
公开(公告)日:2020-05-01
申请号:CN201911200527.8
申请日:2019-11-29
Applicant: 浙江邦盛科技有限公司 , 中车唐山机车车辆有限公司
IPC: G06F16/13 , G06F16/14 , G06F16/172 , G06F16/182
Abstract: 本发明公开了一种轨道交通网络监测流数据的实时处理方法,其特征在于,该方法包括以下步骤:首先采集监测数据,汇总到第三方综合运维云平台;然后在第三方运维云平台上建立Hadoop分布式文件系统HDFS,基于HDFS建立Hbase数据库,使用基于哈希的MapReduce方法进行数据的处理,并在Map和Reduce两个阶段之间增加流水线控制器,进而提高对流数据的实时处理性能,以降低Map和Reduce阶段间数据传输的时延;最后设计基于动态容增哈希技术的快速内存处理方法提高Reduce阶段的数据处理的实时性。本发明避免了Map阶段的分段、排序,消除了同步带来的阻塞,提高了流数据的实时处理能力。
-
公开(公告)号:CN109978170B
公开(公告)日:2020-04-28
申请号:CN201910164816.0
申请日:2019-03-05
Applicant: 浙江邦盛科技有限公司
IPC: G06N7/00
Abstract: 本发明公开了一种基于多要素的移动设备识别方法,包括:创建移动设备要素模型,移动设备要素模型保存设备要素名称、设备要素值及设备要素置信度;对高于置信度阈值的要素称为决策要素;对待识别的设备创建移动设备要素模型,并选取决策要素;在已识别的设备中,查找与决策要素名称相同且设备要素值相同的所有设备要素,之后将属于同一个移动设备的设备要素作为一组,多组数据构成临时集合,根据公式计算最终偏置信度,若最终置信度大于等于设定的最终置信度阈值,则认为待识别的移动设备与最终置信度对应的移动设备为相同设备;否则认为是新设备。本发明可以关联多个要素同时进行分析,准确辨别设备。
-
公开(公告)号:CN110971687A
公开(公告)日:2020-04-07
申请号:CN201911201991.9
申请日:2019-11-29
Applicant: 浙江邦盛科技有限公司 , 中车唐山机车车辆有限公司
Abstract: 本发明公开了一种轨道交通流数据处理方法,该方法基于Kafka的消息分发并且设计Storm拓扑结构,通过Kafka汇总轨道交通客流及设备等监测数据形成数据源,并将数据源发送给Storm进行实时处理;Storm拓扑结构由数据源组件KafkaSpout和三个逻辑处理单元PreBolt、RunBolt以及PostBolt组成;通过ZooKeeper提供的Watcher接口则用于对Storm进行监听,通过监听来了解轨道交通信息等变化,然后控制Kafka集群做出相应的指令处理;本发明数据在程序的传递过程均采用随机分组的方式,分布式处理的过程使得数据处理的延时大大降低。
-
公开(公告)号:CN110222338A
公开(公告)日:2019-09-10
申请号:CN201910448361.5
申请日:2019-05-28
Applicant: 浙江邦盛科技有限公司
Abstract: 本发明公开了一种机构名实体识别方法,该方法首先通过无监督方法构建领域词词库的领域字符字向量,再在领域字向量中引入通用标记语料的上下文知识获得最终使用的字向量矩阵。使用最终使用的字向量矩阵训练分词模型来划分领域待识别语料。接着,分析通用标记语料的N-Gram特征获得拓扑关系矩阵。通过拓扑关系矩阵来构建语料的拓扑关系并训练用于机构名实体识别的GCN模型。最终实现对于特定领域的机构名实体识别。本发明方法解决了在特定领域的机构名识别场景下,领域标记语料不足、识别准确率低以及对于领域专有名词识别能力较弱的问题。
-
公开(公告)号:CN109947896A
公开(公告)日:2019-06-28
申请号:CN201910181493.6
申请日:2019-03-11
Applicant: 浙江邦盛科技有限公司
IPC: G06F16/31
Abstract: 本发明公开了一种轨道交通非结构化流数据实时存储方法,将轨道交通非结构化流数据采集到轨道交通大数据处理平台,平台基于Hadoop及其组件Hbase分布式数据库;对采集的多源非结构化流数据构建高效检索方案;将采集的多源非结构化流数据接入到数据缓冲区;队列的缓冲数据量达到阈值后调用HBase多线程写入方法或flushCommits()方法将数据写入HBase。本发明提出基于HBase的轨道交通非结构化流数据存储方案,能满足非结构化数据存储需求、轨道交通流数据的存储速度需求、存储容量需求。本发明提出轨道交通非结构化流数据的高效检索方案,以此设计HBase数据库RowKey可以加快数据检索效率。本发明提出多源非结构流数据多源缓冲区,并提出对应的优化HBase索引的方案,提高流数据写入效率。
-
-
-
-
-
-
-
-
-