-
公开(公告)号:CN112130895B
公开(公告)日:2022-04-15
申请号:CN202010772714.X
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/76
Abstract: 本发明提供了一种可移植性的模型发布方法、装置和存储介质,算子阶段获取,接收算子训练模型,所述算子训练模型中包括多个算子单元,将所述算子训练模型中的多个算子单元进行划分,对每个算子单元独立封装为一个算子阶段;算子单元逻辑关系获取,提取算子单元间的逻辑关系;算子发布模型建立,获取多个算子阶段及算子阶段对应算子单元间的逻辑关系,建立算子发布模型;模型文件转化,将所述算子发布模型转化为Json格式的模型文件。本发明的方法能够直接完成全流程的发布,全流程的所述模型文件在被转化后,只需要将数据输入模型文件,即可得出全流程处理后的数据结果,全流程的操作都不需要使用多种不同的运行环境,提高运行便捷度。
-
公开(公告)号:CN112130851B
公开(公告)日:2022-04-15
申请号:CN202010772703.1
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明提供了一种用于人工智能的建模方法,包括以下步骤:模型初始化:接收新建模块组件指令或编辑模块组件指令,生成菜单组件和视图组件;算子组件构建:接收选择算子标识的指令;接收复制指令;接收生成位置指令;在所述位置建立算子组件,所述算子组件抽取算子标识携带的信息;连线构建:判断连线输出节点,判断连线输入节点,在连线输出节点和连线输入节点之间构建有向连线;运行验证:接收运行指令,将数据沿有向连线在算子组件之间进行传递,将正在执行的算子组件进行突出显示,在算子组件上显示运行结果。本发明还提供了一种电子设备、存储介质,将创建模型的过程可视化,便于查看模型的结构、数据流向、执行、运行结果。
-
公开(公告)号:CN113761885A
公开(公告)日:2021-12-07
申请号:CN202110283749.1
申请日:2021-03-17
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F40/263 , G06F40/289 , G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于BayesLSTM的语种识别方法,包括以下步骤:S1、构建词向量模型;S2、词向量作为输入,输入到LSTM中;S3、通过概率密度分布来对权重进行采样,优化分布参数;S4、通过Softmax分类器对经过贝叶斯优化的特征向量进行预测分类;S5、根据步骤S4的预测分类概率,最终得到文本的分类类别标签。有益效果:本发明的方法通过估计模型参数的不确定性来提高模型的鲁棒性和语种识别的准确率。
-
公开(公告)号:CN113761318A
公开(公告)日:2021-12-07
申请号:CN202110484421.6
申请日:2021-04-30
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/953 , G06F16/33 , G06F40/216 , G06F40/289
Abstract: 本发明公开了一种网页风险发现的方法,包括下列步骤:S1、数据采集阶段,使用高效蔓延的基本原理,获取到网站大量的网页;S2、数据流转阶段,使用Confluent接入Kafka中数据,调用风险识别服务后,将数据存储至Elasticsearch中,完成整个数据流转;S3、风险识别阶段,针对采集到的数据进行分词,与风险规则库中数据进校对,将符合风险规则数据保存;S4、数据存储阶段,针对采集的原始数据进行处理,然后对处理后的数据,根据数据类型、规模、用途按需存储;S5、风险发现整体流程完成。有益效果:在海量网页数据中能够快速的定位风险网站。
-
公开(公告)号:CN113761290A
公开(公告)日:2021-12-07
申请号:CN202110260410.X
申请日:2021-03-10
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/901 , G06F16/903
Abstract: 本发明公开了一种基于SQL实现全文检索图数据库的查询方法及查询系统,包括以下步骤:S1、建立sql查询系统和图查询系统的映射关系;S2、建立sql查询系统的查询用户和图查询系统的用户映射关系;S3、建立sql查询系统中表和图查询系统中的节点、边等对象的对应关系;S4、将查询中涉及到图节点关系的查询下发图数据库执行,针对图数据库查询返回的记录通过SQL全文检索,向用户返回满足条件的记录。本发明的有益效果为:可以将图数据库,关系数据库存储的数据一起关联查询,减轻用户开发系统的负担。
-
公开(公告)号:CN113760906A
公开(公告)日:2021-12-07
申请号:CN202110509578.X
申请日:2021-05-11
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明公开了一种索引管理的方法,包括索引管理器,索引管理器包括服务端和客户端,本发明能够在数据入elasticsearch库时,其索引族由数据发布时间确定而不是数据入库时间确定,且业务检索时不再检索全部索引,而是根据检索的发布时间区间,确定待检索的部分索引族,能够降低业务检索中的消耗,提高检索性能,在海量数据中能够有快速且有针对性的获取目标信息的位置。
-
公开(公告)号:CN113760877A
公开(公告)日:2021-12-07
申请号:CN202110337239.8
申请日:2021-03-10
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/215 , G06F16/242 , G06F16/2455
Abstract: 本发明公开了一种基于标准SQL的流式数据清洗转换方法和系统,根据本发明的一方面包括以下步骤:S1、系统初始化,针对系统库、工作线程、Groovy函数线程、SQL解析引擎进行初始化操作;S2、在上述初始化完成以后,系统开始进行数据清洗转换的工作。根据本发明的另一方面还包括系统初始化模块、内置算子库、SQL解析引擎、提交SQL模块、提交Groovy模块、Groovy类初始化模块、Groovy执行模块、数据重组模块、数据输入和输出模块。本发明的有益效果为:更加高效、便捷、灵活地对流式数据清洗、转换,筛选符合条件的数据,让数据对用户更加有价值。
-
公开(公告)号:CN112130895A
公开(公告)日:2020-12-25
申请号:CN202010772714.X
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/76
Abstract: 本发明提供了一种可移植性的模型发布方法、装置和存储介质,算子阶段获取,接收算子训练模型,所述算子训练模型中包括多个算子单元,将所述算子训练模型中的多个算子单元进行划分,对每个算子单元独立封装为一个算子阶段;算子单元逻辑关系获取,提取算子单元间的逻辑关系;算子发布模型建立,获取多个算子阶段及算子阶段对应算子单元间的逻辑关系,建立算子发布模型;模型文件转化,将所述算子发布模型转化为Json格式的模型文件。本发明的方法能够直接完成全流程的发布,全流程的所述模型文件在被转化后,只需要将数据输入模型文件,即可得出全流程处理后的数据结果,全流程的操作都不需要使用多种不同的运行环境,提高运行便捷度。
-
公开(公告)号:CN112130812A
公开(公告)日:2020-12-25
申请号:CN202010772705.0
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/20
Abstract: 本发明提供了一种基于数据流混合编排的分析模型构建方法,所述基于数据流混合编排的分析模型构建方法包括以下步骤:拆分处理子任务,接收分析任务的数据流转,并将分析任务按照分析流程拆分为处理子任务;修饰处理子任务,为处理子任务定义:数据输入、数据输出及处理逻辑;封装分析任务,将分析任务封装为编码结构的数据流图;转换语言格式,将数据流图转换为标记语言格式的任务流图;调度执行,将任务流图解析,并进行分发调度执行;生成分析结果,返回调度执行的执行结果,得到分析结果。本发明还提供了一种基于数据流混合编排的分析模型构建系统。本发明能够解决了数据分析建模过程中建模方式单一、建模流程复杂、缺少混合运算支持的问题。
-
公开(公告)号:CN111382181A
公开(公告)日:2020-07-07
申请号:CN202010183474.X
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F16/2455 , G06Q40/06 , G06Q40/04 , G06Q10/06
Abstract: 本发明涉及数据处理的技术领域,具体涉及一种基于股权穿透的指定企业派系归属分析方法及系统,包括对每个待分析企业信息数据进行采集存储,得到原始信息数据,信息数据包括股东信息数据;根据原始信息数据对每个待分析企业向上发散计算股权链路占比,并确定所述每个待分析企业的全部股东,所述全部股东包括最终股东;通过检索出与所述最终股东相关的关联待分析企业,生成与最终股东相关的第一派系信息数据;对第一派系信息数据进行合并,生成最终派系信息数据;通过对股东信息进行采集存储以及分析,从而计算出每个待分析企业的向上发散计算股权链路占比。对待分析企业进行了基于最终股东的集合划分,为企业关联分析提供支撑。
-
-
-
-
-
-
-
-
-