-
公开(公告)号:CN119862279A
公开(公告)日:2025-04-22
申请号:CN202411953534.6
申请日:2024-12-27
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/35 , G06F40/284 , G06F18/22
Abstract: 本发明提供一种网络文本数据的热点获取方法和热点热度分析方法,包括依据热点规则过滤网络数据,提取与热点相关的若干数据元;数据元分词处理以获取特征词,依据特征词生成数据元向量;基于聚类策略确定数据元向量的内若干聚类中心,合并相似聚类中心以确定类中心,以类中心表示热点,所述所述数据元包括文本特征和非文本特征。本发明通过将数据元内多角度数据融合至一个数据元向量内,提高热点发现的准确性。
-
公开(公告)号:CN112130813A
公开(公告)日:2020-12-25
申请号:CN202010772721.X
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/20
Abstract: 本发明保护一种面向大数据分析的多用户协同建模方法、系统及设备,包括以下步骤:获取数据信息,根据所述数据信息构建当前任务分析流程,所述当前任务分析流程包括普通节点和超级节点,所述超级节点能够进行参数输入和输出;接收第一操作指令,确定协同用户,将所述当前任务分析流程对所述协同用户进行共享和分配;接收所述协同用户对所述任务分析流程的第二操作指令,生成最终任务分析流程;接收第三操作指令,运行最终任务分析流程。所述超级节点的设置解决了数据分析应用构建中各个环节相互依赖、无法并行处理的技术问题,产生了各类角色充分发挥各自最大优势、构建效率高的技术效果。
-
公开(公告)号:CN112130812B
公开(公告)日:2022-04-15
申请号:CN202010772705.0
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/20
Abstract: 本发明提供了一种基于数据流混合编排的分析模型构建方法,所述基于数据流混合编排的分析模型构建方法包括以下步骤:拆分处理子任务,接收分析任务的数据流转,并将分析任务按照分析流程拆分为处理子任务;修饰处理子任务,为处理子任务定义:数据输入、数据输出及处理逻辑;封装分析任务,将分析任务封装为编码结构的数据流图;转换语言格式,将数据流图转换为标记语言格式的任务流图;调度执行,将任务流图解析,并进行分发调度执行;生成分析结果,返回调度执行的执行结果,得到分析结果。本发明还提供了一种基于数据流混合编排的分析模型构建系统。本发明能够解决了数据分析建模过程中建模方式单一、建模流程复杂、缺少混合运算支持的问题。
-
公开(公告)号:CN112130933A
公开(公告)日:2020-12-25
申请号:CN202010773698.6
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明提供了一种算子集构建方法和装置,算子单元接收,所述算子单元为处理单元用于完成所对应的处理任务;算子接口参数获取,根据所述算子单元获取所述算子接口参数,所述算子接口参数包括开启参数和运行参数;算子模块构建,将获取了算子接口参数的算子单元构建为算子模块。所述算子单元的接口参数为统一的包括有开启参数和运行参数,统一所述算子接口参数的规格,降低开发人员多种语言和算法的衔接难度;对于业务人员,业务人员可以直接调用算子模块,降低工作难度。本发明还提供了一种算子集调用方法和装置,业务人员可以针对运行环境选择适用的算子模块,再将被选择的算子模块发送至运行节点运行,提高业务人员工作效率。
-
公开(公告)号:CN112130895B
公开(公告)日:2022-04-15
申请号:CN202010772714.X
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/76
Abstract: 本发明提供了一种可移植性的模型发布方法、装置和存储介质,算子阶段获取,接收算子训练模型,所述算子训练模型中包括多个算子单元,将所述算子训练模型中的多个算子单元进行划分,对每个算子单元独立封装为一个算子阶段;算子单元逻辑关系获取,提取算子单元间的逻辑关系;算子发布模型建立,获取多个算子阶段及算子阶段对应算子单元间的逻辑关系,建立算子发布模型;模型文件转化,将所述算子发布模型转化为Json格式的模型文件。本发明的方法能够直接完成全流程的发布,全流程的所述模型文件在被转化后,只需要将数据输入模型文件,即可得出全流程处理后的数据结果,全流程的操作都不需要使用多种不同的运行环境,提高运行便捷度。
-
公开(公告)号:CN112130895A
公开(公告)日:2020-12-25
申请号:CN202010772714.X
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/76
Abstract: 本发明提供了一种可移植性的模型发布方法、装置和存储介质,算子阶段获取,接收算子训练模型,所述算子训练模型中包括多个算子单元,将所述算子训练模型中的多个算子单元进行划分,对每个算子单元独立封装为一个算子阶段;算子单元逻辑关系获取,提取算子单元间的逻辑关系;算子发布模型建立,获取多个算子阶段及算子阶段对应算子单元间的逻辑关系,建立算子发布模型;模型文件转化,将所述算子发布模型转化为Json格式的模型文件。本发明的方法能够直接完成全流程的发布,全流程的所述模型文件在被转化后,只需要将数据输入模型文件,即可得出全流程处理后的数据结果,全流程的操作都不需要使用多种不同的运行环境,提高运行便捷度。
-
公开(公告)号:CN112130812A
公开(公告)日:2020-12-25
申请号:CN202010772705.0
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/20
Abstract: 本发明提供了一种基于数据流混合编排的分析模型构建方法,所述基于数据流混合编排的分析模型构建方法包括以下步骤:拆分处理子任务,接收分析任务的数据流转,并将分析任务按照分析流程拆分为处理子任务;修饰处理子任务,为处理子任务定义:数据输入、数据输出及处理逻辑;封装分析任务,将分析任务封装为编码结构的数据流图;转换语言格式,将数据流图转换为标记语言格式的任务流图;调度执行,将任务流图解析,并进行分发调度执行;生成分析结果,返回调度执行的执行结果,得到分析结果。本发明还提供了一种基于数据流混合编排的分析模型构建系统。本发明能够解决了数据分析建模过程中建模方式单一、建模流程复杂、缺少混合运算支持的问题。
-
-
-
-
-
-