-
公开(公告)号:CN111475564A
公开(公告)日:2020-07-31
申请号:CN202010287209.6
申请日:2020-04-13
Applicant: 恒安嘉新(北京)科技股份公司
Abstract: 本发明实施例公开了一种流式数据处理方法、系统、计算机设备及存储介质,方法包括:对待建立流数据任务的关联任务节点进行可视化配置,得到可视化流数据任务;其中,所述关联任务节点包括数据输入节点和数据输出节点;从所述数据输入节点获取源数据,并对所述源数据进行处理,得到输出数据;将所述输出数据输出至数据输出节点,以使所述数据输出节点输出目标数据;其中,所述源数据为流式数据。本发明实施例的技术方案能够实现流式数据处理流程的可视化管理,并降低流式数据处理的学习成本。
-
公开(公告)号:CN112818183B
公开(公告)日:2024-05-17
申请号:CN202110152682.8
申请日:2021-02-03
Applicant: 恒安嘉新(北京)科技股份公司
IPC: G06F16/901
Abstract: 本发明公开了一种数据合成方法、装置、计算机设备和存储介质。该方法包括:实时获取多个数据源接入的待合成数据,并获取各待合成数据对应的数据生成时间;根据各待合成数据对应的数据生成时间,确定目标时间窗口对应的目标待合成数据,并确定与所述目标时间窗口匹配的缓存时间区间对应的缓存数据;对目标待合成数据和/或缓存数据进行数据合成,获得至少一个合成数据存储到数据库中。使用本发明的技术方案,可以实现对不同数据源和不同到达时间的数据进行实时合成处理。
-
公开(公告)号:CN112818183A
公开(公告)日:2021-05-18
申请号:CN202110152682.8
申请日:2021-02-03
Applicant: 恒安嘉新(北京)科技股份公司
IPC: G06F16/901
Abstract: 本发明公开了一种数据合成方法、装置、计算机设备和存储介质。该方法包括:实时获取多个数据源接入的待合成数据,并获取各待合成数据对应的数据生成时间;根据各待合成数据对应的数据生成时间,确定目标时间窗口对应的目标待合成数据,并确定与所述目标时间窗口匹配的缓存时间区间对应的缓存数据;对目标待合成数据和/或缓存数据进行数据合成,获得至少一个合成数据存储到数据库中。使用本发明的技术方案,可以实现对不同数据源和不同到达时间的数据进行实时合成处理。
-
公开(公告)号:CN112492606B
公开(公告)日:2024-05-17
申请号:CN202011247127.5
申请日:2020-11-10
Applicant: 恒安嘉新(北京)科技股份公司
IPC: H04W12/088 , H04W12/128 , G06F16/35 , H04W4/14
Abstract: 本发明公开了一种垃圾短信的分类识别方法、装置、计算机设备及存储介质。该方法包括:对短信文本集合进行文本过滤,获得垃圾短信文本集合;将垃圾短信文本集合依次输入至一级分类模型和二级分类模型,获得多个类别垃圾短信文本集合;将各类别垃圾短信文本集合输入至实体信息提取模型,获得识别或者还原实体信息之后的各类别垃圾短信文本集合。使用本发明的技术方案,可以实现对海量短信的精确分类识别,并准确提取垃圾短信中的实体信息。
-
公开(公告)号:CN112492606A
公开(公告)日:2021-03-12
申请号:CN202011247127.5
申请日:2020-11-10
Applicant: 恒安嘉新(北京)科技股份公司
IPC: H04W12/088 , H04W12/128 , G06F16/35 , H04W4/14
Abstract: 本发明公开了一种垃圾短信的分类识别方法、装置、计算机设备及存储介质。该方法包括:对短信文本集合进行文本过滤,获得垃圾短信文本集合;将垃圾短信文本集合依次输入至一级分类模型和二级分类模型,获得多个类别垃圾短信文本集合;将各类别垃圾短信文本集合输入至实体信息提取模型,获得识别或者还原实体信息之后的各类别垃圾短信文本集合。使用本发明的技术方案,可以实现对海量短信的精确分类识别,并准确提取垃圾短信中的实体信息。
-
-
-
-