一种网页风险发现的方法
    31.
    发明公开

    公开(公告)号:CN113761318A

    公开(公告)日:2021-12-07

    申请号:CN202110484421.6

    申请日:2021-04-30

    Abstract: 本发明公开了一种网页风险发现的方法,包括下列步骤:S1、数据采集阶段,使用高效蔓延的基本原理,获取到网站大量的网页;S2、数据流转阶段,使用Confluent接入Kafka中数据,调用风险识别服务后,将数据存储至Elasticsearch中,完成整个数据流转;S3、风险识别阶段,针对采集到的数据进行分词,与风险规则库中数据进校对,将符合风险规则数据保存;S4、数据存储阶段,针对采集的原始数据进行处理,然后对处理后的数据,根据数据类型、规模、用途按需存储;S5、风险发现整体流程完成。有益效果:在海量网页数据中能够快速的定位风险网站。

    一种基于SQL实现全文检索图数据库的查询方法及查询系统

    公开(公告)号:CN113761290A

    公开(公告)日:2021-12-07

    申请号:CN202110260410.X

    申请日:2021-03-10

    Abstract: 本发明公开了一种基于SQL实现全文检索图数据库的查询方法及查询系统,包括以下步骤:S1、建立sql查询系统和图查询系统的映射关系;S2、建立sql查询系统的查询用户和图查询系统的用户映射关系;S3、建立sql查询系统中表和图查询系统中的节点、边等对象的对应关系;S4、将查询中涉及到图节点关系的查询下发图数据库执行,针对图数据库查询返回的记录通过SQL全文检索,向用户返回满足条件的记录。本发明的有益效果为:可以将图数据库,关系数据库存储的数据一起关联查询,减轻用户开发系统的负担。

    一种索引管理的方法
    33.
    发明公开

    公开(公告)号:CN113760906A

    公开(公告)日:2021-12-07

    申请号:CN202110509578.X

    申请日:2021-05-11

    Abstract: 本发明公开了一种索引管理的方法,包括索引管理器,索引管理器包括服务端和客户端,本发明能够在数据入elasticsearch库时,其索引族由数据发布时间确定而不是数据入库时间确定,且业务检索时不再检索全部索引,而是根据检索的发布时间区间,确定待检索的部分索引族,能够降低业务检索中的消耗,提高检索性能,在海量数据中能够有快速且有针对性的获取目标信息的位置。

    一种基于标准SQL的流式数据清洗转换方法和系统

    公开(公告)号:CN113760877A

    公开(公告)日:2021-12-07

    申请号:CN202110337239.8

    申请日:2021-03-10

    Abstract: 本发明公开了一种基于标准SQL的流式数据清洗转换方法和系统,根据本发明的一方面包括以下步骤:S1、系统初始化,针对系统库、工作线程、Groovy函数线程、SQL解析引擎进行初始化操作;S2、在上述初始化完成以后,系统开始进行数据清洗转换的工作。根据本发明的另一方面还包括系统初始化模块、内置算子库、SQL解析引擎、提交SQL模块、提交Groovy模块、Groovy类初始化模块、Groovy执行模块、数据重组模块、数据输入和输出模块。本发明的有益效果为:更加高效、便捷、灵活地对流式数据清洗、转换,筛选符合条件的数据,让数据对用户更加有价值。

    一种可移植性的模型发布方法、装置和存储介质

    公开(公告)号:CN112130895A

    公开(公告)日:2020-12-25

    申请号:CN202010772714.X

    申请日:2020-08-04

    Abstract: 本发明提供了一种可移植性的模型发布方法、装置和存储介质,算子阶段获取,接收算子训练模型,所述算子训练模型中包括多个算子单元,将所述算子训练模型中的多个算子单元进行划分,对每个算子单元独立封装为一个算子阶段;算子单元逻辑关系获取,提取算子单元间的逻辑关系;算子发布模型建立,获取多个算子阶段及算子阶段对应算子单元间的逻辑关系,建立算子发布模型;模型文件转化,将所述算子发布模型转化为Json格式的模型文件。本发明的方法能够直接完成全流程的发布,全流程的所述模型文件在被转化后,只需要将数据输入模型文件,即可得出全流程处理后的数据结果,全流程的操作都不需要使用多种不同的运行环境,提高运行便捷度。

    一种基于数据流混合编排的分析模型构建方法及系统

    公开(公告)号:CN112130812A

    公开(公告)日:2020-12-25

    申请号:CN202010772705.0

    申请日:2020-08-04

    Abstract: 本发明提供了一种基于数据流混合编排的分析模型构建方法,所述基于数据流混合编排的分析模型构建方法包括以下步骤:拆分处理子任务,接收分析任务的数据流转,并将分析任务按照分析流程拆分为处理子任务;修饰处理子任务,为处理子任务定义:数据输入、数据输出及处理逻辑;封装分析任务,将分析任务封装为编码结构的数据流图;转换语言格式,将数据流图转换为标记语言格式的任务流图;调度执行,将任务流图解析,并进行分发调度执行;生成分析结果,返回调度执行的执行结果,得到分析结果。本发明还提供了一种基于数据流混合编排的分析模型构建系统。本发明能够解决了数据分析建模过程中建模方式单一、建模流程复杂、缺少混合运算支持的问题。

    一种基于弱监督的领域文本标注方法

    公开(公告)号:CN113761911A

    公开(公告)日:2021-12-07

    申请号:CN202110283769.9

    申请日:2021-03-17

    Abstract: 本发明公开了一种基于弱监督的领域文本标注方法,包括以下步骤:S1产品语料预处理过程;S2WCE‑S‑LDA模型训练;S3标注数据。有益效果:本技术提出了字词联合向量改进seeded‑lda方法实现对语料的自动标注。本发明公布了一种针对中文评论文本自动标注框架。设计一种自适应的考虑文本向量改进seeded‑lda模型的文本自动标注方法。通过本方法可以提高文本训练语料的标注速度以及规模。进而为训练模型提供更多的训练资源。本发明的目的在于提供一种面向规模语料评论的自动标注方法与框架,快速生成分类训练样本,降低人工参与,提高工作效率。同时保证一定的标注准确率,为快速分析大规模语料提供有力帮助。

    一种基于容器云的软件授权认证方法

    公开(公告)号:CN113761481A

    公开(公告)日:2021-12-07

    申请号:CN202110481566.0

    申请日:2021-04-30

    Abstract: 本发明公开了一种基于容器云的软件授权认证方法,包括以下步骤:S1、将软件的授权规则信息保存在一个结构体中,将其序列化为一个二进制文件;S2、使用密钥将步骤S1中生成的二进制文件加密为license文件;S3、将license文件以配置映射的方式加载到容器云平台S4、将license证书文件与相关的网卡mac地址进行匹配。有益效果:在容器云集群环境,通过configmap加载license,通过operator收集服务器信息、分发license,减少逐台获取物理服务器mac地址、分发license的操作,从而提高效率。

    一种多通道热点发现的方法及多通道热点发现系统

    公开(公告)号:CN113761358A

    公开(公告)日:2021-12-07

    申请号:CN202110509465.X

    申请日:2021-05-11

    Abstract: 本发明公开了一种多通道热点发现的方法及多通道热点发现系统,包括以下步骤:S1、筛选阶段,通过一个平台拉取数据流,对其进行过滤,筛选出热点,并且将热点聚合到搜索引擎上,如果没有热点,则进入到汇集阶段;S2、汇集阶段,对不同平台数据流进行处理,得到热点半成品结果集,再存入远程字典里面;S3、融入阶段,根据平台以往的历史去寻找热点;S4、对上述热点数据进行处理,并且做出相似度计算;S5、若是同一个实体则归为同一实体名称,如果不是,则将新的实体名称加进远程字典里面并将结果聚合到搜索引擎中;S6、聚类结束,等待下一个热点索引。提高了信息采集效率和检索性能。使其在海量数据中能够快速的获取热点信息。

    一种结构化数据的知识抽取方法

    公开(公告)号:CN113761121A

    公开(公告)日:2021-12-07

    申请号:CN202110484431.X

    申请日:2021-04-30

    Abstract: 本发明公开了一种结构化数据的知识抽取方法,包括下列步骤:S1、构件抽取组件;S2、按照每条抽取规则指定的表格,构造一种字典数据结构,其中键为表格ID,值为对应表格的一组抽取组件;S3、遍历步骤S2中构造的字典,对于每个键值对,基于键构造数据库连接,获取表格数据,然后将这些数据逐条发送给当前键对应的抽取组件;S4、抽取组件对接收的数据进行处理,依次进行全局唯一ID、业务标识ID、类型、属性信息抽取;S5、对于节点抽取组件和关系抽取组件进行进一步抽取。有益效果:可用于构建知识图谱,有良好的扩展性和自适应能力,能够满足多源异构数据的知识抽取需要。

Patent Agency Ranking