-
公开(公告)号:CN111401448B
公开(公告)日:2024-05-24
申请号:CN202010183470.1
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284
Abstract: 本发明提供了一种交易平台分类方法和装置,包括步骤:数据采集,接收第一数据,根据第一数据获取第二数据,所述第二数据包括自然语言,对所述第二数据进行第一预处理,生成第三数据;数据处理,对所述第三数据进行分析,根据数据相关度,判定所述第三数据为第一类数据或第二类数据;分类模型建立,将所述第一类数据和第二类数据根据样本数和学习率建立分类模型;平台分类,接收平台数据和所述第三数据,将所述第三数据输入所述分类模型,判定所述第三数据为第一类数据或第二类数据;分析平台数据,判定与所述平台数据相关的第三数据。通过数据采集,数据处理,分类模型建立,平台分类,判断平台为场内或场外平台。
-
公开(公告)号:CN113761215A
公开(公告)日:2021-12-07
申请号:CN202110321491.X
申请日:2021-03-25
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Inventor: 赵忠华 , 李建广 , 余智华 , 王禄恒 , 陈欣洁 , 赵志云 , 冯凯 , 葛自发 , 杜漫 , 孙小宁 , 穆庆伟 , 万欣欣 , 申双成 , 李欣 , 孙立远 , 付培国 , 王晴 , 杜宛真
IPC: G06F16/36 , G06F16/35 , G06F40/242 , G06F40/295
Abstract: 本发明公开了一种基于反馈自学习的动态字典库生成方法,包括以下步骤:S1、字典库定义;S2、基于字典库分类体系;S4、基于语料库导出的标注数据,配合模型参数调整,逐步迭代优化模型;S5、将S4步生成的预测数据回填到字典库。有益效果:该方法通过概念模式定义、自然语言处理技术、全流程调度机制,实现从原始语料概念模式定义生成基础字典库,在基础字典库基础上进行标注模型的自动构建、迭代训练及修正,最后再利用标注模型来进行新的语料数据标注,反馈更新字典库,实现从标注训练到反馈自学习的闭环流程,达到模型自动逐步优化能力。最终实现字典库的自动完善,标注模型逐步优化的全自动循环过程。
-
公开(公告)号:CN111401450A
公开(公告)日:2020-07-10
申请号:CN202010184062.8
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06K9/62 , G06F40/284 , G06Q40/04
Abstract: 本发明提供了一种交易场所分类方法和装置,包括步骤:接收第一数据,根据第一数据获取第二数据,所述第二数据为文本数据,对所述第二数据进行标记处理,生成第三数据;对所述第三数据进行第二预处理,得出第四数据,将所述第四数据进行转换,得出第五数据,根据所述第五数据,生成第一模型;将所述第五数据划分为第一部分和第二部分,将所述第一部分导入第一库生成所述第一边界,将所述第二部分导入验证,得出第二模型;接收场所信息,将所述场所信息进行所述第二预处理得出所述第一信息,将所述第一信息导入所述第二模型,得出场所类别。通过分界线判断所述场所类别,在直观而且快捷的同时,提高所述场所类别的划分准确性。
-
公开(公告)号:CN111401448A
公开(公告)日:2020-07-10
申请号:CN202010183470.1
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06K9/62 , G06F40/284
Abstract: 本发明提供了一种交易平台分类方法和装置,包括步骤:数据采集,接收第一数据,根据第一数据获取第二数据,所述第二数据包括自然语言,对所述第二数据进行第一预处理,生成第三数据;数据处理,对所述第三数据进行分析,根据数据相关度,判定所述第三数据为第一类数据或第二类数据;分类模型建立,将所述第一类数据和第二类数据根据样本数和学习率建立分类模型;平台分类,接收平台数据和所述第三数据,将所述第三数据输入所述分类模型,判定所述第三数据为第一类数据或第二类数据;分析平台数据,判定与所述平台数据相关的第三数据。通过数据采集,数据处理,分类模型建立,平台分类,判断平台为场内或场外平台。
-
公开(公告)号:CN111369369A
公开(公告)日:2020-07-03
申请号:CN202010184061.3
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种微盘交易平台监控系统,包括:规则管理模块,用于设定、维护微盘交易平台违法违规判定规则、决策分析规则;数据处理模块,用于采集或导入微盘交易平台信息,并将信息标准化后存入数据库;违规分析处理模块:用于根据违法违规判定规则对微盘交易平台进行判定分析;决策分析模块:用于根据决策分析规则,对微盘平台进行综合分析和评级;预警通知模块:用于将判定有风险的微盘交易平台进行预警通知;本发明还提供了一种微盘交易平台监控方法,对微盘交易平台进行监管,及时发现违法违规的微盘交易平台,进行示警,用户根据示警信息能及时知悉违法违规的微盘交易平台,能根据示警信息及时对违法违规的微盘交易平台进行处理。
-
公开(公告)号:CN113760448A
公开(公告)日:2021-12-07
申请号:CN202110484469.7
申请日:2021-04-30
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明公开了一种基于kubernetes的大数据管理平台,包括大数据组件软件管理、大数据组件安装和启动、大数据组件暂停、大数据组件恢复和大数据组件删除、大数据组件配置同步、大数据组件日志收集和大数据组件监控。有益效果:解决传统开源大数据管理平台(hdp、cdh)无法多实例部署大数据组件的问题。本发明拟基于kubernetes管理平台的特性,实现一个大数据平台管理工具,能够对大数据组件进行有效管理,管理功能包括大数据组件管理,大数据组件安装、启动、暂停、恢复和删除,大数据组件配置修改与同步,大数据组件日志搜集,大数据组件监控。
-
公开(公告)号:CN112131863A
公开(公告)日:2020-12-25
申请号:CN202010772735.1
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F40/216 , G06F40/242 , G06F16/35 , G06F40/35
Abstract: 本发明提供了一种评论观点主题抽取方法,包括:采集社交软件中评论,获得评论文本;对所述评论文本进行预处理,将评论文本转换为词向量,形成文本向量;构建观点句分类模型,判断所述评论文本中的句子是否为观点句;聚类所述观点句形成观点主题簇,分别抽取所述观点主题簇中的关键词作为候选观点关键词;在所述候选观点关键词中抽选关键词,并根据词性选择核心词;将与所述核心词匹配的观点句生成主题,形成主题候选集;从每个类别的所述主题候选集中选择一个主题作为最终观点主题。本发明还提供了电子设备和存储介质。从评论文本自动抽取观点主题,以便准确接收网民意见,并判断是否对社会造成舆论,能够直观地了解到社交软件的相关热点话题。
-
公开(公告)号:CN113760906B
公开(公告)日:2023-04-14
申请号:CN202110509578.X
申请日:2021-05-11
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明公开了一种索引管理的方法,包括索引管理器,索引管理器包括服务端和客户端,本发明能够在数据入elasticsearch库时,其索引族由数据发布时间确定而不是数据入库时间确定,且业务检索时不再检索全部索引,而是根据检索的发布时间区间,确定待检索的部分索引族,能够降低业务检索中的消耗,提高检索性能,在海量数据中能够有快速且有针对性的获取目标信息的位置。
-
公开(公告)号:CN113761910A
公开(公告)日:2021-12-07
申请号:CN202110283681.7
申请日:2021-03-17
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F40/289 , G06F40/211 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种融合情感特征的评论文本细粒度情感分析方法,包括以下步骤S1、已有评论数据语料预处理;S2、联合向量构建;S3、ADBC细粒度情感模型训练。有益效果:本发明通过融合情感标签,情感词、方面词来表示文本向量,设计一种针对评论文本的增强语义的高鲁棒性细粒度情感分析框架,更多的挖掘文本中潜在的情感信息,同时在注意力机制之前嵌入CNN卷积神经网络对Bi‑GRU的输出层进行特征的强化学习,从而提高了细粒度情感分析的准确性。能够反映出用户真实的评价信息,使用户对产品的各方面好坏有更加直接的了解。为消费者及供应商们提供高效可靠的反馈结果。
-
公开(公告)号:CN113761839A
公开(公告)日:2021-12-07
申请号:CN202110484482.2
申请日:2021-04-30
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F40/14 , G06F40/151 , G06F40/174 , G06F16/835
Abstract: 本发明公开了一种多层分组的多维统计分析方法,包括下列步骤:S1、根据表格ID参数确定待统计的表格;S2、获取上述表格中用于分组和统计的表格数据;S3、根据转换器参数Transform,对表格数据进行转换,作为步骤S4的输入;S4、构造一个树节点,作为分组和统计的根节点;S5、从根节点出发,对当前节点数据按照指定的分组器参数的字段,对数据进行分组;S6、对每个分组构造一个树节点,作为当前节点的子节点,添加到树中;S7、通过上述节点的数据,得到基于多层分组的树结构表示的表格数据。有益效果:本发明是对表格数据进行多维度统计,实现灵活可扩展的统计分析功能,可用于多种统计分析应用中。
-
-
-
-
-
-
-
-
-