-
公开(公告)号:CN110837608B
公开(公告)日:2024-04-12
申请号:CN201911080716.6
申请日:2019-11-07
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F16/9538 , G06F16/951
Abstract: 本发明提供了一种基于多源数据的舆情话题传播路径分析系统,包括:多源数据采集模块,用于对舆情话题进行多源数据采集,获取至少一项来源信息;传播路径分析模块,用于根据来源信息的类型采用不同的单源传播路径建立方案,得到单源传播路径,多个单源传播路径相互关联,得到交叉传播路径;传播主路径分析模块,用于分析各个节点的转发关系和转发量,得到舆情话题的关键传播节点,保留根节点与关键传播节点、关键传播节点之间的传播路径,删掉无关路径,得到传播主路径;路径显示模块,用于显示路径信息。本发明还提供了一种基于多源数据的舆情话题传播路径分析方法,帮助用户更加直观的了解舆情话题的传播情况。
-
公开(公告)号:CN113760906B
公开(公告)日:2023-04-14
申请号:CN202110509578.X
申请日:2021-05-11
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明公开了一种索引管理的方法,包括索引管理器,索引管理器包括服务端和客户端,本发明能够在数据入elasticsearch库时,其索引族由数据发布时间确定而不是数据入库时间确定,且业务检索时不再检索全部索引,而是根据检索的发布时间区间,确定待检索的部分索引族,能够降低业务检索中的消耗,提高检索性能,在海量数据中能够有快速且有针对性的获取目标信息的位置。
-
公开(公告)号:CN113761910A
公开(公告)日:2021-12-07
申请号:CN202110283681.7
申请日:2021-03-17
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F40/289 , G06F40/211 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种融合情感特征的评论文本细粒度情感分析方法,包括以下步骤S1、已有评论数据语料预处理;S2、联合向量构建;S3、ADBC细粒度情感模型训练。有益效果:本发明通过融合情感标签,情感词、方面词来表示文本向量,设计一种针对评论文本的增强语义的高鲁棒性细粒度情感分析框架,更多的挖掘文本中潜在的情感信息,同时在注意力机制之前嵌入CNN卷积神经网络对Bi‑GRU的输出层进行特征的强化学习,从而提高了细粒度情感分析的准确性。能够反映出用户真实的评价信息,使用户对产品的各方面好坏有更加直接的了解。为消费者及供应商们提供高效可靠的反馈结果。
-
公开(公告)号:CN113761839A
公开(公告)日:2021-12-07
申请号:CN202110484482.2
申请日:2021-04-30
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F40/14 , G06F40/151 , G06F40/174 , G06F16/835
Abstract: 本发明公开了一种多层分组的多维统计分析方法,包括下列步骤:S1、根据表格ID参数确定待统计的表格;S2、获取上述表格中用于分组和统计的表格数据;S3、根据转换器参数Transform,对表格数据进行转换,作为步骤S4的输入;S4、构造一个树节点,作为分组和统计的根节点;S5、从根节点出发,对当前节点数据按照指定的分组器参数的字段,对数据进行分组;S6、对每个分组构造一个树节点,作为当前节点的子节点,添加到树中;S7、通过上述节点的数据,得到基于多层分组的树结构表示的表格数据。有益效果:本发明是对表格数据进行多维度统计,实现灵活可扩展的统计分析功能,可用于多种统计分析应用中。
-
公开(公告)号:CN111402054A
公开(公告)日:2020-07-10
申请号:CN202010184049.2
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Inventor: 蒋燕萍 , 吴震 , 贺敏 , 王飞 , 张林波 , 吴莉莉 , 杨菁林 , 邢凯 , 王锟 , 徐小磊 , 董皓 , 王凡凡 , 郭艳军 , 王倩倩 , 杜漫 , 刘昕明 , 余智华
IPC: G06Q40/04
Abstract: 本发明涉及金融平台风险分析领域,具体涉及一种股权融资平台风险判定方法及系统,包括设制判定股权融资平台的风险指标体系,风险项和与风险项对应的风险判断标准;对需要进行风险判定的股权融资平台进行分析,得出与风险项相应的第一指标,判定第一指标是否命中所述风险判断标准,并根据所述判定对第一指标设置风险标记;设定风险模型公式,根据风险模型公式对风险标记行计算,得出标记结果;根据风险指标体系制定风险等级模型,将标记结果与所述风险等级模型进行对比,输出实际风险等级;所述风险项风险判断标准、风险标记构成的风险指标体系很好的解决了现有股权融资平台风险判定不可靠、不完备的问题,达到了全面、有针对性的技术效果。
-
公开(公告)号:CN111383115A
公开(公告)日:2020-07-07
申请号:CN202010184052.4
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种交易场所异常行为监测分析方法,包括以下步骤:采集交易场所平台的数据;设定风险指标体系;判定风险项及计算权重;根据风险模型公式计算风险分值,划分平台风险等级。本发明另一方面提供了一种交易场所异常行为监测分析系统。结合对交易场所业务交易监测、工商司法经营监测、互联网舆情监测、用户规模监测和网络媒介合规监测实现多维度综合分析判定,通过风险项判定以及风险模型公式设定计算,最终实现交易场所的风险指标体系设定,高效的监测交易场所违规行为。
-
公开(公告)号:CN110852090A
公开(公告)日:2020-02-28
申请号:CN201911080694.3
申请日:2019-11-07
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , H04L12/24
Abstract: 本发明提供了一种用于舆情爬取的机构特征词汇扩展系统,包括:数据采集模块:用于采集数据;特征词清洗加工模块:用于对特征词进行初步筛选;特征词统计分析模块:用于通过相关度分析,进一步筛选特征词,最终生成拓展特征词。本发明另一方面提供了一种用于舆情爬取的机构特征词汇扩展方法,采用上述方案,筛选掉无用特征词并进行分析,生成拓展特征词,全面、快速采集相关舆情信息,一方面有效的避免了漏查情况的发生,另一方面也减少了无用特征词增加无用的数据,提高检索效率和质量,减少内存的占用。
-
公开(公告)号:CN113760448A
公开(公告)日:2021-12-07
申请号:CN202110484469.7
申请日:2021-04-30
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明公开了一种基于kubernetes的大数据管理平台,包括大数据组件软件管理、大数据组件安装和启动、大数据组件暂停、大数据组件恢复和大数据组件删除、大数据组件配置同步、大数据组件日志收集和大数据组件监控。有益效果:解决传统开源大数据管理平台(hdp、cdh)无法多实例部署大数据组件的问题。本发明拟基于kubernetes管理平台的特性,实现一个大数据平台管理工具,能够对大数据组件进行有效管理,管理功能包括大数据组件管理,大数据组件安装、启动、暂停、恢复和删除,大数据组件配置修改与同步,大数据组件日志搜集,大数据组件监控。
-
公开(公告)号:CN112131863A
公开(公告)日:2020-12-25
申请号:CN202010772735.1
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F40/216 , G06F40/242 , G06F16/35 , G06F40/35
Abstract: 本发明提供了一种评论观点主题抽取方法,包括:采集社交软件中评论,获得评论文本;对所述评论文本进行预处理,将评论文本转换为词向量,形成文本向量;构建观点句分类模型,判断所述评论文本中的句子是否为观点句;聚类所述观点句形成观点主题簇,分别抽取所述观点主题簇中的关键词作为候选观点关键词;在所述候选观点关键词中抽选关键词,并根据词性选择核心词;将与所述核心词匹配的观点句生成主题,形成主题候选集;从每个类别的所述主题候选集中选择一个主题作为最终观点主题。本发明还提供了电子设备和存储介质。从评论文本自动抽取观点主题,以便准确接收网民意见,并判断是否对社会造成舆论,能够直观地了解到社交软件的相关热点话题。
-
公开(公告)号:CN111353300B
公开(公告)日:2023-09-01
申请号:CN202010093817.3
申请日:2020-02-14
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , G06F40/289 , G06F18/214 , G06F18/241
Abstract: 本发明提供了一种数据集构建方法及装置,包括步骤:数据采集,获取来自互联网数据源的第一数据,所述第一数据包括自然语言,所述第一数据经过预处理后,生成第二数据;数据特征分析,所述第二数据包括子数据,所述子数据包括第一特征数据,分析所述第一特征数据,得出所述第一特征数据的特征度;数据标签建立,根据所述第一特征数据的特征度确定所述子数据标签;数据分类存储,根据所述子数据标签将所述子数据分类保存,保存为数据集。实时采集互联网中的数据;根据特征数据和特征度提取对应的标签;通过所述子数据标签将所述子数据进行分类提高提取速度,提高工作效率。本发明提供了一种相关信息获取方法及装置,提高准确性,提高工作效率。
-
-
-
-
-
-
-
-
-