-
公开(公告)号:CN111401448B
公开(公告)日:2024-05-24
申请号:CN202010183470.1
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284
Abstract: 本发明提供了一种交易平台分类方法和装置,包括步骤:数据采集,接收第一数据,根据第一数据获取第二数据,所述第二数据包括自然语言,对所述第二数据进行第一预处理,生成第三数据;数据处理,对所述第三数据进行分析,根据数据相关度,判定所述第三数据为第一类数据或第二类数据;分类模型建立,将所述第一类数据和第二类数据根据样本数和学习率建立分类模型;平台分类,接收平台数据和所述第三数据,将所述第三数据输入所述分类模型,判定所述第三数据为第一类数据或第二类数据;分析平台数据,判定与所述平台数据相关的第三数据。通过数据采集,数据处理,分类模型建立,平台分类,判断平台为场内或场外平台。
-
公开(公告)号:CN113761215A
公开(公告)日:2021-12-07
申请号:CN202110321491.X
申请日:2021-03-25
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Inventor: 赵忠华 , 李建广 , 余智华 , 王禄恒 , 陈欣洁 , 赵志云 , 冯凯 , 葛自发 , 杜漫 , 孙小宁 , 穆庆伟 , 万欣欣 , 申双成 , 李欣 , 孙立远 , 付培国 , 王晴 , 杜宛真
IPC: G06F16/36 , G06F16/35 , G06F40/242 , G06F40/295
Abstract: 本发明公开了一种基于反馈自学习的动态字典库生成方法,包括以下步骤:S1、字典库定义;S2、基于字典库分类体系;S4、基于语料库导出的标注数据,配合模型参数调整,逐步迭代优化模型;S5、将S4步生成的预测数据回填到字典库。有益效果:该方法通过概念模式定义、自然语言处理技术、全流程调度机制,实现从原始语料概念模式定义生成基础字典库,在基础字典库基础上进行标注模型的自动构建、迭代训练及修正,最后再利用标注模型来进行新的语料数据标注,反馈更新字典库,实现从标注训练到反馈自学习的闭环流程,达到模型自动逐步优化能力。最终实现字典库的自动完善,标注模型逐步优化的全自动循环过程。
-
公开(公告)号:CN111401450A
公开(公告)日:2020-07-10
申请号:CN202010184062.8
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06K9/62 , G06F40/284 , G06Q40/04
Abstract: 本发明提供了一种交易场所分类方法和装置,包括步骤:接收第一数据,根据第一数据获取第二数据,所述第二数据为文本数据,对所述第二数据进行标记处理,生成第三数据;对所述第三数据进行第二预处理,得出第四数据,将所述第四数据进行转换,得出第五数据,根据所述第五数据,生成第一模型;将所述第五数据划分为第一部分和第二部分,将所述第一部分导入第一库生成所述第一边界,将所述第二部分导入验证,得出第二模型;接收场所信息,将所述场所信息进行所述第二预处理得出所述第一信息,将所述第一信息导入所述第二模型,得出场所类别。通过分界线判断所述场所类别,在直观而且快捷的同时,提高所述场所类别的划分准确性。
-
公开(公告)号:CN111401448A
公开(公告)日:2020-07-10
申请号:CN202010183470.1
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06K9/62 , G06F40/284
Abstract: 本发明提供了一种交易平台分类方法和装置,包括步骤:数据采集,接收第一数据,根据第一数据获取第二数据,所述第二数据包括自然语言,对所述第二数据进行第一预处理,生成第三数据;数据处理,对所述第三数据进行分析,根据数据相关度,判定所述第三数据为第一类数据或第二类数据;分类模型建立,将所述第一类数据和第二类数据根据样本数和学习率建立分类模型;平台分类,接收平台数据和所述第三数据,将所述第三数据输入所述分类模型,判定所述第三数据为第一类数据或第二类数据;分析平台数据,判定与所述平台数据相关的第三数据。通过数据采集,数据处理,分类模型建立,平台分类,判断平台为场内或场外平台。
-
公开(公告)号:CN111369369A
公开(公告)日:2020-07-03
申请号:CN202010184061.3
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种微盘交易平台监控系统,包括:规则管理模块,用于设定、维护微盘交易平台违法违规判定规则、决策分析规则;数据处理模块,用于采集或导入微盘交易平台信息,并将信息标准化后存入数据库;违规分析处理模块:用于根据违法违规判定规则对微盘交易平台进行判定分析;决策分析模块:用于根据决策分析规则,对微盘平台进行综合分析和评级;预警通知模块:用于将判定有风险的微盘交易平台进行预警通知;本发明还提供了一种微盘交易平台监控方法,对微盘交易平台进行监管,及时发现违法违规的微盘交易平台,进行示警,用户根据示警信息能及时知悉违法违规的微盘交易平台,能根据示警信息及时对违法违规的微盘交易平台进行处理。
-
公开(公告)号:CN110837608B
公开(公告)日:2024-04-12
申请号:CN201911080716.6
申请日:2019-11-07
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F16/9538 , G06F16/951
Abstract: 本发明提供了一种基于多源数据的舆情话题传播路径分析系统,包括:多源数据采集模块,用于对舆情话题进行多源数据采集,获取至少一项来源信息;传播路径分析模块,用于根据来源信息的类型采用不同的单源传播路径建立方案,得到单源传播路径,多个单源传播路径相互关联,得到交叉传播路径;传播主路径分析模块,用于分析各个节点的转发关系和转发量,得到舆情话题的关键传播节点,保留根节点与关键传播节点、关键传播节点之间的传播路径,删掉无关路径,得到传播主路径;路径显示模块,用于显示路径信息。本发明还提供了一种基于多源数据的舆情话题传播路径分析方法,帮助用户更加直观的了解舆情话题的传播情况。
-
公开(公告)号:CN109977414B
公开(公告)日:2023-03-14
申请号:CN201910256768.8
申请日:2019-04-01
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种互联网金融平台用户评论主题分析系统及方法,涉及自然语言处理领域;分析系统包括数据采集模块、金融词向量学习模块、评论主题生成模块、用户评论分类模块和评论主题更新模块;分析方法所述方法利用金融论坛中平台用户印象聚类生成用户评论主题,基于用户评论主题对互联网金融平台相关用户评论进行分析,并定期对评论主题进行更新。本发明不需要进行长期人工干预,借助互联网中易于获取的用户知识实现稳定的互联网金融平台评论分析及主题提取,分析获得的评论主题较有代表性,从而可以通过分析结果帮助用户更直观了解该互联网金融平台。
-
公开(公告)号:CN111402054A
公开(公告)日:2020-07-10
申请号:CN202010184049.2
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Inventor: 蒋燕萍 , 吴震 , 贺敏 , 王飞 , 张林波 , 吴莉莉 , 杨菁林 , 邢凯 , 王锟 , 徐小磊 , 董皓 , 王凡凡 , 郭艳军 , 王倩倩 , 杜漫 , 刘昕明 , 余智华
IPC: G06Q40/04
Abstract: 本发明涉及金融平台风险分析领域,具体涉及一种股权融资平台风险判定方法及系统,包括设制判定股权融资平台的风险指标体系,风险项和与风险项对应的风险判断标准;对需要进行风险判定的股权融资平台进行分析,得出与风险项相应的第一指标,判定第一指标是否命中所述风险判断标准,并根据所述判定对第一指标设置风险标记;设定风险模型公式,根据风险模型公式对风险标记行计算,得出标记结果;根据风险指标体系制定风险等级模型,将标记结果与所述风险等级模型进行对比,输出实际风险等级;所述风险项风险判断标准、风险标记构成的风险指标体系很好的解决了现有股权融资平台风险判定不可靠、不完备的问题,达到了全面、有针对性的技术效果。
-
公开(公告)号:CN111383115A
公开(公告)日:2020-07-07
申请号:CN202010184052.4
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种交易场所异常行为监测分析方法,包括以下步骤:采集交易场所平台的数据;设定风险指标体系;判定风险项及计算权重;根据风险模型公式计算风险分值,划分平台风险等级。本发明另一方面提供了一种交易场所异常行为监测分析系统。结合对交易场所业务交易监测、工商司法经营监测、互联网舆情监测、用户规模监测和网络媒介合规监测实现多维度综合分析判定,通过风险项判定以及风险模型公式设定计算,最终实现交易场所的风险指标体系设定,高效的监测交易场所违规行为。
-
公开(公告)号:CN110852090A
公开(公告)日:2020-02-28
申请号:CN201911080694.3
申请日:2019-11-07
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , H04L12/24
Abstract: 本发明提供了一种用于舆情爬取的机构特征词汇扩展系统,包括:数据采集模块:用于采集数据;特征词清洗加工模块:用于对特征词进行初步筛选;特征词统计分析模块:用于通过相关度分析,进一步筛选特征词,最终生成拓展特征词。本发明另一方面提供了一种用于舆情爬取的机构特征词汇扩展方法,采用上述方案,筛选掉无用特征词并进行分析,生成拓展特征词,全面、快速采集相关舆情信息,一方面有效的避免了漏查情况的发生,另一方面也减少了无用特征词增加无用的数据,提高检索效率和质量,减少内存的占用。
-
-
-
-
-
-
-
-
-