-
公开(公告)号:CN113505221A
公开(公告)日:2021-10-15
申请号:CN202010214386.1
申请日:2020-03-24
申请人: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 北京中科闻歌智安科技有限公司
摘要: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
公开(公告)号:CN113505221B
公开(公告)日:2024-03-12
申请号:CN202010214386.1
申请日:2020-03-24
申请人: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司
IPC分类号: G06F16/35 , G06F18/2411 , G06Q30/018
摘要: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
公开(公告)号:CN110119882A
公开(公告)日:2019-08-13
申请号:CN201910296002.2
申请日:2019-04-12
申请人: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
摘要: 本申请涉及一种平台风险监控方法、装置、设备及存储介质,该方法包括:获取与业务数据对应的风险指数评估模型;从所述业务数据中获取风险点类别信息;利用所述风险指数评估模型,对所述风险点类别信息进行风险评估,得到所述风险点类别信息的风险指数评估结果。该方法可以缓解单靠人力对每个融资平台的风险进行有效监控的难度,达到了提高平台风险监控效率的技术效果。
-
公开(公告)号:CN111861120B
公开(公告)日:2023-10-13
申请号:CN202010556321.5
申请日:2020-06-17
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC分类号: G06Q10/0635 , G06F16/28
摘要: 本申请涉及一种企业关联图谱的构建方法、装置、设备及计算机可读介质。该方法包括:获取目标数据集,目标数据集包括多个目标企业的数据,每条数据包括一个目标企业的关联特征;将多个目标企业中具有相同的关联特征的企业划分到同一个企业组中;为多个目标企业建立图谱节点,并按照关联类型为企业组中的图谱节点构建节点与节点之间的关联边;利用关联系数和关联权重确定关联边的关联强度。本申请实现了企业关联图谱的构建,利用企业关联图谱表示了企业之间存在的各种关联关系及企业之间的关联强度,为企业间风险传播的评估提供了基础。
-
公开(公告)号:CN110837608B
公开(公告)日:2024-04-12
申请号:CN201911080716.6
申请日:2019-11-07
申请人: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/9538 , G06F16/951
摘要: 本发明提供了一种基于多源数据的舆情话题传播路径分析系统,包括:多源数据采集模块,用于对舆情话题进行多源数据采集,获取至少一项来源信息;传播路径分析模块,用于根据来源信息的类型采用不同的单源传播路径建立方案,得到单源传播路径,多个单源传播路径相互关联,得到交叉传播路径;传播主路径分析模块,用于分析各个节点的转发关系和转发量,得到舆情话题的关键传播节点,保留根节点与关键传播节点、关键传播节点之间的传播路径,删掉无关路径,得到传播主路径;路径显示模块,用于显示路径信息。本发明还提供了一种基于多源数据的舆情话题传播路径分析方法,帮助用户更加直观的了解舆情话题的传播情况。
-
公开(公告)号:CN109977414B
公开(公告)日:2023-03-14
申请号:CN201910256768.8
申请日:2019-04-01
申请人: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
摘要: 本发明公开了一种互联网金融平台用户评论主题分析系统及方法,涉及自然语言处理领域;分析系统包括数据采集模块、金融词向量学习模块、评论主题生成模块、用户评论分类模块和评论主题更新模块;分析方法所述方法利用金融论坛中平台用户印象聚类生成用户评论主题,基于用户评论主题对互联网金融平台相关用户评论进行分析,并定期对评论主题进行更新。本发明不需要进行长期人工干预,借助互联网中易于获取的用户知识实现稳定的互联网金融平台评论分析及主题提取,分析获得的评论主题较有代表性,从而可以通过分析结果帮助用户更直观了解该互联网金融平台。
-
公开(公告)号:CN110852090A
公开(公告)日:2020-02-28
申请号:CN201911080694.3
申请日:2019-11-07
申请人: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F40/284 , H04L12/24
摘要: 本发明提供了一种用于舆情爬取的机构特征词汇扩展系统,包括:数据采集模块:用于采集数据;特征词清洗加工模块:用于对特征词进行初步筛选;特征词统计分析模块:用于通过相关度分析,进一步筛选特征词,最终生成拓展特征词。本发明另一方面提供了一种用于舆情爬取的机构特征词汇扩展方法,采用上述方案,筛选掉无用特征词并进行分析,生成拓展特征词,全面、快速采集相关舆情信息,一方面有效的避免了漏查情况的发生,另一方面也减少了无用特征词增加无用的数据,提高检索效率和质量,减少内存的占用。
-
公开(公告)号:CN110020433A
公开(公告)日:2019-07-16
申请号:CN201910256769.2
申请日:2019-04-01
申请人: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
摘要: 本发明公开了一种基于企业关联关系的工商高管人名消歧方法,涉及实体消歧领域,包括以下步骤:将待消歧数据集U,按高管姓名划分成组n个高管姓名组A;根据步骤S1得到的姓名组划分结果,对每个组A,构建N层以内的高管及企业关联关系网络G;针对每个姓名组A,根据密切度计算规则,计算姓名组A中高管节点之间的关联密切度f;根据关联密切度构建聚类函数CL,使用层次聚类算法得到消歧结果。本发明能自动化对工商高管人名进行消歧,具有较高的消歧准确率,且具有一定的阈值设置灵活性,可满足较多应用场景的工商高管人名消歧;同时可构建高管任职关联关系、高管投资关联关系,为高管全视角的关联图谱分析提供支撑。
-
公开(公告)号:CN111861119B
公开(公告)日:2023-07-11
申请号:CN202010555450.2
申请日:2020-06-17
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC分类号: G06Q10/0635 , G06F16/901
摘要: 本申请涉及一种基于企业风险关联图谱的企业风险数据处理方法及装置。该方法包括:获取企业风险关联图谱并确定第一目标节点,企业风险关联图谱用于保存企业之间的风险传播关系,第一目标节点为企业风险关联图谱中的节点,用于表示出现风险问题的风险企业;利用企业风险关联图谱确定与第一目标节点关联的第二目标节点的风险参数,第二目标节点为企业风险关联图谱中的节点,用于表示与风险企业存在关联关系的企业,风险参数用于表示与风险企业存在关联关系的企业受风险企业影响的概率。本申请实现了从企业关联关系的角度分析其他企业受风险企业影响的概率,提供了评估企业之间风险传播的更为准确、形象的方法。
-
公开(公告)号:CN112668316A
公开(公告)日:2021-04-16
申请号:CN202011290565.X
申请日:2020-11-17
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC分类号: G06F40/258 , G06F40/205 , G06F16/35 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种word文档关键信息抽取方法,其包括:步骤一、获取源word文档,遍历word文档的段落,对于任一段落,判断段落是否具有模板样式属性,若具有模板样式属性,则进入步骤二,否则进入步骤三;步骤二、根据段落的模板样式属性获取段落信息类别,并与预设的待抽取关键信息类别列表进行匹配,将段落抽取并输入至输出文件一中所属信息类别对应的区域;步骤三、基于预设的神经网络模型识别段落的信息类别,并与预设的待抽取关键信息类别列表进行匹配,将段落抽取并输入所属信息类别对应的区域。本发明利用了word文档中的模板样式属性的信息,从而极大地提高了word文档抽取关键信息地效率。
-
-
-
-
-
-
-
-
-