-
公开(公告)号:CN115270807A
公开(公告)日:2022-11-01
申请号:CN202210764771.2
申请日:2022-06-29
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种网络用户的情感倾向判定方法、装置、设备及存储介质,其中方法包括:获取网络用户对目标事件评论的第一评论信息,以及对象对所述目标事件的第二评论信息;根据所述第一评论信息构建所述目标事件的知识图谱;基于所述知识图谱对所述第二评论信息进行情感分析,得到第一情感倾向值;至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向。本公开使用整体网络用户的评论构建知识图谱作为目标事件的背景知识库,通过结合目标事件的背景知识来对目标对象的网络用户的评论进行情感分析,进而判定情感倾向,使得对网络用户情感倾向的判定更准确。
-
公开(公告)号:CN115270717A
公开(公告)日:2022-11-01
申请号:CN202210764767.6
申请日:2022-06-29
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F40/126 , G06F40/284 , G06F40/30 , G06F16/35
Abstract: 本公开涉及一种立场检测方法、装置、设备及介质,其中该方法包括:获取文本中包含的词汇的语义编码和特征信息,特征信息包括词性信息;根据文本中包含的词语的排列顺序以及词性,生成至少一个预设句式结构的短语;根据文本中包含的词汇的语义编码生成短语的语义编码序列;基于短语的第一语义编码序列和预设的观点的第二语义编码序列,对短语和观点进行聚类;根据聚类结果确定文本中包含的观点,实现了对文本所包含词汇的特征信息的综合分析,从而能够准确判断文本的立场观点。
-
公开(公告)号:CN110852090A
公开(公告)日:2020-02-28
申请号:CN201911080694.3
申请日:2019-11-07
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , H04L12/24
Abstract: 本发明提供了一种用于舆情爬取的机构特征词汇扩展系统,包括:数据采集模块:用于采集数据;特征词清洗加工模块:用于对特征词进行初步筛选;特征词统计分析模块:用于通过相关度分析,进一步筛选特征词,最终生成拓展特征词。本发明另一方面提供了一种用于舆情爬取的机构特征词汇扩展方法,采用上述方案,筛选掉无用特征词并进行分析,生成拓展特征词,全面、快速采集相关舆情信息,一方面有效的避免了漏查情况的发生,另一方面也减少了无用特征词增加无用的数据,提高检索效率和质量,减少内存的占用。
-
公开(公告)号:CN110852090B
公开(公告)日:2024-03-19
申请号:CN201911080694.3
申请日:2019-11-07
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , H04L41/147
Abstract: 本发明提供了一种用于舆情爬取的机构特征词汇扩展系统,包括:数据采集模块:用于采集数据;特征词清洗加工模块:用于对特征词进行初步筛选;特征词统计分析模块:用于通过相关度分析,进一步筛选特征词,最终生成拓展特征词。本发明另一方面提供了一种用于舆情爬取的机构特征词汇扩展方法,采用上述方案,筛选掉无用特征词并进行分析,生成拓展特征词,全面、快速采集相关舆情信息,一方面有效的避免了漏查情况的发生,另一方面也减少了无用特征词增加无用的数据,提高检索效率和质量,减少内存的占用。
-
公开(公告)号:CN111401448B
公开(公告)日:2024-05-24
申请号:CN202010183470.1
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284
Abstract: 本发明提供了一种交易平台分类方法和装置,包括步骤:数据采集,接收第一数据,根据第一数据获取第二数据,所述第二数据包括自然语言,对所述第二数据进行第一预处理,生成第三数据;数据处理,对所述第三数据进行分析,根据数据相关度,判定所述第三数据为第一类数据或第二类数据;分类模型建立,将所述第一类数据和第二类数据根据样本数和学习率建立分类模型;平台分类,接收平台数据和所述第三数据,将所述第三数据输入所述分类模型,判定所述第三数据为第一类数据或第二类数据;分析平台数据,判定与所述平台数据相关的第三数据。通过数据采集,数据处理,分类模型建立,平台分类,判断平台为场内或场外平台。
-
公开(公告)号:CN111401450A
公开(公告)日:2020-07-10
申请号:CN202010184062.8
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06K9/62 , G06F40/284 , G06Q40/04
Abstract: 本发明提供了一种交易场所分类方法和装置,包括步骤:接收第一数据,根据第一数据获取第二数据,所述第二数据为文本数据,对所述第二数据进行标记处理,生成第三数据;对所述第三数据进行第二预处理,得出第四数据,将所述第四数据进行转换,得出第五数据,根据所述第五数据,生成第一模型;将所述第五数据划分为第一部分和第二部分,将所述第一部分导入第一库生成所述第一边界,将所述第二部分导入验证,得出第二模型;接收场所信息,将所述场所信息进行所述第二预处理得出所述第一信息,将所述第一信息导入所述第二模型,得出场所类别。通过分界线判断所述场所类别,在直观而且快捷的同时,提高所述场所类别的划分准确性。
-
公开(公告)号:CN111401448A
公开(公告)日:2020-07-10
申请号:CN202010183470.1
申请日:2020-03-16
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06K9/62 , G06F40/284
Abstract: 本发明提供了一种交易平台分类方法和装置,包括步骤:数据采集,接收第一数据,根据第一数据获取第二数据,所述第二数据包括自然语言,对所述第二数据进行第一预处理,生成第三数据;数据处理,对所述第三数据进行分析,根据数据相关度,判定所述第三数据为第一类数据或第二类数据;分类模型建立,将所述第一类数据和第二类数据根据样本数和学习率建立分类模型;平台分类,接收平台数据和所述第三数据,将所述第三数据输入所述分类模型,判定所述第三数据为第一类数据或第二类数据;分析平台数据,判定与所述平台数据相关的第三数据。通过数据采集,数据处理,分类模型建立,平台分类,判断平台为场内或场外平台。
-
-
-
-
-
-