-
公开(公告)号:CN117556043A
公开(公告)日:2024-02-13
申请号:CN202311490975.2
申请日:2023-11-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/30 , G06F40/253 , G06F40/216 , G06N3/0455
Abstract: 本公开涉及一种热点话题提取方法、装置、电子设备及存储介质。其中,热点话题提取方法包括:获取目标文本;获取目标文本对应的多个主题以及每个主题对应的词语概率分布向量;基于词语概率分布向量计算多个主题中各个主题之间的主题相似度,并计算每个主题对应的主题一致性;基于主题相似度和主题一致性,对多个主题进行合并处理,得到至少一个主题簇;计算至少一个主题簇中每个主题簇分别对应的主题流行度和主题新颖度,基于主题流行度和主题新颖度确定目标文本对应的热点话题,由此,能够在进行热点话题提取时考虑到文本中各个词语之间的语义和语法关联性,提高了提取的热点话题的准确性。
-
公开(公告)号:CN117131190A
公开(公告)日:2023-11-28
申请号:CN202310856800.2
申请日:2023-07-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/9535 , G06Q50/00 , G06N3/047 , G06F40/289
Abstract: 本发明涉及文本分类的技术领域,特别是涉及一种基于序贯神经网络模型的社交媒体用户文本分类方法,通过用户分类关键词、训练集数据和序贯模板模型构建社交媒体用户分类序贯神经网络模型,对采集的用户社交媒体发文文本进行相关特征提取,根据社交媒体中文用户分类序贯神经网络模型返回的权重值对用户进行分类;包括以下步骤:首先搜寻典型用户的post文本,收集相关关键词和停用词分别创建关键词词库和停用词词库,通过关键词词库和停用词词库结合典型用户文本构建神经网络训练矩阵,根据训练集和序贯模型创建神经网络模型,然后对采集到的中文用户post文本进行处理,最后通过序贯神经网络模型判定出用户的类型。
-
公开(公告)号:CN116628209A
公开(公告)日:2023-08-22
申请号:CN202310721792.0
申请日:2023-06-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/289 , G06N3/044 , G06N3/0442
Abstract: 本发明涉及文本处理技术领域,尤其涉及一种不规则文本的标签化方法,本发明在对不规则文本进行标签化时,首先对所述不规则文本进行判断,判断所述不规则文本为长文本还是短文本,当所述不规则文本为长文本时,采用深度学习模型对所述长文本进行标签化,当所述不规则文本为短文本时,采用基于样本的分类模型对所述短文本进行标签化;这样,可有效提高不规则文本的分类准确率。
-
公开(公告)号:CN118869520A
公开(公告)日:2024-10-29
申请号:CN202311587077.9
申请日:2023-11-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L43/02 , H04L43/062 , H04L47/70
Abstract: 本发明提供一种基于降噪模型的隧道流量关联方法和装置,其中所述方法包括:获取预建立的网络隧道的多个入口节点流和多个出口节点流;其中,所述网络隧道用于客户端访问对应的网络;确定与每个出口节点流对应的至少一个候选入口节点流,将每个所述出口节点流输入至预训练的降噪模型中,以将出口节点流依次进行网络噪声和混淆噪声去除处理,得到映射入口节点流;分别计算所述映射入口节点流与至少一个候选入口节点流的统计距离,根据所述统计距离对所述候选入口节点流进行筛选,将最小的统计距离对应的候选入口节点流作为与所述出口节点流关联的目标入口节点流;通过不同的编码层负责去除不同类型的噪声,可提高关联结果的精度。
-
公开(公告)号:CN118503420A
公开(公告)日:2024-08-16
申请号:CN202410583474.7
申请日:2024-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06N3/0464
Abstract: 本公开涉及一种立场分析方法、装置、电子设备及存储介质。其中,立场分析方法包括:获取待处理文本以及待处理文本对应的词语集合和词语集合中每个词语的词频;基于每个词语的词频计算每个词语对应的互信息值,并根据互信息值确定待处理文本对应的多个主题短语;计算多个主题短语与待处理文本之间的关系矩阵;基于关系矩阵对待处理文本的每个主题短语的立场进行分析,得到每个主题短语对应的立场分析结果,由此,能够通过确定多个主题短语与待处理文本之间的关系矩阵,根据关系矩阵对每个主题短语进行立场分析,得到主题短语对应的立场分析结果,避免了立场分析模型难以泛化的问题,提高了待处理文本对应的主题短语的立场分析结果。
-
公开(公告)号:CN116992300A
公开(公告)日:2023-11-03
申请号:CN202310538489.7
申请日:2023-05-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/22 , G06F16/9536 , G06F16/901 , G06Q50/00
Abstract: 本公开涉及一种可解释性的社交机器人检测方法、装置、设备及存储介质。本公开通过获取社交图中各用户节点的节点特征向量以及不同用户节点之间构成的边的权重,针对待解释节点,通过领域聚合得到待解释节点的嵌入向量,进而通过社交机器人检测模型对待解释节点的嵌入向量进行处理,以预测待解释节点为社交机器人的第一概率;从而基于第一概率,可以确定社交图中任一用户节点对待解释节点的预测结果的节点贡献度,表示任一用户节点对于待解释节点预测结果的影响程度,并且可以确定待解释节点的嵌入向量中的任一特征对待解释节点的预测结果的特征贡献度,表示任一特征对于待解释节点预测结果的影响程度,解决社交机器人检测的解释性差的问题。
-
公开(公告)号:CN115270717A
公开(公告)日:2022-11-01
申请号:CN202210764767.6
申请日:2022-06-29
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F40/126 , G06F40/284 , G06F40/30 , G06F16/35
Abstract: 本公开涉及一种立场检测方法、装置、设备及介质,其中该方法包括:获取文本中包含的词汇的语义编码和特征信息,特征信息包括词性信息;根据文本中包含的词语的排列顺序以及词性,生成至少一个预设句式结构的短语;根据文本中包含的词汇的语义编码生成短语的语义编码序列;基于短语的第一语义编码序列和预设的观点的第二语义编码序列,对短语和观点进行聚类;根据聚类结果确定文本中包含的观点,实现了对文本所包含词汇的特征信息的综合分析,从而能够准确判断文本的立场观点。
-
-
-
-
-
-