-
公开(公告)号:CN119991328A
公开(公告)日:2025-05-13
申请号:CN202510151780.8
申请日:2025-02-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q50/00 , G06F18/20 , G06F18/22 , G06F18/2323 , G06F16/9535 , G06N5/025 , G06F123/02
Abstract: 本公开涉及复杂网络分析技术领域,具体涉及一种融合内容结构规则和时间规律的目标社区发现方法及装置,所述融合内容结构规则和时间规律的目标社区发现方法,包括:获取用户的发文信息以及发文次数;从所述发文信息中识别用户内容结构规则,并通过杰卡德相似系数计算用户间内容结构规则相似度;基于所述发文次数构建用户发文时间规律矩阵,并通过皮尔逊相关系数计算用户间时间规律相似度;建立基于用户间内容结构规则相似度以及用户间时间规律相似度的网络无向加权图;使用谱聚类方法对于网络无向加权图进行社区发现,得到社区划分结果。上述技术方案有助于发现社交平台中的隐藏社群和影响力网络,准确定位基于用户偏好的目标社区。
-
公开(公告)号:CN119988633A
公开(公告)日:2025-05-13
申请号:CN202510151779.5
申请日:2025-02-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/353 , G06F40/16 , G06F40/186 , G06F40/295 , G06F18/214 , G06F18/2415 , G06F18/2431 , G06N3/045 , G06N3/0464 , G06N5/022
Abstract: 本公开涉及自然语言处理技术领域,具体涉及一种基于大模型和知识库的文本观点自动标注方法及装置,所述基于大模型和知识库的文本观点自动标注方法包括:识别知识库中存在的与原始文本的实体对应的知识库实体以及所述知识库实体的扩展实体,将扩展实体基于预定义实体关系插入到原始文本中进行知识补全,生成知识嵌入文本;提供给定话题实体集;创建提示模板,将所述知识嵌入文本以及给定话题实体集填充所述提示模板中,然后利用大语言模型进行生成式标注得到态度标签;基于所述给定话题实体,态度标签得到倾向标签;基于所述原始文本、倾向标签构建标注数据集。上述技术方案对于高质量标注数据集的标注工作提供了有力支持。
-
公开(公告)号:CN116049483A
公开(公告)日:2023-05-02
申请号:CN202211427384.6
申请日:2022-11-15
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司
IPC: G06F16/735 , G06F16/75 , G06F16/783 , G06F16/33 , G06F16/335 , G06F40/289 , G06N3/0464 , G06N3/048
Abstract: 本发明涉及短视频用户标签构建技术领域,具体公开了一种基于多模态数据的用户标签构建方法及系统,包括:S100数据预处理,采集短视频平台用户的数据并对数据进行分类,数据种类包括视频信息、平台信息和文本内容信息;S200视频标签处理,对视频信息进行分析计算,并对依据视频内容输出视频标签;S300平台信息标签处理,依据平台标签信息对用户文本信息进行处理,并输出平台信息标签,等步骤;本发明采用视频风格分类算法对用户产生的视频进行截帧过滤、统计,输出用户视频内容偏好标签,该维度比较真实的体现了用户的喜好;本发明结合了用户视频、平台采集信息、文本内容等多源数据进行标签生成,使得生成的标签结果能够更好的刻画用户的特征。
-
公开(公告)号:CN114626425A
公开(公告)日:2022-06-14
申请号:CN202011456860.8
申请日:2020-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06K9/62 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种面向噪声文本的多视角交互匹配方法及电子装置,包括对两段待匹配噪声文本分别编码,得到两段编码向量序列,并向两段编码向量序列的每个编码向量中加入位置信息;对加入位置信息的两段编码向量序列进行内部交互,分别得到两段内部交互结果;对两段内部交互结果进行外部交互,分别构建两个双向的噪声文本交互矩阵;拼接两个噪声文本交互矩阵,判断两个待匹配噪声文本是否匹配。本发明采用注意力机制捕获噪声文本之间的双向匹配模式,受噪声文本中句子的逻辑顺序影响较小,增加文本有效语义单词影响,提高模型时间效率及噪声文本匹配效果,避免传递匹配问题。
-
公开(公告)号:CN114625978A
公开(公告)日:2022-06-14
申请号:CN202011454130.4
申请日:2020-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/9536 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明提供一种基于类型感知的异质网络用户锚链接预测方法及电子装置,包括收集待检测网络和目标网络的网络信息,构建待检测异质网络和目标异质网络;获取每一节点各维度的初始特征向量,得到每个节点的初始特征向量表示;将初始特征向量表示输入基于自注意力图神经网络进行学习,计算各节点的类型感知向量和类型融合向量;通过待检测异质网络和目标异质网络中各节点对之间属于同一类型的类型感知向量及类型融合向量的相似度,判断待检测网络和目标网络是否为锚链接。本发明采用注意力机制捕获节点与类型信息之间影响,利用图注意力网络学习类型感知向量和类型融合向量,解决异质网络中对多种类型信息建模的问题,取得较好的锚链接预测效果。
-
公开(公告)号:CN113656448A
公开(公告)日:2021-11-16
申请号:CN202110910039.7
申请日:2021-08-09
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司 , 北京百卓网络技术有限公司
IPC: G06F16/2457 , G06F16/23 , G06F16/22 , H04L29/06
Abstract: 本发明提供了一种报文处理方法、装置、设备及可读存储介质,所述方法包括:获取报文;将所述报文获取的时间作为所述报文的第一时间戳,并基于所述报文的内容计算所述报文的第一特征值;以所述第一特征值为索引,查找特征表中是否存在所述第一特征值,得到查找结果,所述特征表包括第二特征值和每个所述第二特征值所对应的第二时间戳;根据所述查找结果、所述特征表和所述第一时间戳判断所述报文是否为重复报文,得到判断结果,根据所述判断结果对所述报文进行对应的处理。本发明中时间戳标记可以实现微秒级的报文接收时间记录,同时时间差阈值也是微秒级单位,因此也就可以进行微秒级的报文时间间隔判定,进而实现精确的网络报文去重。
-
公开(公告)号:CN110879856A
公开(公告)日:2020-03-13
申请号:CN201911180128.X
申请日:2019-11-27
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/901 , G06F16/906 , G06F16/909 , G06K9/62 , G06Q50/00
Abstract: 本发明公开了一种基于多特征融合的社交群体分类方法及系统。本方法为:1)对一目标社交群体的数据集,对该数据集中各用户的轨迹数据进行预处理,去除噪声并对缺失位置信息进行插值;2)使用频繁序列挖掘算法从各用户轨迹数据中挖掘对应用户的轨迹模式,再将用户的轨迹模式看作时序序列,采用LSTM对该时间序列进行编码,得到用户的轨迹编码;3)根据所述社交关系生成一图网络,将所述社交关系投影到低维空间,学习得到各用户的嵌入表示;4)将每一用户的轨迹编码和对应用户的嵌入表示结合输入softmax层,确定各用户的类别,实现对该目标社交群体的分类。本发明大大提升了群体分类的精度。
-
公开(公告)号:CN110659561A
公开(公告)日:2020-01-07
申请号:CN201910725251.9
申请日:2019-08-07
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种互联网暴恐视频识别模型的优化方法及装置,所述方法包括:获取互联网暴恐视频识别模型的卷积神经网络中各个层的卷积核的各个通道的参数;根据所述各个通道的参数判断是否丢弃对应的通道,如果判断为是,执行通道丢弃操作。本发明使得每天使用暴恐模型审核的数据量大大提升。填补了海量互联网视频暴恐视频审核技术和产品空白,可以极大程度提升了暴恐图像审核的产品竞争力。
-
公开(公告)号:CN110610230A
公开(公告)日:2019-12-24
申请号:CN201910698120.6
申请日:2019-07-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种台标检测方法、装置及可读存储介质,该方法包括如下步骤:获取台标数据集,并对所述台标数据集进行分组获得台标训练集;构建多损失融合的孪生神经网络,并基于所述台标训练集对所构建的多损失融合的孪生神经网络进行训练获得训练后的多损失融合的孪生神经网络;通过所述训练后的多损失融合的孪生神经网络对待测台标进行检测。本发明方法通过构建孪生神经网络框架,很好地消除了样本数量不足对训练网络带来的影响,可以更好地检测未知的新的种类的敏感台标。
-
公开(公告)号:CN114626425B
公开(公告)日:2024-11-08
申请号:CN202011456860.8
申请日:2020-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F18/22 , G06F40/30 , G06F40/284 , G06N3/0464 , G06N3/045 , G06N3/0442 , G06N3/084
Abstract: 本发明提供一种面向噪声文本的多视角交互匹配方法及电子装置,包括对两段待匹配噪声文本分别编码,得到两段编码向量序列,并向两段编码向量序列的每个编码向量中加入位置信息;对加入位置信息的两段编码向量序列进行内部交互,分别得到两段内部交互结果;对两段内部交互结果进行外部交互,分别构建两个双向的噪声文本交互矩阵;拼接两个噪声文本交互矩阵,判断两个待匹配噪声文本是否匹配。本发明采用注意力机制捕获噪声文本之间的双向匹配模式,受噪声文本中句子的逻辑顺序影响较小,增加文本有效语义单词影响,提高模型时间效率及噪声文本匹配效果,避免传递匹配问题。
-
-
-
-
-
-
-
-
-