-
公开(公告)号:CN119988633A
公开(公告)日:2025-05-13
申请号:CN202510151779.5
申请日:2025-02-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/353 , G06F40/16 , G06F40/186 , G06F40/295 , G06F18/214 , G06F18/2415 , G06F18/2431 , G06N3/045 , G06N3/0464 , G06N5/022
Abstract: 本公开涉及自然语言处理技术领域,具体涉及一种基于大模型和知识库的文本观点自动标注方法及装置,所述基于大模型和知识库的文本观点自动标注方法包括:识别知识库中存在的与原始文本的实体对应的知识库实体以及所述知识库实体的扩展实体,将扩展实体基于预定义实体关系插入到原始文本中进行知识补全,生成知识嵌入文本;提供给定话题实体集;创建提示模板,将所述知识嵌入文本以及给定话题实体集填充所述提示模板中,然后利用大语言模型进行生成式标注得到态度标签;基于所述给定话题实体,态度标签得到倾向标签;基于所述原始文本、倾向标签构建标注数据集。上述技术方案对于高质量标注数据集的标注工作提供了有力支持。
-
公开(公告)号:CN116049483A
公开(公告)日:2023-05-02
申请号:CN202211427384.6
申请日:2022-11-15
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司
IPC: G06F16/735 , G06F16/75 , G06F16/783 , G06F16/33 , G06F16/335 , G06F40/289 , G06N3/0464 , G06N3/048
Abstract: 本发明涉及短视频用户标签构建技术领域,具体公开了一种基于多模态数据的用户标签构建方法及系统,包括:S100数据预处理,采集短视频平台用户的数据并对数据进行分类,数据种类包括视频信息、平台信息和文本内容信息;S200视频标签处理,对视频信息进行分析计算,并对依据视频内容输出视频标签;S300平台信息标签处理,依据平台标签信息对用户文本信息进行处理,并输出平台信息标签,等步骤;本发明采用视频风格分类算法对用户产生的视频进行截帧过滤、统计,输出用户视频内容偏好标签,该维度比较真实的体现了用户的喜好;本发明结合了用户视频、平台采集信息、文本内容等多源数据进行标签生成,使得生成的标签结果能够更好的刻画用户的特征。
-
公开(公告)号:CN110704612B
公开(公告)日:2022-09-16
申请号:CN201910732451.7
申请日:2019-08-09
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/35 , G06F16/31 , G06F40/216 , G06F40/30 , G06Q50/00
Abstract: 本发明提出了一种社交群体发现方法、装置和存储介质,用以提高社交群体发现精度和准确度。所述社交群体发现方法,包括:利用预先设定的种子用户和约束条件,从通信数据源中查找候选用户,所述候选用户包括与所述种子用户通信的第一用户和/或满足所述约束条件的第二用户;从所述候选用户的通信数据中提取与所述种子用户关联的关联特征信息;根据提取的关联特征信息,确定每一候选用户对应的置信度;确定对应的置信度大于预设阈值的候选用户为目标用户;根据目标用户之间的通信联系建立初始群体网络;利用群体发现算法从所述初始群体网络中发现社交群体子网络。
-
公开(公告)号:CN113656448A
公开(公告)日:2021-11-16
申请号:CN202110910039.7
申请日:2021-08-09
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司 , 北京百卓网络技术有限公司
IPC: G06F16/2457 , G06F16/23 , G06F16/22 , H04L29/06
Abstract: 本发明提供了一种报文处理方法、装置、设备及可读存储介质,所述方法包括:获取报文;将所述报文获取的时间作为所述报文的第一时间戳,并基于所述报文的内容计算所述报文的第一特征值;以所述第一特征值为索引,查找特征表中是否存在所述第一特征值,得到查找结果,所述特征表包括第二特征值和每个所述第二特征值所对应的第二时间戳;根据所述查找结果、所述特征表和所述第一时间戳判断所述报文是否为重复报文,得到判断结果,根据所述判断结果对所述报文进行对应的处理。本发明中时间戳标记可以实现微秒级的报文接收时间记录,同时时间差阈值也是微秒级单位,因此也就可以进行微秒级的报文时间间隔判定,进而实现精确的网络报文去重。
-
公开(公告)号:CN110659561A
公开(公告)日:2020-01-07
申请号:CN201910725251.9
申请日:2019-08-07
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种互联网暴恐视频识别模型的优化方法及装置,所述方法包括:获取互联网暴恐视频识别模型的卷积神经网络中各个层的卷积核的各个通道的参数;根据所述各个通道的参数判断是否丢弃对应的通道,如果判断为是,执行通道丢弃操作。本发明使得每天使用暴恐模型审核的数据量大大提升。填补了海量互联网视频暴恐视频审核技术和产品空白,可以极大程度提升了暴恐图像审核的产品竞争力。
-
公开(公告)号:CN110610230A
公开(公告)日:2019-12-24
申请号:CN201910698120.6
申请日:2019-07-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种台标检测方法、装置及可读存储介质,该方法包括如下步骤:获取台标数据集,并对所述台标数据集进行分组获得台标训练集;构建多损失融合的孪生神经网络,并基于所述台标训练集对所构建的多损失融合的孪生神经网络进行训练获得训练后的多损失融合的孪生神经网络;通过所述训练后的多损失融合的孪生神经网络对待测台标进行检测。本发明方法通过构建孪生神经网络框架,很好地消除了样本数量不足对训练网络带来的影响,可以更好地检测未知的新的种类的敏感台标。
-
公开(公告)号:CN115034286B
公开(公告)日:2024-07-02
申请号:CN202210435266.3
申请日:2022-04-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/24 , G06F18/214 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种基于自适应损失函数的异常用户识别方法和装置,其中,该方法包括:获取web系统的用户行为日志数据样本,并将用户行为日志数据样本向量化,得到无标签数据样本和有标签数据样本;进行数据预处理得到训练数据集;基于训练数据集的输入特征训练第一自编码器模型,并基于第一自编码器模型构造无标签数据样本损失函数和有标签数据样本损失函数;迭代优化第一自编码器模型并构造异常用户检测优化问题函数,得到第二自编码器模型;基于第二自编码器模型,对无标签数据样本进行异常点检测,以识别异常用户。本发明解决实际业务场景中,无标签数据中存在异常点,采用固定损失函数难以提高准确率,误报率高的技术问题。
-
公开(公告)号:CN117541955A
公开(公告)日:2024-02-09
申请号:CN202311368194.6
申请日:2023-10-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06V20/40 , G06V20/62 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于多维度视频特征的短视频平台账号智能判定方法,属于短视频平台账号智能判定领域,具体包括:1)提取视频帧文本信息,利用差分法抽取视频中不同的关键帧,获取关键帧中的文本信息。2)视频整体特征提取,通过使用3D卷积网络端到端的获取视频的整体特征。3)融合多维度特征对视频进行判定,将视频整体特征与文本特征进行融合,通过引入Sigmoid函数输出每一类别对应的置信度,完成对视频的类别判断。4)账户类别判定,通过设计赋值加权平均的方法完成对账户多视频类别的综合判定,从而得到准确的账户类别。本发明解决了短视频平台账户人力成本的消耗,在短视频平台发展的过程中具有极大的应用价值。
-
公开(公告)号:CN113641524B
公开(公告)日:2024-02-02
申请号:CN202110908717.6
申请日:2021-08-09
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司 , 北京百卓网络技术有限公司
Abstract: 本发明提供了单板启动超时的复位方法、装置、设备及可读存储介质,所述方法包括:获取时间阈值和第一输入信息,所述第一输入信息包括单板已上电启动的确认信息,所述第一输入信息用于触发所述单板上的可编程逻辑器件对所述单板上的硬盘进行硬盘动作信号检测;分析所述可编程逻辑器件在所述时间阈值内是否检测到所述硬盘动作信号,得到分析结果,所述分析结果用于触发复位装置对所述单板中的处理器进行复位操作。本发明通过增加可编程逻辑器件来实现对单板的硬盘的SATA_ACT信号状态的监测,进而解决了单板在启动过程中出现挂死而不能自动复位的问题。
-
公开(公告)号:CN113656448B
公开(公告)日:2023-12-26
申请号:CN202110910039.7
申请日:2021-08-09
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司 , 北京百卓网络技术有限公司
IPC: G06F16/2457 , G06F16/23 , G06F16/22 , H04L69/22
Abstract: 本发明提供了一种报文处理方法、装置、设备及可读存储介质,所述方法包括:获取报文;将所述报文获取的时间作为所述报文的第一时间戳,并基于所述报文的内容计算所述报文的第一特征值;以所述第一特征值为索引,查找特征表中是否存在所述第一特征值,得到查找结果,所述特征表包括第二特征值和每个所述第二特征值所对应的第二时间戳;根据所述查找结果、所述特征表和所述第一时间戳判断所述报文是否为重复报文,得到判断结果,根据所述判断结果对所述报文进行对应的处理。本发明中时间戳标记可以实现微秒级的报文接收时间记录,同时时间差阈值也是微秒级单位,因此也就可以进行微秒级的报文时间间隔判定,进而实现精确的网络报文去重。
-
-
-
-
-
-
-
-
-