-
公开(公告)号:CN119988633A
公开(公告)日:2025-05-13
申请号:CN202510151779.5
申请日:2025-02-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/353 , G06F40/16 , G06F40/186 , G06F40/295 , G06F18/214 , G06F18/2415 , G06F18/2431 , G06N3/045 , G06N3/0464 , G06N5/022
Abstract: 本公开涉及自然语言处理技术领域,具体涉及一种基于大模型和知识库的文本观点自动标注方法及装置,所述基于大模型和知识库的文本观点自动标注方法包括:识别知识库中存在的与原始文本的实体对应的知识库实体以及所述知识库实体的扩展实体,将扩展实体基于预定义实体关系插入到原始文本中进行知识补全,生成知识嵌入文本;提供给定话题实体集;创建提示模板,将所述知识嵌入文本以及给定话题实体集填充所述提示模板中,然后利用大语言模型进行生成式标注得到态度标签;基于所述给定话题实体,态度标签得到倾向标签;基于所述原始文本、倾向标签构建标注数据集。上述技术方案对于高质量标注数据集的标注工作提供了有力支持。
-
公开(公告)号:CN112115269A
公开(公告)日:2020-12-22
申请号:CN202011172739.2
申请日:2020-10-28
Applicant: 国家计算机网络与信息安全管理中心河南分中心
IPC: G06F16/35 , G06F16/33 , G06K9/62 , G06F16/951 , G06F40/284
Abstract: 本发明公开了一种基于爬虫的网页自动分类方法,涉及数据分析领域,具体包括:首先,针对待分类的网页,利用定制爬虫获取内容信息并分出关键词。然后,逐个选取各关键词,依次比对是否属于互联网关键词类别库,如果是,得到该网页所属的类别个数M;否则,将不属于任何类别库的关键词单独记录。当类别个数M值大于等于2时,基于贝叶斯多维分类模型,随机选取2个类别,迭代判定该网页属于哪个类别的概率最大,将单独记录的关键词写入该类别词库中。当M的值等于1,则直接获取该网页所属类别,将单独记录的关键词写入;反之M等于0,则该网页内容属于暂时无法识别的网页,将其放入未识别网页词库中。本发明可以有效地提升网页分类的准确率。
-
公开(公告)号:CN110555081A
公开(公告)日:2019-12-10
申请号:CN201910314444.5
申请日:2019-04-18
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本申请公开了一种社交互动的用户分类方法、装置、电子设备及介质。其中,本申请中,在获取第一用户组中,各用户的互动对象信息,并在当检测到存在相同的互动对象信息时,根据各互动对象信息的信誉度评级,筛选相同的互动对象,生成第一对象组。再基于第一对象组,生成第二用户组后,建立第二用户组中,各用户的对应关系,以将各对应关系添加至用户数据表。通过应用本申请的技术方案,可以通过预先收集的各用户的对参与互动内容信息的信誉度评级,获取同一互动对象以及同一评级下的多个用户信息,并建立该各用户信息的对应关系。进而可以在后续检测到互动对象生成数据信息时,根据该互动对象对应的用户关系,将其推送至对应的用户。
-
公开(公告)号:CN110532460A
公开(公告)日:2019-12-03
申请号:CN201910314482.0
申请日:2019-04-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/958
Abstract: 本申请公开了一种网络访问用户的分类方法、装置、电子设备及介质。其中,本申请中,在获取各用户的访问参数信息,并建立各用户参数信息与主题参数信息的对应关系后,生成对应的用户分类表,在根据各主题参数信息的信誉度评级,在同一类别的用户中进行聚类,得到包含多个分组的用户分组表。通过应用本申请的技术方案,可以通过预先收集的各用户的访问信息,获取每种主题类别以及信誉度评级的数据信息对应的用户参数信息,从而更精准的对网络访问用户进行分类。
-
公开(公告)号:CN105302851B
公开(公告)日:2018-12-21
申请号:CN201510572332.1
申请日:2015-09-10
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明提供一种基于文件序列化的自动机远程分发和初始化方法,将位于内存的自动机序列化成本地文件,然后将序列化后的文件进行分发和快速部署,以替代原有的基于规则和特征的分发和部署方式。该方法包括步骤:S1.配置后端服务器,将特征和规则进行初始化生成自动机;S2.在所述后端服务器上将自动机序列化到本地,以文件形式存储;S3.配置分发网络和n台处理机,所述后端服务器将文件形式存在的自动机通过分发网络发送给所有需要进行匹配处理的处理机;S4.每台处理机都接收文件形式存在的自动机,并初始化到内存;S5.处理机根据新生成自动机进行特征的匹配和检测处理。
-
公开(公告)号:CN105207946B
公开(公告)日:2018-05-01
申请号:CN201510535316.5
申请日:2015-08-27
Applicant: 国家计算机网络与信息安全管理中心 , 北京赛思信安技术股份有限公司
IPC: H04L12/801 , G06F9/50
Abstract: 本发明一种网络数据包负载均衡和预解析方法,属于众核服务器的网络结构领域。包括以下步骤:一、在众核服务器下配置交换芯片;二、数据包经过外接接口进入交换芯片后,平均分给2个MPIPE;三、每个MPIPE将数据包转发到对应的TILERA CPU上,并进行预解析;四、在每个TILERA CPU上调用库函数创建数据包处理线程;五、为每个数据包处理线程分别绑定一个TILERA CPU核;六、将预解析结果分发到对应的数据包处理线程;七、各个处理线程分别通过库函数接收数据包并且得到预解析结果,保存源IP和目的IP。优点在于:使用交换芯片和MPIPE进行各个TILERA CPU之间的负载均衡,对于处理线程不需要再解析数据包,只对关注的数据包域进行处理;操作更加简便,提高数据包的处理能力。
-
公开(公告)号:CN105049365A
公开(公告)日:2015-11-11
申请号:CN201510330662.X
申请日:2015-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: H04L12/801 , H04L12/861 , H04L12/24 , H04L12/26 , H04L29/06
Abstract: 本发明提供一种多核多线程入侵检测设备的自适应调频节能方法,主要适用于支持运行时变频的网络设备(或计算机系统)中。包括以下步骤:1)由当前的流量情况预测未来一段时间内的流量变化情况;2)枚举未来一段时间内所有可能的频率操作序列,取得当前处理器的状态数据,如设备运行的频率、当前网络数据包缓冲区长度、当前网络数据包缓冲区占用情况等;3)将处理器的状态数据及未来一段时间内的流量变化情况和频率操作序列送入一内部模型,内部模型对每一种频率操作序列进行仿真,选取最优的频率操作序列;4)将最优的频率操作序列应用于真实处理器。
-
公开(公告)号:CN104951688A
公开(公告)日:2015-09-30
申请号:CN201410201062.9
申请日:2014-05-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F21/34
Abstract: 本发明提供一种适用于Xen虚拟化环境下的专用数据加密方法及加密卡,加密卡包括:权限管理单元、数据分配单元、队列加工单元和业务处理单元;数据分配单元用于将数据加密卡的硬件映射为多个独立的缓冲资源池,并且,每一个缓冲资源池的一端唯一对应一个虚拟机;队列加工单元用于建立与每一个缓冲资源池唯一对应的一组输入队列和输出队列;输入队列用于接收到的来自与其唯一对应的缓冲资源池的加密业务请求;然后将各加密业务请求依次发送到业务处理单元;输出队列用于将接收到的来自业务处理单元的加密业务响应依次返回给与其唯一对应的缓冲资源池。多台虚拟机共享一个加密卡硬件,提高了加密卡硬件的使用效率;还具有数据安全性高的优点。
-
公开(公告)号:CN102523221B
公开(公告)日:2014-11-19
申请号:CN201110430380.9
申请日:2011-12-20
Applicant: 国家计算机网络与信息安全管理中心 , 华为技术有限公司
IPC: H04L29/06 , H04L12/741
Abstract: 本发明提供一种数据报文的检测方法及网络安全检测设备。本发明通过网络安全检测设备根据获取的网络设备传输的数据报文,生成包含该网络安全检测设备的入端口信息的检测报文,并发送给分析设备,使得上述分析设备能够根据上述入端口信息定位对应的网络设备,能够解决现有技术中分析设备无法准确定位数据报文所在的网络设备的问题,实现了分析设备能够准确定位数据报文所来自的网络设备,从而提高了网络设备的可管理性和可维护性,提高了网络设备或者网络安全检测设备的管理和维护效率,同时降低了网络设备或者网络安全检测设备的管理和维护成本。
-
公开(公告)号:CN103957154A
公开(公告)日:2014-07-30
申请号:CN201410145480.0
申请日:2014-04-11
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种网络数据包URL过滤方法,包括步骤一、在Tilera众核平台下配置Mpipe规则;步骤二、创建n个收包线程,为各个线程绑定一个用于处理数据包的CPU核,n个收包线程并行运行;步骤三、在每个收包线程中,调用Mpipe接口接收网络数据包,从网络数据包里提取URL;步骤四、在每个收包线程中,将提取的URL与URL匹配规则表进行快速匹配查找;步骤五、如果在URL匹配规则表中查找到与数据包中的URL时,则数据包匹配URL规则,然后根据程序的参数设置对匹配URL规则的网络数据包进行过滤或者转发,否则按照预先设置的默认方式处理数据包。
-
-
-
-
-
-
-
-
-