-
公开(公告)号:CN117251524A
公开(公告)日:2023-12-19
申请号:CN202310446513.4
申请日:2023-04-24
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06F18/2431 , G06F18/2415 , G06F18/214 , G06N3/0455 , G06N3/0464 , G06N3/047 , G06N3/084
Abstract: 本发明公开了一种基于多策略融合的短文本分类方法,属于自然语言处理领域,主要涉及深度神经网络、数据增强以及文本分类。该方法包括如下步骤:通过数据预处理剔除噪声数据、基于词性标注关键词进行分类,基于数据增强的文本分类,最终通过多策略融合设置相应的阈值门限获取网络短文本数据标签。本发明通过提出一种基于多策略融合的短文本分类的解决方法,从而提升短文本数据分类的效果,进而提升业务人员发现相关短文本数据精准度和业务效率。
-
公开(公告)号:CN116795980A
公开(公告)日:2023-09-22
申请号:CN202310440756.7
申请日:2023-04-21
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06N3/0455 , G06N3/047 , G06N3/048 , G06N3/0985
Abstract: 本发明公开了一种融合细粒度要素知识的短文本分类方法,该方法包括:通过梳理标注短文本数据完成数据标注,其中,所述数据标注为标注全量标注数据类别和数据中存在要素信息;针对标注后的短文本数据,采用关键要素提取文本分类联合训练算法,借助BERT+CRF提取短文本数据中的要素信息;进而融合细粒度信息,结合标签编码器Label Encoder来学习各个标签label的表示,得到一个符合实际的标签分布。本发明针对上述问题提出一种融合细粒度要素知识的短文本分类的解决方法,从而提升短文本分类的效果,进而促使更为精准分析短文本数据,自动找到有关垃圾信息,提高工作效率。
-
公开(公告)号:CN119600625A
公开(公告)日:2025-03-11
申请号:CN202510143447.2
申请日:2025-02-10
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及自然语言处理技术领域,提供一种变体词识别方法及装置,所述方法包括:对待识别文本进行分词,得到至少一个文本分词;对各文本分词进行文本图像生成,得到各文本分词对应的分词图像;基于各文本分词的编码特征,以及对应分词图像的编码特征,得到各文本分词的变体词识别结果。本发明结合各文本分词的编码特征以及对应分词图像的编码特征,可以融合文本语义与视觉细节信息,将文本模态的文本分词和图像模态的分词图像对齐到同一语义空间,更全面地理解和识别变体词,有效提升了变体词识别的准确率。
-
公开(公告)号:CN114817661B
公开(公告)日:2024-08-13
申请号:CN202210448777.9
申请日:2022-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9035 , G06F18/22 , G06F18/23 , G06F18/24
Abstract: 本发明涉及一种基于IP地址画像的大规模IP自动分类方法,本方法首先基于各个IP画像的相似度关系构建图结构,由此确定核心的IP节点,对于新加入的节点,本方法对其进行分类的计算复杂度为O(n),n为核心节点的数量,因此适用于大规模IP数据的线上实时处理。同时,本方法在进行IP分类结果的更新时,会将之前的核心节点与新抽样的节点混合起来重新聚类,这一过程在一定程度上保证了各IP群体的核心稳定性,同时又能较好地反映它们的实时变化。本发明还涉及一种基于IP地址画像的大规模IP自动分类装置和存储介质。
-
公开(公告)号:CN115190217B
公开(公告)日:2024-03-26
申请号:CN202210801788.0
申请日:2022-07-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04N1/44 , H04N19/60 , H04L9/40 , G06T9/00 , G06F21/60 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种融合自编码网络的数据安全加密方法和装置,涉及互联网数据处理技术领域。本发明为了解决现有数据安全加密时面对包含大量图片的海量数据存储资源开销大、数据传输不安全、数据传输效率低的缺陷,其方法为采用文本加密模块对文本类型数据作加密处理,构建图片自编码网络模型,采用图片压缩模块对待加密的原始图片类型数据作预压缩处理;采用图片加密模块对图片压缩编码作加密处理,采用解密模块对需要应用于下游任务的文本密文数据或图片密文数据进行解密,采用图片重建模块对解密后的图片压缩编码进行重建复原,译码器将码字通过重建处理后得到重建图片类型数据。本发明主要用于海量数据传输。
-
公开(公告)号:CN117591119A
公开(公告)日:2024-02-23
申请号:CN202311441226.0
申请日:2023-11-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及软件检测技术领域,公开了一种海量APK源码特征提取及相似分析方法,首先输入两个APK文件,通过源码解析反编译方法提取到APK包的AndroidManifest文件、本地化语言配置文件,提取到SMALI或JAVA源代码;再通过包名索引、启动类索引、固定目录识别方式,识别APK核心源码目录、第三方包目录、系统资源目录,并生成源码树;再对核心源码目录中的文件进行分析,计算文件HASH,提取源码文件中字符串类声明特征表示作为加权特征;计算拟进行分析的两棵源码树结构的相似度情况,根据源码目录的类型对进行不同程度的相似度加权。本发明降低分析资源投入和时间消耗,提升源码相似分析的准确度,能够实现在大规模APK数据分析场景的高性能分析。
-
公开(公告)号:CN116962996B
公开(公告)日:2024-01-16
申请号:CN202311222480.1
申请日:2023-09-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04W4/12 , H04W4/08 , H04L51/063 , H04L51/214 , H04L51/52 , H04L51/56 , G06N3/006
Abstract: 本发明提供一种基于粒子群算法的信息传播预测方法、装置和设备,属于信息处理技术领域,该方法包括:确定在第一时刻目标信息对应的各个类型的用户的数量;其中,各个类型的用户对目标信息的信任程度和/或传播方式不同;根据第一时刻目标信息对应的各个类型的用户的数量和信息传播模型,确定目标信息的传播预测结果;目标信息的传播预测结果中包括在第二时刻目标信息对应的各个类型的用户的数量;信息传播模型用于对信息在传播过程中各个类型用户数量的变化情况进行预测。本发明的方法实现了对目标信息传播过程中各类型用户数量变化情况的准确预测,提升了信息传播预测结果的准确性。
-
公开(公告)号:CN116628515A
公开(公告)日:2023-08-22
申请号:CN202310538586.6
申请日:2023-05-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/22 , G06F18/25 , G06N3/0464 , G06N3/08 , G06F17/16
Abstract: 本发明涉及社交网络技术领域,尤其为基于同空间用户特征传递的多网络身份对齐系统及方法,包括:数据采集模块:用于采集社交网络中的用户数据;身份学习模块:用于通过搭建网络拓扑结构与采集的用户数据相结合进行用户的多社交网络身份学习;身份传递模块:用于通过网络拓扑结构将用户数据进行多社交网络传递;向量生成模块:用于通过所述网络拓扑结构和用户数据获取多社交网络用户在同一个空间上的用户向量;身份对齐模块:用于通过相似度算法实现对未标注的潜在锚链路进行用户身份对齐。本发明利用自注意力机制,对用户的不同属性特征进行学习、融合,进行锚链路对齐判别,对用户的不同属性信息进行有效地整合与协调,进一步提高了用户身份的对齐准确性。
-
公开(公告)号:CN116610758A
公开(公告)日:2023-08-18
申请号:CN202310478299.0
申请日:2023-04-28
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明实施例涉及一种信息溯源方法、系统及存储介质,所述方法包括:从多个平台中获取同一类目标主题信息,并对所述目标主题信息进行预处理,得到目标文本;创建所述目标文本的目标图谱;对所述目标图谱进行实体链接处理,得到所述目标文本的发布者集合,所述发布者集合携带有所述目标文本的传播路径信息;对所述发布者集合进行溯源分析,确定所述目标主题信息的目标发布者。通过对多个平台上的主题信息进行跨平台、跨时空的追踪和分析,确定主题信息的起源、演变和传播路径,为用户提供全面的信息参考和决策支持,由此,可以实现多平台的信息溯源的技术效果。
-
公开(公告)号:CN112181613B
公开(公告)日:2023-02-17
申请号:CN202010943286.2
申请日:2020-09-09
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种异构资源分布式计算平台批量任务调度方法及存储介质,本发明在由几个计算中心组成的异构资源分布式计算集群中,将每个计算中心中的异构资源进行整合与分组,针对分布式计算平台中常见任务的需求,将这些资源合理地分配到预设的具有相应资源偏好的任务队列中。当有一批新任务提交时,根据用户提交的每个任务的相应特征以及各个中心的任务队列当前状态,分析全局最优解,为每个任务选择合适的队列。从而高效利用跨中心多集群中的异构资源,合理进行批量任务调度,解决现有技术中任务调度性能低、任务等待时间长的问题。
-
-
-
-
-
-
-
-
-