-
公开(公告)号:CN116821747A
公开(公告)日:2023-09-29
申请号:CN202310439834.1
申请日:2023-04-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/24 , G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于图文多模态信息融合的互联网不良应用分类识别方法,针对不良应用具有识别效果佳的优点。互联网不良应用分类识别方法包括:收集网站应用,并对网络应用进行类别标注;提取网站应用的应用名称并基于此构建第一向量;对网络应用进行沙盒运行,以获取网络应用的访问信息以及运行界面截图;基于访问信息构建第二向量;从运行界面截图中提取有效文本字符并基于此构建第三向量;融合第一向量、第二向量、第三向量,以获得融合向量;将融合向量作为输入,训练互联网不良应用分类识别模型,互联网不良应用分类识别模型包括全连接层、Softmax层、损失函数;基于训练完成的互联网不良应用分类识别模型对待识别的网站应用进行分类识别。
-
公开(公告)号:CN112836493B
公开(公告)日:2023-03-14
申请号:CN202011404000.X
申请日:2020-12-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/226 , G06F40/284 , G06F16/33
Abstract: 本发明公开了一种转写文本校对方法及存储介质,包括,基于预先构建的校对样本库对待校对文本按照不同文本粒度进行分析校对,获得对应的候选方案集;根据所述候选方案集确定校对方案,并通过所述校对方案确定校对结果。本发明方法基于预先构建的校对样本库对待校对文本按照不同文本粒度进行分析校对,获得对应的候选方案集;根据所述候选方案集确定校对方案,由此从不同的文本粒度出发确定校对方案,提高了转写文本的准确性和语义的合理性。
-
公开(公告)号:CN112084373B
公开(公告)日:2022-06-03
申请号:CN202010778910.8
申请日:2020-08-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/901 , G06F40/151 , G06Q50/00 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于图嵌入的多源异构网络用户对齐方法,其特征在于:1)通过用户名和社会角色计算用户属性的相似度;2)通过随机游走算法获得异构网络的节点序列,分析节点之间的相互关系;3)利用嵌入算法,对节点序列计算得到网络的嵌入表示;4)根据用户的属性相似度以及结构特征,训练多层神经网络对齐用户。本发明所公开的基于图嵌入的多源异构网络用户对齐方法可用于在线社交网络的用户对齐,在推荐系统、人物画像补全等多个领域具有重要应用,算法的计算复杂度低,可在网络中快速对齐相同用户,对真实数据适用性强。
-
公开(公告)号:CN114330307A
公开(公告)日:2022-04-12
申请号:CN202110483554.1
申请日:2021-04-30
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/242 , G06F40/284 , G06F40/295
Abstract: 本发明公开了一种基于限定领域的分词方法及系统,方法包括:对限定领域的数据进行预处理,对预处理后得到的数据中的命名实体进行识别,并抽取出数据中的实体词汇,得到命名实体识别结果;基于预处理后得到的数据计算限定领域语料中的特征信息,并根据得到的特征信息构建新词发现模型,利用新词发现模型对语料库中的新词进行识别,以获取新词数据组;利用所述命名实体识别结果及常用词词典对获取的新词数据组进行过滤,排除掉常用词汇和实体词汇,以获取并确认敏感词,并基于确认后的敏感词建立敏感词库;结合敏感词库中获取的敏感词信息和命名实体识别结果进行分词。解决了现有技术中在限定领域中分词准确性较差的技术问题。
-
公开(公告)号:CN110059181B
公开(公告)日:2021-06-25
申请号:CN201910202727.0
申请日:2019-03-18
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明属于文本分类领域,具体涉及一种面向大规模分类体系的短文本标签方法、系统、装置,旨在为了解决有限数据情况下面向大规模分类体系的短文本标签系统的稳定性不高的问题。本发明方法包括:获取待分类的第一短文本信息集合,并基于正向最大匹配分词和word2vec词向量表示技术进行预处理得到第二短文本信息集合;基于规则的分类方法、有监督的神经网络分类方法,对第二短文本信息集合进行二分类后进行短文本过滤,并基于同样的分类方法进行各短文本的第一、二级分类标签,基于半监督学习的标签传播方法进行各短文本的第三、四级分类标签。本发明在有限数据情况下保证了面向大规模分类体系的短文本标签系统的稳定性。
-
公开(公告)号:CN112181613A
公开(公告)日:2021-01-05
申请号:CN202010943286.2
申请日:2020-09-09
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种异构资源分布式计算平台批量任务调度方法及存储介质,本发明在由几个计算中心组成的异构资源分布式计算集群中,将每个计算中心中的异构资源进行整合与分组,针对分布式计算平台中常见任务的需求,将这些资源合理地分配到预设的具有相应资源偏好的任务队列中。当有一批新任务提交时,根据用户提交的每个任务的相应特征以及各个中心的任务队列当前状态,分析全局最优解,为每个任务选择合适的队列。从而高效利用跨中心多集群中的异构资源,合理进行批量任务调度,解决现有技术中任务调度性能低、任务等待时间长的问题。
-
公开(公告)号:CN118013105B
公开(公告)日:2024-11-22
申请号:CN202310961857.9
申请日:2023-08-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/9538
Abstract: 本申请涉及一种推送信息的生成方法、装置、电子设备及存储介质,所述推送信息的生成方法通过获取第一推送信息集合,判断第一推送信息集合中,推送信息的第一比例是否小于预设阈值,推送信息表示包含预设内容的推送信息,并在第一比例小于预设阈值的情况下,根据第一比例确定调整策略,调整策略用于调整第一推送信息集合中的推送信息,基于调整策略调整第一推送信息集合中的推送信息,以生成目标推送信息集合。由此,在推送信息的第一比例较低时,可以通过调整策略起到调整推送信息的第一比例的作用,以此解决个性化推送方式中特定推送内容比例低的问题,实现了检测以及调整推送信息的比例的效果。
-
公开(公告)号:CN117591119B
公开(公告)日:2024-05-31
申请号:CN202311441226.0
申请日:2023-11-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及软件检测技术领域,公开了一种海量APK源码特征提取及相似分析方法,首先输入两个APK文件,通过源码解析反编译方法提取到APK包的AndroidManifest文件、本地化语言配置文件,提取到SMALI或JAVA源代码;再通过包名索引、启动类索引、固定目录识别方式,识别APK核心源码目录、第三方包目录、系统资源目录,并生成源码树;再对核心源码目录中的文件进行分析,计算文件HASH,提取源码文件中字符串类声明特征表示作为加权特征;计算拟进行分析的两棵源码树结构的相似度情况,根据源码目录的类型对进行不同程度的相似度加权。本发明降低分析资源投入和时间消耗,提升源码相似分析的准确度,能够实现在大规模APK数据分析场景的高性能分析。
-
公开(公告)号:CN118013105A
公开(公告)日:2024-05-10
申请号:CN202310961857.9
申请日:2023-08-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/9538
Abstract: 本申请涉及一种推送信息的生成方法、装置、电子设备及存储介质,所述推送信息的生成方法通过获取第一推送信息集合,判断第一推送信息集合中,推送信息的第一比例是否小于预设阈值,推送信息表示包含预设内容的推送信息,并在第一比例小于预设阈值的情况下,根据第一比例确定调整策略,调整策略用于调整第一推送信息集合中的推送信息,基于调整策略调整第一推送信息集合中的推送信息,以生成目标推送信息集合。由此,在推送信息的第一比例较低时,可以通过调整策略起到调整推送信息的第一比例的作用,以此解决个性化推送方式中特定推送内容比例低的问题,实现了检测以及调整推送信息的比例的效果。
-
公开(公告)号:CN116644229B
公开(公告)日:2024-01-26
申请号:CN202310545163.7
申请日:2023-05-15
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F18/214 , G06F18/243
Abstract: 本申请涉及一种推荐信息过度泛娱乐化预测方法、装置及服务器,方法应用于服务器,包括:获取用户个性化推荐场景下的待预测时刻的实时行为数据和第一历史行为数据;对待预测时刻的实时行为数据和第一历史行为数据进行特征提取,获得待输入特征;将待输入特征输入推荐信息过度泛娱乐化预测模型;获取推荐信息过度泛娱乐化预测模型的输出结果,输出结果表征用户待预测时刻是否发生推荐信息过度泛娱乐化。通过上述方式,解决了现在对过度泛娱乐化的信息推荐的预测角度的研究还存在空白的问题。
-
-
-
-
-
-
-
-
-