-
公开(公告)号:CN112084373B
公开(公告)日:2022-06-03
申请号:CN202010778910.8
申请日:2020-08-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/901 , G06F40/151 , G06Q50/00 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于图嵌入的多源异构网络用户对齐方法,其特征在于:1)通过用户名和社会角色计算用户属性的相似度;2)通过随机游走算法获得异构网络的节点序列,分析节点之间的相互关系;3)利用嵌入算法,对节点序列计算得到网络的嵌入表示;4)根据用户的属性相似度以及结构特征,训练多层神经网络对齐用户。本发明所公开的基于图嵌入的多源异构网络用户对齐方法可用于在线社交网络的用户对齐,在推荐系统、人物画像补全等多个领域具有重要应用,算法的计算复杂度低,可在网络中快速对齐相同用户,对真实数据适用性强。
-
公开(公告)号:CN114330307A
公开(公告)日:2022-04-12
申请号:CN202110483554.1
申请日:2021-04-30
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/242 , G06F40/284 , G06F40/295
Abstract: 本发明公开了一种基于限定领域的分词方法及系统,方法包括:对限定领域的数据进行预处理,对预处理后得到的数据中的命名实体进行识别,并抽取出数据中的实体词汇,得到命名实体识别结果;基于预处理后得到的数据计算限定领域语料中的特征信息,并根据得到的特征信息构建新词发现模型,利用新词发现模型对语料库中的新词进行识别,以获取新词数据组;利用所述命名实体识别结果及常用词词典对获取的新词数据组进行过滤,排除掉常用词汇和实体词汇,以获取并确认敏感词,并基于确认后的敏感词建立敏感词库;结合敏感词库中获取的敏感词信息和命名实体识别结果进行分词。解决了现有技术中在限定领域中分词准确性较差的技术问题。
-
公开(公告)号:CN110059181B
公开(公告)日:2021-06-25
申请号:CN201910202727.0
申请日:2019-03-18
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明属于文本分类领域,具体涉及一种面向大规模分类体系的短文本标签方法、系统、装置,旨在为了解决有限数据情况下面向大规模分类体系的短文本标签系统的稳定性不高的问题。本发明方法包括:获取待分类的第一短文本信息集合,并基于正向最大匹配分词和word2vec词向量表示技术进行预处理得到第二短文本信息集合;基于规则的分类方法、有监督的神经网络分类方法,对第二短文本信息集合进行二分类后进行短文本过滤,并基于同样的分类方法进行各短文本的第一、二级分类标签,基于半监督学习的标签传播方法进行各短文本的第三、四级分类标签。本发明在有限数据情况下保证了面向大规模分类体系的短文本标签系统的稳定性。
-
公开(公告)号:CN112181613A
公开(公告)日:2021-01-05
申请号:CN202010943286.2
申请日:2020-09-09
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种异构资源分布式计算平台批量任务调度方法及存储介质,本发明在由几个计算中心组成的异构资源分布式计算集群中,将每个计算中心中的异构资源进行整合与分组,针对分布式计算平台中常见任务的需求,将这些资源合理地分配到预设的具有相应资源偏好的任务队列中。当有一批新任务提交时,根据用户提交的每个任务的相应特征以及各个中心的任务队列当前状态,分析全局最优解,为每个任务选择合适的队列。从而高效利用跨中心多集群中的异构资源,合理进行批量任务调度,解决现有技术中任务调度性能低、任务等待时间长的问题。
-
公开(公告)号:CN118013105B
公开(公告)日:2024-11-22
申请号:CN202310961857.9
申请日:2023-08-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/9538
Abstract: 本申请涉及一种推送信息的生成方法、装置、电子设备及存储介质,所述推送信息的生成方法通过获取第一推送信息集合,判断第一推送信息集合中,推送信息的第一比例是否小于预设阈值,推送信息表示包含预设内容的推送信息,并在第一比例小于预设阈值的情况下,根据第一比例确定调整策略,调整策略用于调整第一推送信息集合中的推送信息,基于调整策略调整第一推送信息集合中的推送信息,以生成目标推送信息集合。由此,在推送信息的第一比例较低时,可以通过调整策略起到调整推送信息的第一比例的作用,以此解决个性化推送方式中特定推送内容比例低的问题,实现了检测以及调整推送信息的比例的效果。
-
公开(公告)号:CN118585608A
公开(公告)日:2024-09-03
申请号:CN202410750428.1
申请日:2024-06-12
Applicant: 国家计算机网络与信息安全管理中心 , 烟台中科网络技术研究所
IPC: G06F16/33 , G06F16/35 , G06F18/2415 , G06F40/30 , G06F9/50
Abstract: 本发明涉及人工智能进行自然语言处理技术领域,尤其涉及一种短文本智能分析与分类优化方法,包括以下步骤:S1:对短文本信息进行初步处理,得到初步处理后的短文本信息;S2:引入均衡负载数据分片算法将初步处理后的短文本信息进行数据分片并存储至多个节点k,利用分布式分散处理算法实现数据并行处理;S3:引入语境深度理解算法,优化短文本信息分类的准确率;S4:各节点k利用优化自然语言处理算法对分得的短文本分片数据进行智能分析,并确定其所属类别;S5:汇总并分析全部节点k上的分类结果,得到短文本信息的最终分析与分类结果,本方法提高了短文本信息处理分析与分类中的效率及准确率。
-
公开(公告)号:CN117591119B
公开(公告)日:2024-05-31
申请号:CN202311441226.0
申请日:2023-11-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及软件检测技术领域,公开了一种海量APK源码特征提取及相似分析方法,首先输入两个APK文件,通过源码解析反编译方法提取到APK包的AndroidManifest文件、本地化语言配置文件,提取到SMALI或JAVA源代码;再通过包名索引、启动类索引、固定目录识别方式,识别APK核心源码目录、第三方包目录、系统资源目录,并生成源码树;再对核心源码目录中的文件进行分析,计算文件HASH,提取源码文件中字符串类声明特征表示作为加权特征;计算拟进行分析的两棵源码树结构的相似度情况,根据源码目录的类型对进行不同程度的相似度加权。本发明降低分析资源投入和时间消耗,提升源码相似分析的准确度,能够实现在大规模APK数据分析场景的高性能分析。
-
公开(公告)号:CN118013105A
公开(公告)日:2024-05-10
申请号:CN202310961857.9
申请日:2023-08-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/9538
Abstract: 本申请涉及一种推送信息的生成方法、装置、电子设备及存储介质,所述推送信息的生成方法通过获取第一推送信息集合,判断第一推送信息集合中,推送信息的第一比例是否小于预设阈值,推送信息表示包含预设内容的推送信息,并在第一比例小于预设阈值的情况下,根据第一比例确定调整策略,调整策略用于调整第一推送信息集合中的推送信息,基于调整策略调整第一推送信息集合中的推送信息,以生成目标推送信息集合。由此,在推送信息的第一比例较低时,可以通过调整策略起到调整推送信息的第一比例的作用,以此解决个性化推送方式中特定推送内容比例低的问题,实现了检测以及调整推送信息的比例的效果。
-
公开(公告)号:CN116644229B
公开(公告)日:2024-01-26
申请号:CN202310545163.7
申请日:2023-05-15
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F18/214 , G06F18/243
Abstract: 本申请涉及一种推荐信息过度泛娱乐化预测方法、装置及服务器,方法应用于服务器,包括:获取用户个性化推荐场景下的待预测时刻的实时行为数据和第一历史行为数据;对待预测时刻的实时行为数据和第一历史行为数据进行特征提取,获得待输入特征;将待输入特征输入推荐信息过度泛娱乐化预测模型;获取推荐信息过度泛娱乐化预测模型的输出结果,输出结果表征用户待预测时刻是否发生推荐信息过度泛娱乐化。通过上述方式,解决了现在对过度泛娱乐化的信息推荐的预测角度的研究还存在空白的问题。
-
公开(公告)号:CN116962996A
公开(公告)日:2023-10-27
申请号:CN202311222480.1
申请日:2023-09-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04W4/12 , H04W4/08 , H04L51/063 , H04L51/214 , H04L51/52 , H04L51/56 , G06N3/006
Abstract: 本发明提供一种基于粒子群算法的信息传播预测方法、装置和设备,属于信息处理技术领域,该方法包括:确定在第一时刻目标信息对应的各个类型的用户的数量;其中,各个类型的用户对目标信息的信任程度和/或传播方式不同;根据第一时刻目标信息对应的各个类型的用户的数量和信息传播模型,确定目标信息的传播预测结果;目标信息的传播预测结果中包括在第二时刻目标信息对应的各个类型的用户的数量;信息传播模型用于对信息在传播过程中各个类型用户数量的变化情况进行预测。本发明的方法实现了对目标信息传播过程中各类型用户数量变化情况的准确预测,提升了信息传播预测结果的准确性。
-
-
-
-
-
-
-
-
-