-
公开(公告)号:CN111047448A
公开(公告)日:2020-04-21
申请号:CN201911392756.4
申请日:2019-12-30
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了多通道数据融合的分析方法,包括:根据恶意数字货币地址为种子,从暗网中爬取交易数据,所述交易数据包括交易地址及交易内容;将具有相同身份标识的交易地址的交易内容合并;结合区块链交易流分析和明网数据分析,对交易地址的身份标识进行信息补充。本发明还提供了多通道数据融合的分析装置。本发明通过对互联网和暗网信息进行关联分析,能有效弥补主被动分析方法的问题。
-
公开(公告)号:CN110443476A
公开(公告)日:2019-11-12
申请号:CN201910667446.2
申请日:2019-07-23
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于知识标注评价的任务分配方法,其特征在于,包括:对标注员往期标注任务进行评分,并按任务完成时段及按任务类型将综合分数存储于标注员人物库中;根据待分配任务的类型和任务发布时间所属时段检索标注员人物库,筛选综合分数高于预定阈值的标注员,并从中选出已分配任务量最少的标注员,向其下发待分配任务。本发明公开了一种基于知识标注评价的任务分配系统。本发明在任务分配时综合利用标注员评价结果,根据知识库类型、业务方向、标注效果等维度建立任务分配策略,将新的标注任务自动分配给合适的标注员,提升任务分配的效率及知识标注的整体质量。
-
公开(公告)号:CN110209815A
公开(公告)日:2019-09-06
申请号:CN201910435240.7
申请日:2019-05-23
Applicant: 国家计算机网络与信息安全管理中心 , 北京天润基业科技发展股份有限公司
Abstract: 本发明公开一种卷积神经网络的新闻用户兴趣挖掘方法:步骤一:定义兴趣标签;步骤二:训练数据构造;步骤三、词向量的语料收集与词向量训练;步骤四、构造word到token和token到word的映射,得到映射表;步骤五、在映射表基础上,对原始文本进行转换;步骤六:加载预训练好的词向量文件,构造一个词典词汇数量vocab_size*词向量维度embedding_size大小的矩阵;步骤七:将带有兴趣标签的微博文本数据接入到分类模型训练。本发明实现了一种自动构造新闻用户兴趣标签的方法,通过构建一个结合连续的语义特征CNN卷积神经网络作为兴趣文本分类器,对用户的新闻评论进行兴趣分类,得到用户的兴趣。
-
公开(公告)号:CN118708795A
公开(公告)日:2024-09-27
申请号:CN202410729579.9
申请日:2024-06-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/953 , G06F16/906
Abstract: 本发明公开了基于社交应用采集资源管理和检测使用的系统,包括:采集资源调度装置,其用于存储、初始化和分配采集资源;数据采集调度装置,其用于采集资源的申请与使用;采集资源状态收集装置,其用于存储使用完成的采集资源状态,并对采集资源进行分类;异常采集资源处理装置,其用于对异常采集资源进行删除、刷新和验证操作,并将刷新和验证后的采集资源更新到采集资源调度装置中;采集资源检测装置,其用于对采集资源调度装置中的采集资源进行可用性检测,并将不可用资源更新到采集资源状态收集装置中;以及,基于社交应用采集资源管理和检测使用的方法。本发明具有能确保采集资源可以得到最大化的利用,保障数据采集长期有效的完成等优点。
-
公开(公告)号:CN118568257A
公开(公告)日:2024-08-30
申请号:CN202410583477.0
申请日:2024-05-11
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种文本分类方法、装置、设备及存储介质。利用微调好的语言表示模型,对待分类文本中的语句进行处理,得到待分类文本的单词向量表示;从待分类文本的单词向量表示中获取具有语义关联关系的单词向量表示对,构建待分类文本的待处理图结构;利用预先训练的图卷积网络,对待分类文本的待处理图结构进行处理,得到待分类文本的向量表示矩阵;对待分类文本的向量表示矩阵进行分类处理,得到待分类文本的目标类别。这样,联合应用微调好的语言表示模型的表示学习能力和预先训练的图卷积网络的传导学习能力,能够提高文本分类的泛化能力,同时,结合微调好的语言表示模型对语境和语义的分析能力,提高了文本分类的精度。
-
公开(公告)号:CN117591119A
公开(公告)日:2024-02-23
申请号:CN202311441226.0
申请日:2023-11-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及软件检测技术领域,公开了一种海量APK源码特征提取及相似分析方法,首先输入两个APK文件,通过源码解析反编译方法提取到APK包的AndroidManifest文件、本地化语言配置文件,提取到SMALI或JAVA源代码;再通过包名索引、启动类索引、固定目录识别方式,识别APK核心源码目录、第三方包目录、系统资源目录,并生成源码树;再对核心源码目录中的文件进行分析,计算文件HASH,提取源码文件中字符串类声明特征表示作为加权特征;计算拟进行分析的两棵源码树结构的相似度情况,根据源码目录的类型对进行不同程度的相似度加权。本发明降低分析资源投入和时间消耗,提升源码相似分析的准确度,能够实现在大规模APK数据分析场景的高性能分析。
-
公开(公告)号:CN117556043A
公开(公告)日:2024-02-13
申请号:CN202311490975.2
申请日:2023-11-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/30 , G06F40/253 , G06F40/216 , G06N3/0455
Abstract: 本公开涉及一种热点话题提取方法、装置、电子设备及存储介质。其中,热点话题提取方法包括:获取目标文本;获取目标文本对应的多个主题以及每个主题对应的词语概率分布向量;基于词语概率分布向量计算多个主题中各个主题之间的主题相似度,并计算每个主题对应的主题一致性;基于主题相似度和主题一致性,对多个主题进行合并处理,得到至少一个主题簇;计算至少一个主题簇中每个主题簇分别对应的主题流行度和主题新颖度,基于主题流行度和主题新颖度确定目标文本对应的热点话题,由此,能够在进行热点话题提取时考虑到文本中各个词语之间的语义和语法关联性,提高了提取的热点话题的准确性。
-
公开(公告)号:CN113688310B
公开(公告)日:2023-08-29
申请号:CN202110839324.4
申请日:2021-07-23
Applicant: 北京中科闻歌科技股份有限公司 , 国家计算机网络与信息安全管理中心 , 国科智安(北京)科技有限公司
IPC: G06F16/9535 , G06Q50/00
Abstract: 本公开涉及一种内容推荐方法、装置、设备及存储介质。该方法包括:获取多媒体内容,确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度,基于推荐度影响参数,确定多媒体内容的目标推荐度,在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至目标用户。根据本公开实施例,提高目标用户对所推荐的多媒体内容感兴趣的可能性,从而提高内容推荐的准确性。
-
公开(公告)号:CN116628209A
公开(公告)日:2023-08-22
申请号:CN202310721792.0
申请日:2023-06-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/289 , G06N3/044 , G06N3/0442
Abstract: 本发明涉及文本处理技术领域,尤其涉及一种不规则文本的标签化方法,本发明在对不规则文本进行标签化时,首先对所述不规则文本进行判断,判断所述不规则文本为长文本还是短文本,当所述不规则文本为长文本时,采用深度学习模型对所述长文本进行标签化,当所述不规则文本为短文本时,采用基于样本的分类模型对所述短文本进行标签化;这样,可有效提高不规则文本的分类准确率。
-
公开(公告)号:CN115357631A
公开(公告)日:2022-11-18
申请号:CN202210668005.6
申请日:2022-06-14
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
IPC: G06F16/2457 , G06F40/295
Abstract: 本发明公开了一种社交账号区域位置信息的识别方法,其包括:采集社交账号的基本信息,所述基本信息至少包括:所在区域、个人简介;提取所在区域字段的内容,根据所在区域字段的内容得出位置信息,若无法得出位置信息,则采集社交账号的言论信息,提取言论信息发表时的定位经纬度,根据定位经纬度的地得出位置信息,若无法得出位置信息,则提取个人简介字段的内容,基于预设的位置匹配词在个人简介字段的内容中得出位置信息,若无法得出位置信息,则采集社交账号发表的文本信息,基于预设的位置匹配词在文本信息中得出位置信息。本发明可以通过账号注册时提供的位置信息、个人简介、经纬度、文本信息这四个维度进行区域位置分析。
-
-
-
-
-
-
-
-
-