-
公开(公告)号:CN109241483A
公开(公告)日:2019-01-18
申请号:CN201811008674.0
申请日:2018-08-31
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/958
Abstract: 本发明涉及一种基于域名推荐的网站发现方法,包括:在域名字符集随机选取任意字符排列组合以获得词根字符串;以该词根字符串组成候选字符串;将该候选字符串与候选域名后缀进行拼接,组成推荐域名;对该推荐域名进行DNS解析,以判断为合法的该推荐域名为合法域名;验证该合法域名是否存在对应网站,若存在则获取为目标网站。
-
公开(公告)号:CN118708795A
公开(公告)日:2024-09-27
申请号:CN202410729579.9
申请日:2024-06-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/953 , G06F16/906
Abstract: 本发明公开了基于社交应用采集资源管理和检测使用的系统,包括:采集资源调度装置,其用于存储、初始化和分配采集资源;数据采集调度装置,其用于采集资源的申请与使用;采集资源状态收集装置,其用于存储使用完成的采集资源状态,并对采集资源进行分类;异常采集资源处理装置,其用于对异常采集资源进行删除、刷新和验证操作,并将刷新和验证后的采集资源更新到采集资源调度装置中;采集资源检测装置,其用于对采集资源调度装置中的采集资源进行可用性检测,并将不可用资源更新到采集资源状态收集装置中;以及,基于社交应用采集资源管理和检测使用的方法。本发明具有能确保采集资源可以得到最大化的利用,保障数据采集长期有效的完成等优点。
-
公开(公告)号:CN118568257A
公开(公告)日:2024-08-30
申请号:CN202410583477.0
申请日:2024-05-11
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种文本分类方法、装置、设备及存储介质。利用微调好的语言表示模型,对待分类文本中的语句进行处理,得到待分类文本的单词向量表示;从待分类文本的单词向量表示中获取具有语义关联关系的单词向量表示对,构建待分类文本的待处理图结构;利用预先训练的图卷积网络,对待分类文本的待处理图结构进行处理,得到待分类文本的向量表示矩阵;对待分类文本的向量表示矩阵进行分类处理,得到待分类文本的目标类别。这样,联合应用微调好的语言表示模型的表示学习能力和预先训练的图卷积网络的传导学习能力,能够提高文本分类的泛化能力,同时,结合微调好的语言表示模型对语境和语义的分析能力,提高了文本分类的精度。
-
公开(公告)号:CN117591119A
公开(公告)日:2024-02-23
申请号:CN202311441226.0
申请日:2023-11-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及软件检测技术领域,公开了一种海量APK源码特征提取及相似分析方法,首先输入两个APK文件,通过源码解析反编译方法提取到APK包的AndroidManifest文件、本地化语言配置文件,提取到SMALI或JAVA源代码;再通过包名索引、启动类索引、固定目录识别方式,识别APK核心源码目录、第三方包目录、系统资源目录,并生成源码树;再对核心源码目录中的文件进行分析,计算文件HASH,提取源码文件中字符串类声明特征表示作为加权特征;计算拟进行分析的两棵源码树结构的相似度情况,根据源码目录的类型对进行不同程度的相似度加权。本发明降低分析资源投入和时间消耗,提升源码相似分析的准确度,能够实现在大规模APK数据分析场景的高性能分析。
-
公开(公告)号:CN117556043A
公开(公告)日:2024-02-13
申请号:CN202311490975.2
申请日:2023-11-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/30 , G06F40/253 , G06F40/216 , G06N3/0455
Abstract: 本公开涉及一种热点话题提取方法、装置、电子设备及存储介质。其中,热点话题提取方法包括:获取目标文本;获取目标文本对应的多个主题以及每个主题对应的词语概率分布向量;基于词语概率分布向量计算多个主题中各个主题之间的主题相似度,并计算每个主题对应的主题一致性;基于主题相似度和主题一致性,对多个主题进行合并处理,得到至少一个主题簇;计算至少一个主题簇中每个主题簇分别对应的主题流行度和主题新颖度,基于主题流行度和主题新颖度确定目标文本对应的热点话题,由此,能够在进行热点话题提取时考虑到文本中各个词语之间的语义和语法关联性,提高了提取的热点话题的准确性。
-
公开(公告)号:CN113688310B
公开(公告)日:2023-08-29
申请号:CN202110839324.4
申请日:2021-07-23
Applicant: 北京中科闻歌科技股份有限公司 , 国家计算机网络与信息安全管理中心 , 国科智安(北京)科技有限公司
IPC: G06F16/9535 , G06Q50/00
Abstract: 本公开涉及一种内容推荐方法、装置、设备及存储介质。该方法包括:获取多媒体内容,确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度,基于推荐度影响参数,确定多媒体内容的目标推荐度,在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至目标用户。根据本公开实施例,提高目标用户对所推荐的多媒体内容感兴趣的可能性,从而提高内容推荐的准确性。
-
公开(公告)号:CN116628209A
公开(公告)日:2023-08-22
申请号:CN202310721792.0
申请日:2023-06-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/289 , G06N3/044 , G06N3/0442
Abstract: 本发明涉及文本处理技术领域,尤其涉及一种不规则文本的标签化方法,本发明在对不规则文本进行标签化时,首先对所述不规则文本进行判断,判断所述不规则文本为长文本还是短文本,当所述不规则文本为长文本时,采用深度学习模型对所述长文本进行标签化,当所述不规则文本为短文本时,采用基于样本的分类模型对所述短文本进行标签化;这样,可有效提高不规则文本的分类准确率。
-
公开(公告)号:CN115357631A
公开(公告)日:2022-11-18
申请号:CN202210668005.6
申请日:2022-06-14
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
IPC: G06F16/2457 , G06F40/295
Abstract: 本发明公开了一种社交账号区域位置信息的识别方法,其包括:采集社交账号的基本信息,所述基本信息至少包括:所在区域、个人简介;提取所在区域字段的内容,根据所在区域字段的内容得出位置信息,若无法得出位置信息,则采集社交账号的言论信息,提取言论信息发表时的定位经纬度,根据定位经纬度的地得出位置信息,若无法得出位置信息,则提取个人简介字段的内容,基于预设的位置匹配词在个人简介字段的内容中得出位置信息,若无法得出位置信息,则采集社交账号发表的文本信息,基于预设的位置匹配词在文本信息中得出位置信息。本发明可以通过账号注册时提供的位置信息、个人简介、经纬度、文本信息这四个维度进行区域位置分析。
-
公开(公告)号:CN115357610A
公开(公告)日:2022-11-18
申请号:CN202210669237.3
申请日:2022-06-14
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
IPC: G06F16/2455 , G06F9/48
Abstract: 本发明公开了采集资源调度方法,包括:接受采集任务系统的访问请求,根据所述访问请求查询缓存中的采集资源,所述访问请求包括请求的采集资源类型;若缓存中无所需采集资源,则在数据库中查询并获取采集资源,并将获取到的采集资源放入缓存,供所述采集任务系统使用。本发明还提供了采集资源调度系统。本发明能够较稳定地为采集任务系统提供有效的采集资源。
-
公开(公告)号:CN114861029A
公开(公告)日:2022-08-05
申请号:CN202210411631.7
申请日:2022-04-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/953 , G06Q10/06 , G06Q50/00
Abstract: 本发明实施例公开了舆情塑造过程分析方法、装置、电子设备以及存储介质。该方法包括:获取目标舆情事件的舆情数据以及目标舆情事件的舆情数据的发布方;根据舆情数据,确定舆情主题;根据舆情数据随时间的变化情况,将目标舆情事件划分为多个发展阶段;根据目标舆情事件在每个发展阶段的舆情数据,确定在相应发展阶段的核心议题;从在每个发展阶段的舆情数据的发布方中,识别在相应发展阶段的舆情塑造主体;根据在每个发展阶段的核心议题与舆情主题的匹配情况,对目标舆情事件在多个发展阶段的舆情塑造主体对于目标舆情事件的舆情塑造效果进行评估。基于该方法,可以实现对于舆情塑造过程的全面分析,并实现对于舆情塑造效果进行准确评估。
-
-
-
-
-
-
-
-
-