-
公开(公告)号:CN109977287B
公开(公告)日:2021-02-02
申请号:CN201910242011.3
申请日:2019-03-28
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/9535 , G06F16/2458 , G06F16/215 , G06Q50/16
Abstract: 本发明涉及一种不同信息源的房产数据同一性判别方法,属于互联网数据分析与挖掘技术领域。所述同一性判别方法基于链家、我爱我家、中原、麦田网站公布的房屋数据及其相关性;通过分析房屋数据的特点,通过区域去重、小区去重以及房屋去重的三大步骤剔除重复的房屋数据,所述房屋数据是对实际的房屋客体的特点描述,虽然描述的角度和方式存在差异,但数据之间存在很强的相关性。所述方法能对来源于不同网站的房屋数据去重,能够准确、高效的对来源于不同信息源的房屋数据的同一性判别,并能有效去除重复区域、小区,可以实现面向多源异构的房屋数据的有效融合,为房地产市场分析提供“干净”,“整齐”的数据。
-
公开(公告)号:CN111859980A
公开(公告)日:2020-10-30
申请号:CN202010549951.X
申请日:2020-06-16
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/9536 , G06N3/04 , G06N3/08
Abstract: 本申请涉及一种讽刺类型的文本识别方法、装置、设备及计算机可读介质。该方法包括:获取待处理文本,待处理文本来自于社交媒体网络平台;采用多种方式提取待处理文本的目标特征信息,目标特征信息为从特征集合中选择出来的多个特征信息的加权和表示;根据第一神经网络模型对目标特征信息的识别结果确定待处理文本的文本类型,第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,标记信息用于标记训练数据是否为目标类型。本申请从多个维度捕获词间关联特征,并从讽刺文本的情感倾向转换出发,挖掘词语间的冲突性,进而充分体现句子中地所蕴含的讽刺含义,最终准确、合理地识别讽刺文本。
-
公开(公告)号:CN111832622A
公开(公告)日:2020-10-27
申请号:CN202010531569.6
申请日:2020-06-11
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
Abstract: 本发明提出一种特定人物丑化图片识别方法和系统,包括:获取包含特定人物的图片集,该图片集包括多张漫画和多张照片,该图片集中每张图片标有代表是否丑化的预设标签,以该图片集中漫画和照片分别作为训练数据,训练卷积神经网络模型,得到特定人物漫画识别网络和特定人物照片识别网络;通过前置网络判断待识别图片是否属于漫画,若是,则将该待识别图片发送至该特定人物漫画识别网络,得到该待识别图片的特定人物丑化图片识别结果,否则对该待识别图片进行人脸对比,判断该待识别图片是否包括该特定人物,若是则通过该特定人物照片识别网络,得到该待识别图片的特定人物丑化图片识别结果,否则得到该待识别图片不包括该特定人物的识别结果。
-
公开(公告)号:CN111832621A
公开(公告)日:2020-10-27
申请号:CN202010531567.7
申请日:2020-06-11
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
Abstract: 本发明提出一种基于稠密多路卷积网络的图片分类方法和系统,包括:构建由分组、变换、聚合构成的基本单元,基于该基本单元构建新的稠密模块,将密集连接的卷积DenseNet网络网络框架中原始稠密模块替换为该新稠密模块,得到稠密多路卷积网络;使用已标记类别的图片数据作为训练数据,通过梯度反向传播更新该稠密多路卷积网络中的权重,训练该稠密多路卷积网络,得到图片分类模型;将待分类图片数据输入该分类模型,得到该待分类图片数据的分类结果。本发明提出的稠密多路卷积网络,对DenseNet网络的基本模块进行了改进和优化,以获取表达力更强的特征。
-
公开(公告)号:CN109800431B
公开(公告)日:2020-07-28
申请号:CN201910062802.8
申请日:2019-01-23
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06F16/35
Abstract: 本发明属于计算机科学技术领域,尤其是涉及一种事件信息关键词提取、监控方法及系统及存储和处理装置,旨在为了解决解决无监督方法提取关键词效果不稳定的问题。本发明提取方法对于获取的待监控的事件信息,基于多种关键词提取技术提取并优选一组相关性很强的关键词作为第一关键词组,而后基于关键词在时域的发展演化选出最新的热点词汇作为第二关键词组,再后对同一时间段内的同一事件的不同报道进行聚类,提取各聚类的关键词合并后作为第三关键字组,最后合并三个关键词组并选定最终的关键词组合。本发明提高了系统的稳定性,同时兼顾了时域及同一事件不同侧面的发展方向。
-
公开(公告)号:CN110427264A
公开(公告)日:2019-11-08
申请号:CN201910578638.6
申请日:2019-06-28
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F9/50 , G06F16/951
Abstract: 本发明提出一种基于Kubernetes的JS解析方法及系统,包括:多台物理机、采集结果库、系统监控模块和解析任务控制模块;物理机,用于根据任务部署JS解析Pod,执行网页采集,将得到的采集结果存至采集结果库;系统监控模块,用于自动读取物理机的机器信息;解析任务控制模块,用于查询系统监控模块,得到各物理机的机器信息,以计算各物理机应部署的JS解析Pod个数,调用Kubernetes API调整各物理机的JS解析Pod个数。本发明有效的利用了空闲时间执行JS解析相关任务,并减小了JS解析的资源消耗。
-
公开(公告)号:CN117411780A
公开(公告)日:2024-01-16
申请号:CN202311305424.4
申请日:2023-10-10
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L41/069 , H04L41/0631
Abstract: 本发明公开了一种基于多源数据特征的网络日志异常检测方法,包括多源网络设备数据接入,统一数据处理,统一日志模板提取,特征提取,多元算子融合,实时异常检测,离线批数据检测和异常告警;本发明简化了不同结构的网络日志的处理成本,相对于之前需要维护多种数据结构解析方法,本发明的统一数据处理方式和统一的日志模板提取方式,本发明的方式更加简单有效,且基于采集的多源网络日志数据实现了异常日志的多因子算法预测分析。
-
公开(公告)号:CN117113197A
公开(公告)日:2023-11-24
申请号:CN202311179240.8
申请日:2023-09-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/241 , G06F18/10 , G06F18/22 , G06F18/213
Abstract: 本发明公开了一种基于社区发现的微博群体识别方法,包括以下步骤:S1、数据收集与清洗;S2、特征提取与表示;S3、建立分类模型;S4、社群标签和影响力分析。本发明中,通过利用优化的动态主题模型DTM来挖掘微博社区中的特定群体,利用选取近一年的微博博文作为研究对象,将不同作者博文的主题相似度作为作者之间链接的权重,将微博网络映射为有向加权网络,结合标签传播算法LPA进行社区发现,识别出社交关系网络中固有的社区结构,本发明对微博网络的用户关系进行深入分析,基于用户产生内容特征、用户关联关系特征、环境特征的识别方法,对潜在主题进行挖掘,找出兴趣相似的用户以及特定领域的活跃用户群体。
-
公开(公告)号:CN116628385A
公开(公告)日:2023-08-22
申请号:CN202310721796.9
申请日:2023-06-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958 , G06Q50/00 , G06F16/9536
Abstract: 本发明涉及社交网络技术领域,具体涉及基于多维度模型加权的高敏感性账号评估方法,本发明在对网站的账号进行评估时,首先获取待评估账号在网站中的社交行为的次数;然后计算待评估账号初始敏感性指标大小,基于改进HITS算法计算待评估账号影响力,并建立待评估账号最终影响力模型,采用多维度加权计算待评估账号敏感性权重,最后计算得到最终的待评估账号敏感性,在计算待评估账号影响力时,不需要进行用户权重的迭代计算,使得评估过程效率更高;另外,本发明在对网站的账号进行评估时,通过待评估账号在社交网络中的影响力和活跃性两个维度对待评估账号的敏感性进行评估,使得评估的准确率更高。
-
公开(公告)号:CN116186191A
公开(公告)日:2023-05-30
申请号:CN202210320305.5
申请日:2022-03-29
Applicant: 国家计算机网络与信息安全管理中心 , 北京理工大学
Abstract: 本发明涉及基于多维信息的任务匹配方法,属于基于大数据智能分析与挖掘技术领域。本发明是结合文本处理、机器学习方法、线性模型、动态规划等方法对相应文本进行处理,从而对文本所含“价值”进行分析,并借助大数据的手段将人工主观文本分析变为自动化完成,提高系统找到匹配结果的效率。本发明采用多种大数据分析的思想和多路召回的思想,对于同一任务会召回多个表单,每一个表单进行同样的操作,设置不同的权重,最后多路交集,从而可以取到更加准确的筛选结果,大大提高了工作效率。
-
-
-
-
-
-
-
-
-