-
公开(公告)号:CN109977287A
公开(公告)日:2019-07-05
申请号:CN201910242011.3
申请日:2019-03-28
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/9535 , G06F16/2458 , G06F16/215 , G06Q50/16
Abstract: 本发明涉及一种不同信息源的房产数据同一性判别方法,属于互联网数据分析与挖掘技术领域。所述同一性判别方法基于链家、我爱我家、中原、麦田网站公布的房屋数据及其相关性;通过分析房屋数据的特点,通过区域去重、小区去重以及房屋去重的三大步骤剔除重复的房屋数据,所述房屋数据是对实际的房屋客体的特点描述,虽然描述的角度和方式存在差异,但数据之间存在很强的相关性。所述方法能对来源于不同网站的房屋数据去重,能够准确、高效的对来源于不同信息源的房屋数据的同一性判别,并能有效去除重复区域、小区,可以实现面向多源异构的房屋数据的有效融合,为房地产市场分析提供“干净”,“整齐”的数据。
-
公开(公告)号:CN117411780A
公开(公告)日:2024-01-16
申请号:CN202311305424.4
申请日:2023-10-10
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L41/069 , H04L41/0631
Abstract: 本发明公开了一种基于多源数据特征的网络日志异常检测方法,包括多源网络设备数据接入,统一数据处理,统一日志模板提取,特征提取,多元算子融合,实时异常检测,离线批数据检测和异常告警;本发明简化了不同结构的网络日志的处理成本,相对于之前需要维护多种数据结构解析方法,本发明的统一数据处理方式和统一的日志模板提取方式,本发明的方式更加简单有效,且基于采集的多源网络日志数据实现了异常日志的多因子算法预测分析。
-
公开(公告)号:CN117113197A
公开(公告)日:2023-11-24
申请号:CN202311179240.8
申请日:2023-09-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/241 , G06F18/10 , G06F18/22 , G06F18/213
Abstract: 本发明公开了一种基于社区发现的微博群体识别方法,包括以下步骤:S1、数据收集与清洗;S2、特征提取与表示;S3、建立分类模型;S4、社群标签和影响力分析。本发明中,通过利用优化的动态主题模型DTM来挖掘微博社区中的特定群体,利用选取近一年的微博博文作为研究对象,将不同作者博文的主题相似度作为作者之间链接的权重,将微博网络映射为有向加权网络,结合标签传播算法LPA进行社区发现,识别出社交关系网络中固有的社区结构,本发明对微博网络的用户关系进行深入分析,基于用户产生内容特征、用户关联关系特征、环境特征的识别方法,对潜在主题进行挖掘,找出兴趣相似的用户以及特定领域的活跃用户群体。
-
公开(公告)号:CN116628385A
公开(公告)日:2023-08-22
申请号:CN202310721796.9
申请日:2023-06-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958 , G06Q50/00 , G06F16/9536
Abstract: 本发明涉及社交网络技术领域,具体涉及基于多维度模型加权的高敏感性账号评估方法,本发明在对网站的账号进行评估时,首先获取待评估账号在网站中的社交行为的次数;然后计算待评估账号初始敏感性指标大小,基于改进HITS算法计算待评估账号影响力,并建立待评估账号最终影响力模型,采用多维度加权计算待评估账号敏感性权重,最后计算得到最终的待评估账号敏感性,在计算待评估账号影响力时,不需要进行用户权重的迭代计算,使得评估过程效率更高;另外,本发明在对网站的账号进行评估时,通过待评估账号在社交网络中的影响力和活跃性两个维度对待评估账号的敏感性进行评估,使得评估的准确率更高。
-
公开(公告)号:CN111581370B
公开(公告)日:2023-06-23
申请号:CN202010310036.5
申请日:2020-04-20
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F16/335 , G06F16/951 , G06F16/9536 , G06F40/242 , G06Q10/0637 , G06Q50/00
Abstract: 本发明公开了一种综合多通道数据来源的网络舆情热度评估方法,包括:步骤一、收集各通道的流数据;步骤二、量化流数据对于目标事件的敏感值和情绪标签;步骤三、基于敏感度和影响力量化得到主体指标值;步骤四、基于敏感消息数、各类情绪标签对应的消息数,量化得到内容指标值;步骤五、基于每日的消息数、用户数、群组数,量化得到传播指标值;步骤六、基于主体指标值、内容指标值、传播指标值,量化得到各通道的综合热度值,并计算得到目标事件当日的总热度值。本方法建立了普适的网络舆情热度评估指标体系,评估结果更准确全面。本发明还公开了一种综合多通道数据来源的网络舆情热度评估装置,本装置对网络舆情热度的评估更准确全面。
-
公开(公告)号:CN116186191A
公开(公告)日:2023-05-30
申请号:CN202210320305.5
申请日:2022-03-29
Applicant: 国家计算机网络与信息安全管理中心 , 北京理工大学
Abstract: 本发明涉及基于多维信息的任务匹配方法,属于基于大数据智能分析与挖掘技术领域。本发明是结合文本处理、机器学习方法、线性模型、动态规划等方法对相应文本进行处理,从而对文本所含“价值”进行分析,并借助大数据的手段将人工主观文本分析变为自动化完成,提高系统找到匹配结果的效率。本发明采用多种大数据分析的思想和多路召回的思想,对于同一任务会召回多个表单,每一个表单进行同样的操作,设置不同的权重,最后多路交集,从而可以取到更加准确的筛选结果,大大提高了工作效率。
-
公开(公告)号:CN114900360A
公开(公告)日:2022-08-12
申请号:CN202210512158.1
申请日:2022-05-12
Applicant: 国家计算机网络与信息安全管理中心山西分中心
IPC: H04L9/40 , H04L67/02 , H04L61/4511
Abstract: 本发明适用于域名解析服务的技术领域,提供了一种检测HTTPS流量中的DoH流量方法,通过建立公共DoH域名对应的IP地址库,识别公共DoH流量,然后识别非公共地址的DoH流量,本发明通过利用网络数据包的强特征,从HTTPS与DoH的网络数据报文中,寻找不同点;由于识别依靠网络数据报文,因此具备检测范围广,适配更多的网络场景并且误报率低。
-
公开(公告)号:CN113312478B
公开(公告)日:2022-07-19
申请号:CN202110445975.5
申请日:2021-04-25
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06K9/62 , G06F40/216 , G06N5/02
Abstract: 本发明公开了基于阅读理解的观点挖掘方法,包括:构建领域情感观点知识库,其内包含领域情感观点词,每个领域情感观点词对应一个情感分类标签和一个立场分类标签;基于所述领域情感观点知识库和事件观点训练文本集,对预训练语言模型进行训练,获得情感预训练语言模型,所述情感预训练语言模型中嵌入有表示输入文本的情感和观点信息;从待抽取事件文本中抽取事件观点文本;将所述事件观点文本输入所述情感预训练语言模型中,并对其输出的内容进行编码、句子特征提取和分类,获得待抽取事件文本中观点的情感和立场;以及,基于阅读理解的观点挖掘装置。本发明具有使观点挖掘结果更加准确的优点。
-
公开(公告)号:CN110442421A
公开(公告)日:2019-11-12
申请号:CN201910578655.X
申请日:2019-06-28
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F9/455
Abstract: 本发明提出一种基于Kubernetes的通用服务转换方法和系统,包括:构建由多个节点构成的Kubernetes系统,其中节点的Pod设有用于提供服务的原服务容器,并通过在Pod中新添加容器的方式或通过原容器镜像的方式,在节点的Pod中加入转换程序;每当发生一次服务调用请求,转换容器或程序根据配置,将服务调用请求转换为原服务执行请求,通过调用原服务容器,提供相对应的服务,并转换成该服务调用请求所对应的服务结果。本发明可解决Kubernetes服务与调用者之间接口不一致的问题;并可减少转换程序与服务程序、调用程序之间的网络开销,同时结合Kubernetes特性,服务程序重新部署时,转换程序自动跟随部署。
-
公开(公告)号:CN110414680A
公开(公告)日:2019-11-05
申请号:CN201910667447.7
申请日:2019-07-23
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了基于众包标注的知识加工系统,包括:粗知识管理模块,其用于导入待标注知识;任务发布模块,其用于生成标注任务并发布,所述标注任务包括待标注知识、标注员、审核员和标注字段;知识标注模块,其用于对所述标注任务进行标注处理,并将已处理的标注任务生成审核任务;知识审核模块,其用于对所述审核任务对应的标注结果进行审核处理。本发明采用众包标注的形式进行知识加工,加工过程辅以机器学习进行自动抽取,通过人机结合的知识加工过程,形成有效的综合知识库。
-
-
-
-
-
-
-
-
-