Patent search ap:("国家计算机网络与信息安全管理中心" OR "中国科学院信息工程研究所") AND inv:"王振宇" Page 1

1.

发明授权
一种界标窗口下域名数据重复检测快速索引方法失效

公开(公告)号：CN104794158B

公开(公告)日：2018-11-13

申请号：CN201510117236.8

申请日：2015-03-17

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 云晓春 , 徐小琳 , 李高超 , 郑礼雄 , 王树鹏 , 王勇 , 王振宇

IPC: G06F17/30

Abstract: 本发明涉及一种界标窗口下域名数据重复检测快速索引方法。该方法将界标窗口根据子界标分成多个子窗口，通过稳定性布隆过滤器和字典树维护各子窗口的数据项；针对网络数据流自适应地调整索引策略，在数据较为密集时采用稳定性布隆过滤器，在数据相对稀疏时采用字典树索引策略。在域名数据重复检测的适配方面，本发明提出将域名数据翻转，形成重叠前缀字符串比率较高的数据集，有利于后续字典树的快速匹配和存储容量缩减。本发明能够降低索引维护的空间，提升元素重复检测的效率，并能够扩展到分布式场景下，有效解决网络监控应用中域名数据重复检测的问题，同时，本发明可以扩展到分布式计算场景下，便于计算性能线性提升。

2.

发明授权
一种海量非结构化数据的数据存储方法失效

公开(公告)号：CN104731864B

公开(公告)日：2018-05-29

申请号：CN201510088785.7

申请日：2015-02-26

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 王琦 , 刘阳 , 杨鹏 , 陈训逊 , 王树鹏 , 王勇 , 王振宇

IPC: G06F17/30

Abstract: 本发明公开了一种海量非结构化数据的数据存储方法。本方法为：1)设定一时间间隔T，将数据存储集群划分为多个分区，用于将同一时间间隔T内的记录存储到同一分区内；同时将每一分区划分为n个散列区；2)对于每条非结构化记录，提取其产生的时间t以及一个或多个唯一表示该记录的关键信息key；3)根据每条记录的时间t，确定其要存储到的分区，然后根据该记录的关键信息key计算其在该分区中对应的散列区值；4)根据步骤3)的计算结果，将属于同一时间间隔且散列区值相同的记录写入同一文件F中并统计该文件F的记录数，如果记录数大于设定阈值K，则在当前散列区中创建另一文件进行存储。本发明存储方法能够大大提升了数据检索效率。

3.

发明授权
一种基于配置文件和日志文件的跨组件数据流向审计方法和系统失效

公开(公告)号：CN113271220B

公开(公告)日：2022-10-14

申请号：CN202110340162.X

申请日：2021-03-30

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 马秉楠 , 王振宇 , 贾思宇

IPC: H04L41/04 , H04L41/069 , H04L41/0823 , H04L41/14 , H04L41/22 , H04L67/06 , H04L67/1097 , H04L67/30 , H04L9/40

Abstract: 本发明涉及一种基于配置文件和日志文件的跨组件数据流向审计方法和系统。该方法的步骤包括：采集大数据平台中各个组件的配置文件和日志文件；根据采集的配置文件和日志文件，识别分布式环境下部署在不同物理服务器上的大数据组件；根据识别出的大数据组件并结合日志文件中的信息，构建跨组件的数据流向图；根据数据流向图进行数据流向的异常判定及告警。本发明通过采集各个组件的配置文件、运行日志文件、审计日志文件实现交叉验证，实现高精度的组件识别，结合凝练的安全审计模型，实现大数据平台整体数据流转情况的采集，进而支持业务流程中不同环节的数据使用情况审计，并能够对异常任务、异常数据使用场景进行识别和告警。

4.

发明授权
一种面向Namenode的高效元数据构建和RPC性能提升的方法和装置有权

公开(公告)号：CN112241365B

公开(公告)日：2022-09-30

申请号：CN202010722288.9

申请日：2020-07-24

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 马秉楠 , 惠榛 , 郭舒 , 沈时军 , 李春程 , 刘德朋 , 贾思宇 , 王振宇 , 李斌斌 , 王树鹏

IPC: G06F11/36 , G06F16/182 , G06F9/54

Abstract: 本发明涉及一种面向Namenode的高效元数据构建和RPC性能提升的方法和装置。该方法通过性能测试工具中的创建文件功能构造文件对象，通过在内存中虚拟出的仅有基本结构的Datanode节点构造文件块对象，由文件对象和文件块对象构成Namenode内存元数据；基于构建的元数据，构造与生产环境相符的Namenode负载状态，并进行Namenode内部扩展和集群扩展，实现RPC性能优化。本发明能够高速构建Namenode元数据，为快速搭建接近生产环境的测试集群提供了帮助，全局锁的拆分能够提升RPC性能，多个Namenode协作管理集群且同时对外提供服务，提供了更高的读写吞吐量。

5.

发明授权
一种面向大流量实时图数据的低资源消耗的超级节点识别过滤方法和系统失效

公开(公告)号：CN109189743B

公开(公告)日：2021-09-28

申请号：CN201810671449.9

申请日：2018-06-26

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 黄亮 , 孙立远 , 曹开研 , 王振宇 , 李斌斌 , 王树鹏

IPC: G06F16/178 , G06F16/182 , H04L12/26 , H04L29/06

Abstract: 本发明公开一种面向大流量实时图数据的低资源消耗的超级节点识别过滤方法和系统，属于大数据预处理领域。该方法包括：1)接收图数据并对其进行格式转化；2)根据过滤规则对格式转化之后的数据进行过滤；3)识别过滤之后的数据中的超级节点，并根据识别出的超级节点对所述过滤规则进行动态修改。该系统包括数据接收模块、数据过滤模块、过滤规则管理模块以及超级节点识别模块。本发明可在海量实时图数据流中识别出超级节点，是一种低资源消耗的超级节点识别方案，只需极少资源就可以在海量数据中识别出超级节点。

6.

发明公开
一种基于配置文件和日志文件的跨组件数据流向审计方法和系统失效

公开(公告)号：CN113271220A

公开(公告)日：2021-08-17

申请号：CN202110340162.X

申请日：2021-03-30

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 马秉楠 , 王振宇 , 贾思宇

IPC: H04L12/24 , H04L29/06 , H04L29/08

Abstract: 本发明涉及一种基于配置文件和日志文件的跨组件数据流向审计方法和系统。该方法的步骤包括：采集大数据平台中各个组件的配置文件和日志文件；根据采集的配置文件和日志文件，识别分布式环境下部署在不同物理服务器上的大数据组件；根据识别出的大数据组件并结合日志文件中的信息，构建跨组件的数据流向图；根据数据流向图进行数据流向的异常判定及告警。本发明通过采集各个组件的配置文件、运行日志文件、审计日志文件实现交叉验证，实现高精度的组件识别，结合凝练的安全审计模型，实现大数据平台整体数据流转情况的采集，进而支持业务流程中不同环节的数据使用情况审计，并能够对异常任务、异常数据使用场景进行识别和告警。

7.

发明公开
一种面向Namenode的高效元数据构建和RPC性能提升的方法和装置有权

公开(公告)号：CN112241365A

公开(公告)日：2021-01-19

申请号：CN202010722288.9

申请日：2020-07-24

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 马秉楠 , 惠榛 , 郭舒 , 沈时军 , 李春程 , 刘德朋 , 贾思宇 , 王振宇 , 李斌斌 , 王树鹏

IPC: G06F11/36 , G06F16/182 , G06F9/54

Abstract: 本发明涉及一种面向Namenode的高效元数据构建和RPC性能提升的方法和装置。该方法通过性能测试工具中的创建文件功能构造文件对象，通过在内存中虚拟出的仅有基本结构的Datanode节点构造文件块对象，由文件对象和文件块对象构成Namenode内存元数据；基于构建的元数据，构造与生产环境相符的Namenode负载状态，并进行Namenode内部扩展和集群扩展，实现RPC性能优化。本发明能够高速构建Namenode元数据，为快速搭建接近生产环境的测试集群提供了帮助，全局锁的拆分能够提升RPC性能，多个Namenode协作管理集群且同时对外提供服务，提供了更高的读写吞吐量。

8.

发明公开
一种面向大流量实时图数据的低资源消耗的超级节点识别过滤方法和系统失效

公开(公告)号：CN109189743A

公开(公告)日：2019-01-11

申请号：CN201810671449.9

申请日：2018-06-26

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 黄亮 , 孙立远 , 曹开研 , 王振宇 , 李斌斌 , 王树鹏

IPC: G06F16/178 , G06F16/182 , H04L12/26 , H04L29/06

Abstract: 本发明公开一种面向大流量实时图数据的低资源消耗的超级节点识别过滤方法和系统，属于大数据预处理领域。该方法包括：1)接收图数据并对其进行格式转化；2)根据过滤规则对格式转化之后的数据进行过滤；3)识别过滤之后的数据中的超级节点，并根据识别出的超级节点对所述过滤规则进行动态修改。该系统包括数据接收模块、数据过滤模块、过滤规则管理模块以及超级节点识别模块。本发明可在海量实时图数据流中识别出超级节点，是一种低资源消耗的超级节点识别方案，只需极少资源就可以在海量数据中识别出超级节点。

9.

发明公开
一种界标窗口下域名数据重复检测快速索引方法失效

公开(公告)号：CN104794158A

公开(公告)日：2015-07-22

申请号：CN201510117236.8

申请日：2015-03-17

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 云晓春 , 徐小琳 , 李高超 , 郑礼雄 , 王树鹏 , 王勇 , 王振宇

IPC: G06F17/30

Abstract: 本发明涉及一种界标窗口下域名数据重复检测快速索引方法。该方法将界标窗口根据子界标分成多个子窗口，通过稳定性布隆过滤器和字典树维护各子窗口的数据项；针对网络数据流自适应地调整索引策略，在数据较为密集时采用稳定性布隆过滤器，在数据相对稀疏时采用字典树索引策略。在域名数据重复检测的适配方面，本发明提出将域名数据翻转，形成重叠前缀字符串比率较高的数据集，有利于后续字典树的快速匹配和存储容量缩减。本发明能够降低索引维护的空间，提升元素重复检测的效率，并能够扩展到分布式场景下，有效解决网络监控应用中域名数据重复检测的问题，同时，本发明可以扩展到分布式计算场景下，便于计算性能线性提升。

10.

发明公开
一种海量非结构化数据的数据存储方法失效

公开(公告)号：CN104731864A

公开(公告)日：2015-06-24

申请号：CN201510088785.7

申请日：2015-02-26

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 王琦 , 刘阳 , 杨鹏 , 陈训逊 , 王树鹏 , 王勇 , 王振宇

IPC: G06F17/30

CPC classification number: G06F17/30628 , G06F17/30132

Abstract: 本发明公开了一种海量非结构化数据的数据存储方法。本方法为：1)设定一时间间隔T，将数据存储集群划分为多个分区，用于将同一时间间隔T内的记录存储到同一分区内；同时将每一分区划分为n个散列区；2)对于每条非结构化记录，提取其产生的时间t以及一个或多个唯一表示该记录的关键信息key；3)根据每条记录的时间t，确定其要存储到的分区，然后根据该记录的关键信息key计算其在该分区中对应的散列区值；4)根据步骤3)的计算结果，将属于同一时间间隔且散列区值相同的记录写入同一文件F中并统计该文件F的记录数，如果记录数大于设定阈值K，则在当前散列区中创建另一文件进行存储。本发明存储方法能够大大提升了数据检索效率。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification