Patent search ap:("北京赛思信安技术股份有限公司") AND inv:"王振宇" Page 1

1.

发明授权
一种面向分布式数据仓库的加载客户端实现方法有权

公开(公告)号：CN106446168B

公开(公告)日：2019-11-01

申请号：CN201610849787.8

申请日：2016-09-26

Applicant: 北京赛思信安技术股份有限公司 , 国家计算机网络与信息安全管理中心

Inventor： 王宇 , 徐晓燕 , 周渊 , 刘利宏 , 刘庆良 , 郑彩娟 , 黄成 , 王振宇 , 李斌斌 , 周游

IPC: G06F16/25

Abstract: 本发明公开了一种面向分布式数据仓库的高效加载客户端实现方法，属于信息处理领域；具体为：首先，初始化系统启动参数；加载器管理模块为每个线程各申请一个加载器；每个线程各创建一个数据解析模块，对客户端数据进行解析并传输给加载器；每个加载器分别调用数据校验模块进行检验；然后，将检验后的字段数据缓存到数据缓存模块，进行管理并传输给数据传输模块；通过分布式节点监听模块获取每个分布式数据仓库的监听状态，并发送给数据传输模块；最后，数据传输模块将收到的缓存数据发送给健康的分布式数据仓库。本发明提升了整个分布式数据仓库的使用效率和数据加载效率，符合目前的应用需求，具有广阔的应用前景。

2.

发明公开
一种基于Storm的流数据正则匹配方法有权

公开(公告)号：CN109871502A

公开(公告)日：2019-06-11

申请号：CN201910047920.1

申请日：2019-01-18

Applicant: 北京赛思信安技术股份有限公司

Inventor： 王振宇 , 孟宪文 , 李斌斌

IPC: G06F16/958 , G06F16/957

Abstract: 本发明提供了一种基于Storm的流数据正则匹配方法，属于计算机技术领域。本方法包括：搭建实时处理集群，使用Kafka集群作为数据缓存模块，将原始数据进行序列化后打包到一个Message中，加载到Kafka消息队列；订阅Kafka中某个Topic的数据，获取的Message数据按序填入Storm的单元Tuple中，直接将Tuple发送给计算算子Bolt；Bolt对Tuple拆包，对得到的Message数据解包并进行反序列化，将反序列化后的有效数据分块进行模式匹配。本发明保证了数据在Storm集群中传输的批量处理，提高了数据在Storm实时计算集群中的传输效率，并提高了正则匹配的效率。

3.

发明公开
一种基于HBase的海量文件分区索引方法无效

公开(公告)号：CN109726177A

公开(公告)日：2019-05-07

申请号：CN201811635130.7

申请日：2018-12-29

Applicant: 北京赛思信安技术股份有限公司

Inventor： 李斌斌 , 孟宪文 , 王振宇

IPC: G06F16/13 , G06F16/16

Abstract: 本发明公开了一种基于HBase的海量文件分区索引方法，属于计算机领域。加载配置文件，对存储系统HBase按照配置规则进行配置；对写入的某个小文件提取元数据；根据各个元数据，分别计算该文件需要写入的桶的分区；拼接出唯一Hash码作为该小文件的Rowkey，若该Rowkey存在于分区索引表，将元数据中记录的版本编号加1，并删除老版本元数据；若不存在则当该小文件的内容需要实时合并时，将该文件的内容追加到实时文件合并窗口中，等待文件进行实时合并。将所有小文件进行存储，读取每个小文件的元数据表，并进行更新，利用文件分区索引进行读取和删除。本发明减小海量文件元数据压力，提高文件的读取删除速度，方便文件进行分区管理，具有很广泛的应用前景。

4.

发明公开
一种基于HBase的海量文件离线分区管理方法无效

公开(公告)号：CN109726175A

公开(公告)日：2019-05-07

申请号：CN201811635129.4

申请日：2018-12-29

Applicant: 北京赛思信安技术股份有限公司

Inventor： 李斌斌 , 王振宇 , 苏连超

IPC: G06F16/11 , G06F16/13 , G06F16/17

Abstract: 本发明公开了一种基于HBase的海量文件离线分区管理方法，属于计算机领域。首先用户创建自定义的存储桶，加载关于桶的分区规则配置；按照桶的分区规则，给用户即将写入的小文件设定存储分区表的名称；然后按照业务需求和HBase数据存储的规则，为用户即将写入的小文件设计指定在存储分区表中的Rowkey，以RowKey作为每个小文件的唯一标示，自动将小文件写入当前时间段下的该桶的存储分区表中。最后用户指定该存储逻辑单元-桶的数据存储空间配额和时间配额，系统根据空间配额和时间配额的限定定期对存储分区表的数据进行离线管理；同时系统离线预建下一时间段的存储分区表。本发明具有很强的实用性，具有很广泛的应用前景。

5.

发明公开
一种基于海量数据类SQL检索场景的自动识别优化方法有权

公开(公告)号：CN106484815A

公开(公告)日：2017-03-08

申请号：CN201610849786.3

申请日：2016-09-26

Applicant: 北京赛思信安技术股份有限公司 , 国家计算机网络与信息安全管理中心

Inventor： 王宇 , 徐晓燕 , 周渊 , 刘庆良 , 郑彩娟 , 王振宇 , 黄成 , 李斌斌 , 周游 , 刘斌斌

IPC: G06F17/30

CPC classification number: G06F17/30442 , G06F17/30321 , G06F17/30427

Abstract: 本发明提供了一种基于海量数据类SQL检索场景的自动识别优化方法，属于海量数据统计分析领域。本发明通过五方面来进行优化：引入lucene作为可选存储介质；对每个数据文件的检索字段增加bloomfilter索引(bf索引)；对不同检索场景的划分及最优存储介质的选择；在进行lucene检索场景时，将类SQL语句转换为lucene语句；对lucene存储介质和bf索引添加有效性的会话级设置。在检索时，首先判定bf索引会话级的有效性，通过bf索引缩小待检索数据文件列表，再判定lucene存储介质的会话级有效性。本发明有效降低了海量数据检索时集群的资源消耗，大幅度提升了海量数据的检索性能。

6.

发明公开
海量电子邮件分析处理过程中的电子邮件内容重复判断的方法无效

公开(公告)号：CN105871705A

公开(公告)日：2016-08-17

申请号：CN201610397804.9

申请日：2016-06-07

Applicant: 北京赛思信安技术股份有限公司

Inventor： 李斌斌 , 郑彩娟 , 刘利宏 , 王振宇

IPC: H04L12/58

CPC classification number: H04L51/043 , H04L51/08 , H04L51/12

Abstract: 本发明公开了一种海量电子邮件分析处理过程中的电子邮件内容重复判断的方法，其特征在于，包括以下几个步骤：步骤一：分解电子邮件内容；步骤二：对电子邮件内容中各个部分进行重复判断；步骤三：对电子邮件内容进行重新组织；本发明可以对海量的电子邮件进行内容重复的判断，有效的降低了海量电子邮件处理过程中因电子邮件处理内容处理带来的资源开销。

7.

发明授权
一种基于HBase的文件分片方法有权

公开(公告)号：CN109710572B

公开(公告)日：2021-02-02

申请号：CN201811638552.X

申请日：2018-12-29

Applicant: 北京赛思信安技术股份有限公司

Inventor： 王振宇 , 李斌斌 , 苏连超

IPC: G06F16/13 , G06F16/16

Abstract: 本发明公开了一种基于HBase的文件分片方法，属于计算机领域。首先从系统中读取对大文件分片的配置文件和按分片粒度进行读取的配置文件，对某个大文件进行分片。文件内容的写入读取按分片的顺序进行，通过多个并列线程将每个分片的内容以独立的键值存入HBase数据表中。同时将每个分片的元数据信息以新增列的方式存储在HBase元数据信息表中。然后若文件内容的写入读取是指定片，按照指定的分片编号写入读取文件内容；若文件内容的写入读取是随机读取，设定随机读取的字节开始位置和读取内容大小；最后当服务端异常导致写入或读取中断，在服务恢复后重新上传或读取断点的分片即可。本发明使大文件存储更加高效可靠，具有较强的实用性和适配性。

8.

发明授权
一种基于海量数据类SQL检索场景的自动识别优化方法有权

公开(公告)号：CN106484815B

公开(公告)日：2019-04-12

申请号：CN201610849786.3

申请日：2016-09-26

Applicant: 北京赛思信安技术股份有限公司 , 国家计算机网络与信息安全管理中心

Inventor： 王宇 , 徐晓燕 , 周渊 , 刘庆良 , 郑彩娟 , 王振宇 , 黄成 , 李斌斌 , 周游 , 刘斌斌

IPC: G06F16/2453 , G06F16/22 , G06F16/2452

Abstract: 本发明提供了一种基于海量数据类SQL检索场景的自动识别优化方法，属于海量数据统计分析领域。本发明通过五方面来进行优化：引入lucene作为可选存储介质；对每个数据文件的检索字段增加bloomfilter索引(bf索引)；对不同检索场景的划分及最优存储介质的选择；在进行lucene检索场景时，将类SQL语句转换为lucene语句；对lucene存储介质和bf索引添加有效性的会话级设置。在检索时，首先判定bf索引会话级的有效性，通过bf索引缩小待检索数据文件列表，再判定lucene存储介质的会话级有效性。本发明有效降低了海量数据检索时集群的资源消耗，大幅度提升了海量数据的检索性能。

9.

发明授权
一种基于Storm的流数据正则匹配方法有权

公开(公告)号：CN109871502B

公开(公告)日：2020-10-30

申请号：CN201910047920.1

申请日：2019-01-18

Applicant: 北京赛思信安技术股份有限公司

Inventor： 王振宇 , 孟宪文 , 李斌斌

IPC: G06F16/958 , G06F16/957

Abstract: 本发明提供了一种基于Storm的流数据正则匹配方法，属于计算机技术领域。本方法包括：搭建实时处理集群，使用Kafka集群作为数据缓存模块，将原始数据进行序列化后打包到一个Message中，加载到Kafka消息队列；订阅Kafka中某个Topic的数据，获取的Message数据按序填入Storm的单元Tuple中，直接将Tuple发送给计算算子Bolt；Bolt对Tuple拆包，对得到的Message数据解包并进行反序列化，将反序列化后的有效数据分块进行模式匹配。本发明保证了数据在Storm集群中传输的批量处理，提高了数据在Storm实时计算集群中的传输效率，并提高了正则匹配的效率。

10.

发明公开
一种基于HBase的文件分片方法有权

公开(公告)号：CN109710572A

公开(公告)日：2019-05-03

申请号：CN201811638552.X

申请日：2018-12-29

Applicant: 北京赛思信安技术股份有限公司

Inventor： 王振宇 , 李斌斌 , 苏连超

IPC: G06F16/13 , G06F16/16

Abstract: 本发明公开了一种基于HBase的文件分片方法，属于计算机领域。首先从系统中读取对大文件分片的配置文件和按分片粒度进行读取的配置文件，对某个大文件进行分片。文件内容的写入读取按分片的顺序进行，通过多个并列线程将每个分片的内容以独立的键值存入HBase数据表中。同时将每个分片的元数据信息以新增列的方式存储在HBase元数据信息表中。然后若文件内容的写入读取是指定片，按照指定的分片编号写入读取文件内容；若文件内容的写入读取是随机读取，设定随机读取的字节开始位置和读取内容大小；最后当服务端异常导致写入或读取中断，在服务恢复后重新上传或读取断点的分片即可。本发明使大文件存储更加高效可靠，具有较强的实用性和适配性。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification