Patent search ap:("国家计算机网络与信息安全管理中心" OR "中国科学院计算技术研究所") AND inv:"王秀文" Page 2

11.

发明授权
一种可保持titan实时数据一致性的高效并行加载方法有权

公开(公告)号：CN107038260B

公开(公告)日：2020-03-10

申请号：CN201710390469.4

申请日：2017-05-27

Applicant: 国家计算机网络与信息安全管理中心 , 北京赛思信安技术股份有限公司

Inventor： 毛洪亮 , 唐积强 , 王秀文 , 李焱余 , 苏沐冉 , 马秀娟 , 吴震 , 徐小磊 , 张露晨 , 李传海 , 李斌斌 , 蒲路 , 谢铭

IPC: G06F16/215 , G06F16/23 , G06F16/2457 , G06F16/25

Abstract: 本发明公开了一种可保持titan实时数据一致性的高效并行加载方法，属于大数据处理领域；首先，将titan划分为7个并行工作的模块，清洗规则管理模块实时更新过滤规则；数据接收模块接收pieceOfData放入queue1中；数据清洗模块过滤合格数据放入queue2中；ID转换模块与高速索引模块交互，判断当前pieceOfData中的两个点与titan ID的对应关系是否存在与图数据库中；如果是，将titan内部ID属性与ID值替换点保存到pieceOfDataT中，放入到queue4中；否则，将未加载的点放入HashSet中，并将对应的pieceOfData放入queue3中；剩余数据加载模块多线程并行将pieceOfDataT加载到titan中；点加载模块负责将HashSet中点加入titan，将点与titan ID的对应关系加入高速索引模块。本发明每个模块独自或交互完成部分功能，从而实现整体上加载效率的提升。

12.

发明公开
一种用于舆情爬取的机构特征词汇扩展系统和方法有权

公开(公告)号：CN110852090A

公开(公告)日：2020-02-28

申请号：CN201911080694.3

申请日：2019-11-07

Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心

Inventor： 刘少杰 , 贺敏 , 杜慧 , 孙庆 , 王秀文 , 董琳 , 郭富民 , 杜漫 , 余智华

IPC: G06F40/284 , H04L12/24

Abstract: 本发明提供了一种用于舆情爬取的机构特征词汇扩展系统，包括：数据采集模块：用于采集数据；特征词清洗加工模块：用于对特征词进行初步筛选；特征词统计分析模块：用于通过相关度分析，进一步筛选特征词，最终生成拓展特征词。本发明另一方面提供了一种用于舆情爬取的机构特征词汇扩展方法，采用上述方案，筛选掉无用特征词并进行分析，生成拓展特征词，全面、快速采集相关舆情信息，一方面有效的避免了漏查情况的发生，另一方面也减少了无用特征词增加无用的数据，提高检索效率和质量，减少内存的占用。

13.

发明公开
一种基于企业关联关系的工商高管人名消歧方法有权

公开(公告)号：CN110020433A

公开(公告)日：2019-07-16

申请号：CN201910256769.2

申请日：2019-04-01

Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心

Inventor： 杜漫 , 贺敏 , 杜慧 , 王秀文 , 王坤 , 王凡凡 , 孙庆

IPC: G06F17/27 , G06F16/35 , G06Q50/00

Abstract: 本发明公开了一种基于企业关联关系的工商高管人名消歧方法，涉及实体消歧领域，包括以下步骤：将待消歧数据集U，按高管姓名划分成组n个高管姓名组A；根据步骤S1得到的姓名组划分结果，对每个组A，构建N层以内的高管及企业关联关系网络G；针对每个姓名组A，根据密切度计算规则，计算姓名组A中高管节点之间的关联密切度f；根据关联密切度构建聚类函数CL，使用层次聚类算法得到消歧结果。本发明能自动化对工商高管人名进行消歧，具有较高的消歧准确率，且具有一定的阈值设置灵活性，可满足较多应用场景的工商高管人名消歧；同时可构建高管任职关联关系、高管投资关联关系，为高管全视角的关联图谱分析提供支撑。

14.

发明授权
一种哈希表元素失效删除方法有权

公开(公告)号：CN104077343B

公开(公告)日：2018-08-24

申请号：CN201310739486.6

申请日：2013-12-26

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 张慧 , 贺龙涛 , 李镇 , 李城龙 , 王秀文 , 熊刚 , 李静 , 曹首峰 , 于贺威 , 王大伟 , 金暐 , 李真真

IPC: G06F17/30

Abstract: 本发明提供了一种哈希表元素失效删除方法，解决哈希表失效元素及时删除的问题。该方法通过为每个哈希桶提供超时时间Tbucket，为每个关键码提供超时时间Tkey，两个时间粒度进行不同元素插入、查询时，更新每个关键码值Tkey，并将最新访问的关键码值放置到哈希桶最优先访问的位置上，在此过程中，根据哈希桶超时时间Tbucket设定，检查哈希桶上具有相同哈希值的关键码，如果元素超时，即删除失效元素，同时根据哈希桶扫描策略，检查哈希表其他哈希桶元素上的其他关键码值，并删除因超时失效的元素。

15.

发明公开
一种发现互联网金融舆情监管目标的方法无效

公开(公告)号：CN108009219A

公开(公告)日：2018-05-08

申请号：CN201711166896.0

申请日：2017-11-21

Applicant: 国家计算机网络与信息安全管理中心 , 中科天玑数据科技股份有限公司

Inventor： 吴震 , 王秀文 , 唐兆涵 , 苏沐冉 , 冯凯 , 李秀旺 , 牛广方

IPC: G06F17/30 , G06Q40/00

Abstract: 本发明公开了一种发现互联网金融舆情监管目标的方法，涉及互联网金融大数据领域。所述方法包括：实时获取备选互联网金融企业的网站地址，并将所述网站地址存储在网页待解析库中；对网页待解析库中新增的网站地址所对应的网页解析，得到备选互联网金融企业的名称，将验证成功后的名称作为互联网金融企业监测目标，完成发现互联网金融舆情监管目标。本发明所述方法自动发现互联网金融企业目标，找到其对应的网站地址，通过初期配置后自循环发现，不需要长期人工干预，通过长期运行有效地发现新增互联网金融企业目标。

16.

发明公开
一种基于学习的即时通信会话切分技术与方法有权

公开(公告)号：CN107066450A

公开(公告)日：2017-08-18

申请号：CN201710391483.6

申请日：2017-05-27

Applicant: 国家计算机网络与信息安全管理中心 , 北京赛思信安技术股份有限公司

Inventor： 唐积强 , 马秀娟 , 李传海 , 毛洪亮 , 吴震 , 李焱余 , 苏沐冉 , 王秀文 , 徐小磊 , 张露晨 , 王海平 , 王峰

IPC: G06F17/27 , G06F17/30

Abstract: 本发明公开了一种基于学习的即时通信会话切分技术与方法，属于大数据分析领域；将即时通信会话用户两两划分为一组，并将每组的会话话单明细进行分类和基于时间排序；会话切分为：依次选取相邻两条话单R1和R2，计算时间间隔Δt，文本内容相似度Δsim和距离值F(R1,R2)；如果F(R1,R2)

17.

发明授权
一种基于股权穿透的指定企业派系归属分析方法及系统有权

公开(公告)号：CN111382181B

公开(公告)日：2024-08-02

申请号：CN202010183474.X

申请日：2020-03-16

Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心

Inventor： 王锟 , 吴震 , 王凡凡 , 唐积强 , 王秀文 , 施力 , 郭富民 , 杜漫 , 张凯 , 余智华 , 张鸣 , 林未未

IPC: G06F16/2455 , G06Q40/06 , G06Q40/04 , G06Q10/0635

Abstract: 本发明涉及数据处理的技术领域，具体涉及一种基于股权穿透的指定企业派系归属分析方法及系统，包括对每个待分析企业信息数据进行采集存储，得到原始信息数据，信息数据包括股东信息数据；根据原始信息数据对每个待分析企业向上发散计算股权链路占比，并确定所述每个待分析企业的全部股东，所述全部股东包括最终股东；通过检索出与所述最终股东相关的关联待分析企业，生成与最终股东相关的第一派系信息数据；对第一派系信息数据进行合并，生成最终派系信息数据；通过对股东信息进行采集存储以及分析，从而计算出每个待分析企业的向上发散计算股权链路占比。对待分析企业进行了基于最终股东的集合划分，为企业关联分析提供支撑。

18.

发明授权
一种用于舆情爬取的机构特征词汇扩展系统和方法有权

公开(公告)号：CN110852090B

公开(公告)日：2024-03-19

申请号：CN201911080694.3

申请日：2019-11-07

Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心

Inventor： 刘少杰 , 贺敏 , 杜慧 , 孙庆 , 王秀文 , 董琳 , 郭富民 , 杜漫 , 余智华

IPC: G06F40/284 , H04L41/147

Abstract: 本发明提供了一种用于舆情爬取的机构特征词汇扩展系统，包括：数据采集模块：用于采集数据；特征词清洗加工模块：用于对特征词进行初步筛选；特征词统计分析模块：用于通过相关度分析，进一步筛选特征词，最终生成拓展特征词。本发明另一方面提供了一种用于舆情爬取的机构特征词汇扩展方法，采用上述方案，筛选掉无用特征词并进行分析，生成拓展特征词，全面、快速采集相关舆情信息，一方面有效的避免了漏查情况的发生，另一方面也减少了无用特征词增加无用的数据，提高检索效率和质量，减少内存的占用。

19.

发明公开
目标关系的识别方法及装置审中-实审

公开(公告)号：CN116561244A

公开(公告)日：2023-08-08

申请号：CN202310403811.5

申请日：2023-04-14

Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司

Inventor： 王秀文 , 杨菁林 , 李美燕 , 赵磊 , 陈鹏云 , 李林 , 徐丹丹 , 秦韬 , 李娅强 , 曾宣玮 , 张栋 , 王峰 , 李政达 , 秦恺

IPC: G06F16/31 , G06F16/35 , G06F40/289 , G06F16/36 , G06F18/214 , G06F18/24 , G06F40/30 , G06N3/0499 , G06N3/0895

Abstract: 本发明实施例涉及一种目标关系的识别方法及装置，所述方法包括：获取目标关系对应的训练数据集和检测数据集；根据上下句预测和掩码预测对联合模型进行模型预训练，得到训练好的联合抽取预训练模型；将所述训练数据集输入到所述联合抽取预训练模型中进行模型训练，得到训练好的联合抽取模型；将所述检测数据集输入到所述联合抽取模型中进行数据抽取处理，得到检测抽取结果；根据所述检测抽取结果确定所述检测数据集对应目标关系的识别结果。通过将检测数据集输入到训练好的联合抽取模型中，实现数据抽取，得到检测抽取结果，将在抽取到的检测抽取结果进行判断分析，确定所述检测数据集的识别结果；由本方案，可以实现企业关系、资本谱系或实体关系的快速识别的技术效果。

20.

发明公开
包含文本信息的结构图的处理方法、电子设备、存储介质审中-实审

公开(公告)号：CN116092102A

公开(公告)日：2023-05-09

申请号：CN202211714858.5

申请日：2022-12-27

Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司

Inventor： 王秀文 , 李美燕 , 金忠良 , 刘纯艳 , 王峰 , 刘鑫 , 吴震 , 吴迪 , 李娅强 , 杨菁林 , 曾宣玮 , 刘志丞

IPC: G06V30/412 , G06V30/413 , G06V30/18 , G06V30/162 , G06V30/148 , G06V30/19 , G06V10/44 , G06V10/26 , G06V10/28 , G06V10/48 , G06V10/764 , G06V10/82 , G06N3/044 , G06N3/08

Abstract: 本发明公开了一种包含文本信息的结构图的处理方法，所述方法包括：基于包含文本信息的结构图的线段组成进行轮廓检测；根据检测出的轮廓拟合出几何多边形；基于所述结构图中文本框的特征条件，从所述几何多边形中过滤掉不符合所述特征条件的形状，得到边框。本发明能够从包含有文本信息的结构图中高效、准确地提取出边框。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification