Patent search ap:("国家计算机网络与信息安全管理中心" OR "清华大学") AND inv:"张鸿" Page 1

1.

发明公开
一种基于二级倒排表的树状音频特征索引库建立方法无效

公开(公告)号：CN108664622A

公开(公告)日：2018-10-16

申请号：CN201810455198.0

申请日：2018-05-14

Applicant: 国家计算机网络与信息安全管理中心 , 清华大学

Inventor： 张卫强 , 袁庆升 , 刘艺 , 包秀国 , 张鸿 , 汪立东 , 杜翠兰 , 刘洋 , 刘加

IPC: G06F17/30

Abstract: 本发明公开了一种基于二级倒排表的树状音频特征索引库建立方法，所述音频特征索引库建立方法在数字集成电路芯片中进行以下步骤：步骤1：对音频数据库中的所有特征分段进行粗量化；步骤2：对步骤1中的粗量化残差进行二级粗量化；步骤3：对粗量化残差进行乘积矢量量化；步骤4：插入倒排表。

2.

发明公开
一种语种训练数据获得方法及装置有权

公开(公告)号：CN109741731A

公开(公告)日：2019-05-10

申请号：CN201910015434.1

申请日：2019-01-08

Applicant: 国家计算机网络与信息安全管理中心 , 清华大学

Inventor： 袁庆升 , 汪立东 , 包秀国 , 张鸿 , 时磊 , 张卫强 , 邵云飞

IPC: G10L15/00 , G10L15/06 , G10L15/32

Abstract: 本发明提供一种语种训练数据获得方法及装置，用以解决相关技术中语种训练数据质量较低的问题。该方法包括：训练用于识别各种语种的语种识别模型；使用各语种识别模型识别数据集中的第二音频数据，获得与各语种识别模型对应的得分；确定第二音频数据对应的识别语种；计算数据集中各条第二音频数据的得分信息熵；将所述数据集中，得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集，训练数据集中的第二音频数据用于训练所述语种识别模型，返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤，直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。

3.

发明授权
一种语种训练数据获得方法及装置有权

公开(公告)号：CN109741731B

公开(公告)日：2020-12-29

申请号：CN201910015434.1

申请日：2019-01-08

Applicant: 国家计算机网络与信息安全管理中心 , 清华大学

Inventor： 袁庆升 , 汪立东 , 包秀国 , 张鸿 , 时磊 , 张卫强 , 邵云飞

IPC: G10L15/00 , G10L15/06 , G10L15/32

Abstract: 本发明提供一种语种训练数据获得方法及装置，用以解决相关技术中语种训练数据质量较低的问题。该方法包括：训练用于识别各种语种的语种识别模型；使用各语种识别模型识别数据集中的第二音频数据，获得与各语种识别模型对应的得分；确定第二音频数据对应的识别语种；计算数据集中各条第二音频数据的得分信息熵；将所述数据集中，得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集，训练数据集中的第二音频数据用于训练所述语种识别模型，返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤，直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。

4.

发明授权
基于kubernetes的hdfs-hbase部署方法及装置有权

公开(公告)号：CN109885316B

公开(公告)日：2023-05-09

申请号：CN201910119277.9

申请日：2019-02-18

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 刘欣然 , 张鸿 , 吕雁飞 , 张晨飞 , 储小刚 , 马秉楠 , 惠榛 , 鹿林

IPC: G06F8/61

Abstract: 本发明公开了一种基于kubernetes的hdfs‑HBase部署方法，所述方法包括：计算层通过kubernetes模块获取服务器信息，打包基础镜像，并在所述镜像仓库中保存Hbase基础配置；在用户创建Hbase应用时，计算层通过管理页面获取用户输入的需求信息，修改Hbase基础配置，遴选服务器并打标签，并根据本次Hbase部署的需求信息，生成yaml文件，并调用所述kubernetes模块；所述kubernetes模块按照所述yaml文件要求部署并启动Hbase集群，并将所述Hbase集群添加到巡检队列中；所述巡检系统对所述巡检队列进行轮询。

5.

发明授权
支持HIVE自动分区的加载系统及其实现方法有权

公开(公告)号：CN109902126B

公开(公告)日：2021-12-07

申请号：CN201910119268.X

申请日：2019-02-18

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 刘欣然 , 张鸿 , 马秉楠 , 吕雁飞 , 惠榛 , 孟宪文

IPC: G06F16/27 , G06F16/2455

Abstract: 本发明公开了一种支持HIVE自动分区的加载系统及其实现方法，所述方法包括：数据源模块，用于接收数据，对数据进行预备分类，按照数据的来源和数据头上所携带的配置信息进行预处理，得到数据所需要写入的对应的HIVE表，将映射关系放入到数据头中，并将数据放入到数据通道；数据通道，用于作为所述数据源模块和所述输出接口模块之间的数据通道；输出接口模块，用于从数据通道中获取数据，对数据反序列化，进行进一步的校验，依据加载系统在HIVE中所获取的分区设置计算出分区，将与数据所对应的数据库名和表名一起作为数据写入hdfs中的key值，依据该key值，从文件写入管理模块中获取对应的文件句柄，将数据写入至hdfs或者其他存储介质中。

6.

发明公开
互联网基础资源及其关系模型、及模型的构建、应用方法失效

公开(公告)号：CN113079034A

公开(公告)日：2021-07-06

申请号：CN202110261760.8

申请日：2021-03-10

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 惠榛 , 张鸿 , 马秉楠 , 王大伟 , 党向磊 , 燕敬博 , 周润林 , 周波

IPC: H04L12/24 , H04L29/12 , H04L29/06

Abstract: 本发明公开了一种互联网基础资源及其关系模型、及模型的构建、应用方法。互联网基础资源及其关系模型构建方法，包括：将相同类型的互联网基础资源以集合的形式表示，以获得多个集合；获取每个互联网基础资源的属性以及各个互联网基础资源之间的关系；基于多个集合、每个互联网基础资源的属性以及各个互联网基础资源之间的关系，构建互联网基础资源及其关系模型。本发明为互联网基础资源提供一种描述方法，包括资源、资源之间的关系以及资源属性的定义，并在此基础上提供多个互联网资源之间的操作，用以支持对互联网上常用行为进行研究的支撑。

7.

发明授权
一种说话人分段聚类方法及装置有权

公开(公告)号：CN109859742B

公开(公告)日：2021-04-09

申请号：CN201910015449.8

申请日：2019-01-08

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所

Inventor： 袁庆升 , 包秀国 , 汪立东 , 张鸿 , 杜翠兰 , 王文超 , 颜永红 , 陈志高

IPC: G10L15/02 , G10L15/04 , G10L15/06 , G10L15/26 , G10L25/51

Abstract: 本发明提供一种说话人分段聚类方法及装置，以解决相关技术中处理短时说话人语音时，性能下降导致说话人聚类效果较差的问题。该方法包括：将待聚类语音划分为多个子语音段；通过权重联合概率线性判别分析WT‑PLDA模型对基于划分得到的各子语音段的I‑vector提取出各子语音段的特征信息W‑vector，所述WT‑PLDA模型的模型参数至少包括：均值向量、说话人子空间的投影矩阵、说话人因子的隐藏变量以及残差因子；通过概率线性判别分析PLDA根据划分后多个子语音段的所述W‑vector对该多个子语音段循环进行多次聚类，直至所述多个子语音段被聚类为两类。本发明提高了说话人的聚类效果。

8.

发明公开
基于SparkSQL的透明分区方法及装置失效

公开(公告)号：CN109902101A

公开(公告)日：2019-06-18

申请号：CN201910122512.8

申请日：2019-02-18

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 刘欣然 , 张鸿 , 吕雁飞 , 马秉楠 , 惠榛 , 徐庆 , 兰钢临

IPC: G06F16/2453 , G06F16/242

Abstract: 本发明公开了一种基于SparkSQL的透明分区方法及装置，所述方法包括：在建表语句提交后，获取用户在创建分区表时指定分区字段和采用的分区策略，通过SQL解析器确定透明分区并将透明分区信息进行保存；当用户通过SQL查询数据时，通过SQL解析生成逻辑执行计划；根据逻辑执行计划中的查询条件，并结合保存的透明分区信息计算出本次查询的数据分区，然后通过改写逻辑执行计划并生成优化后的物理执行计划；根据生成的物理执行计划的执行步骤划分出具体的任务，通过所述任务从所述数据分区中读取数据。

9.

发明公开
一种说话人分段聚类方法及装置有权

公开(公告)号：CN109859742A

公开(公告)日：2019-06-07

申请号：CN201910015449.8

申请日：2019-01-08

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所

Inventor： 袁庆升 , 包秀国 , 汪立东 , 张鸿 , 杜翠兰 , 王文超 , 颜永红 , 陈志高

IPC: G10L15/02 , G10L15/04 , G10L15/06 , G10L15/26 , G10L25/51

Abstract: 本发明提供一种说话人分段聚类方法及装置，以解决相关技术中处理短时说话人语音时，性能下降导致说话人聚类效果较差的问题。该方法包括：将待聚类语音划分为多个子语音段；通过权重联合概率线性判别分析WT-PLDA模型对基于划分得到的各子语音段的I-vector提取出各子语音段的特征信息W-vector，所述WT-PLDA模型的模型参数至少包括：均值向量、说话人子空间的投影矩阵、说话人因子的隐藏变量以及残差因子；通过概率线性判别分析PLDA根据划分后多个子语音段的所述W-vector对该多个子语音段循环进行多次聚类，直至所述多个子语音段被聚类为两类。本发明提高了说话人的聚类效果。

10.

发明公开
面向Spark JDBC的任务优先级控制的实现方法及装置失效

公开(公告)号：CN109857535A

公开(公告)日：2019-06-07

申请号：CN201910122390.2

申请日：2019-02-18

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 刘欣然 , 张鸿 , 惠榛 , 吕雁飞 , 马秉楠 , 李斌斌 , 王振宇 , 黄航 , 王树鹏

IPC: G06F9/48 , G06F9/50 , G06F16/242 , G06F16/25

Abstract: 本发明公开了一种面向Spark JDBC的任务优先级控制的实现方法及装置，所述方法包括：SparkJdbc服务在启动时根据预先编写好的优先级队列描述XML文件建立多个任务优先级队列；接收用户通过Jdbc接口下发的指定优先级队列命令，完成Jdbc会话级别的优先级设置；接收用户提交的检索SQL，将SQL语句经过多个分析规划过程后生成一个Spark Task集合并被添加到相应名称的目标优先级队列中；通过资源调度器根据各个优先级队列之间的资源分配策略和队列内部的资源分配策略进行硬件资源的调度分配，将Spark Task分发到各个计算节点上的Task执行器上进行执行。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification