Patent search ap:("中国科学院计算技术研究所" OR "中科天玑数据科技股份有限公司") AND inv:"程学旗" Page 10

91.

发明授权
一种评估网络性能的方法及装置有权

公开(公告)号：CN106685757B

公开(公告)日：2019-12-17

申请号：CN201611168667.8

申请日：2016-12-16

Applicant: 烟台中科网络技术研究所 , 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心

Inventor： 易立 , 李静远 , 翟羽佳 , 刘晓辉 , 段东圣 , 杨博 , 鲁睿 , 王海洋 , 程学旗 , 王艳华

IPC: H04L12/26

Abstract: 本发明涉及一种评估网络性能的方法及装置，该方法包括：选择多个指标；对当前网络进行测量，在预设时间段内对每个指标进行多次测量，获得测量值；根据获得的测量值确定每个指标的阈值；计算每个指标的所有测量值分别与阈值的数据偏离差值；对得到的数据偏离差值进行处理，得到每个指标的指标值；对得到的所有指标值进行加权处理，得到评估网络性能的综合指标值F。本发明提供的一种评估网络性能的方法及装置，实现了对多个网络性能指标进行综合评价，当加入新指标时，无需重新制定评价机制，适应性更强，可根据使用者评估需求选择多种指标进行综合评价，对网络质量的评价更客观更合理。

92.

发明授权
一种子话题挖掘方法有权

公开(公告)号：CN106844416B

公开(公告)日：2019-11-29

申请号：CN201611024146.5

申请日：2016-11-17

Applicant: 中国科学院计算技术研究所

Inventor： 李静远 , 丘志杰 , 刘悦 , 程学旗 , 王凤

IPC: G06F16/332 , G06F17/27

Abstract: 本发明提供一种子话题挖掘方法，包括：1)对语料库中每篇文档的每个词语的主题值进行初始化；2)基于当前的各篇文档的各个词语的主题值，对于每篇文章中的每个词语，分别计算该词语来自各个子话题的概率以及计算该词语来自背景模块的概率，然后基于所计算出的概率，利用吉布斯采样算法重新为每篇文章中的每个词语分配主题值；其中，词语来自背景模块的概率根据预先统计的背景模块中的词语分布向量计算，所述背景模块中的词语分布向量在迭代过程中始终恒定；3)如果满足停止迭代的条件则根据当前的的主题值信息得出LDA子话题，如果否，则回到步骤2)。本发明能够显著地提升针对专题文章集合的话题挖掘效果。

93.

发明公开
一种复杂实体抽取方法、装置、介质及系统有权

公开(公告)号：CN110502742A

公开(公告)日：2019-11-26

申请号：CN201910625736.0

申请日：2019-07-11

Applicant: 中国科学院计算技术研究所

Inventor： 靳小龙 , 程学旗 , 席鹏弼 , 郭嘉丰 , 李紫宣

IPC: G06F17/27 , G06N3/04 , G06N3/08

Abstract: 本发明涉及一种复杂实体抽取方法，用于迭层膨胀卷积神经网络，该神经网络包括字级别迭层膨胀卷积神经网络层和词级别迭层膨胀卷积神经网络层，该方法包括：语料生成步骤，用于构建实体语料集，以采集语料，并对该语料进行自定义格式标注，形成训练集、测试集和/或验证集；字级别向量生成步骤，用于对该语料进行预训练，生成字向量，并将该字向量输入该字级别迭层膨胀卷积神经网络层，得到字级别向量；自定义特征提取步骤，用于从自由文本中提取所述自定义格式标注的特征；实体抽取步骤，将所述字级别向量进行拼接后，与所述词级别特征输入该词级别迭层膨胀卷积神经网络层，对所述自由文本进行复杂实体的抽取。该方法提高了实体抽取的精度和效率。

94.

发明公开
基于压缩图的数据存储方法、存储介质、存储装置和服务器有权

公开(公告)号：CN110389953A

公开(公告)日：2019-10-29

申请号：CN201910508926.4

申请日：2019-06-12

Applicant: 中国科学院计算技术研究所

Inventor： 程学旗 , 郑天祺 , 王征 , 赵程 , 张志斌 , 刘悦 , 赵鹏 , 郭嘉丰

IPC: G06F16/22

Abstract: 本发明涉及一种基于压缩图的数据存储方法、系统和存储介质，该方法包括：步骤100，生成点表逻辑定义，根据该逻辑定义构建点表，并向该点集中插入数据；步骤200，生成边表逻辑定义，根据该逻辑定义构建边表，从所述点表中选择与该边表相关联的点表，并向所述边表中插入数据；步骤300，设置和执行压缩图定义命令，生成所述压缩图的建图逻辑，设置函数获取与所述压缩图定义关联的所述边表，形成边集聚合组，并生成与所述压缩图定义关联的所述点表的代理结构；步骤400，设置和执行压缩图重置命令，根据所述压缩图的建图逻辑构建所述压缩图。本方法降低了多次建图与建多类图的开销，增加了图构建的灵活性与表示性，减少了重复建图的排序工作量。

95.

发明公开
一种基于动态代码生成的图计算方法及系统有权

公开(公告)号：CN110287378A

公开(公告)日：2019-09-27

申请号：CN201910441015.4

申请日：2019-05-24

Applicant: 中国科学院计算技术研究所

Inventor： 郑天祺 , 程学旗 , 冯吕 , 王征 , 张志斌 , 刘悦 , 赵鹏 , 郭嘉丰

IPC: G06F16/901 , G06F16/2458

Abstract: 本发明提出一种基于动态代码生成的图计算方法及系统，包括：根据建图请求，构造包含图操作原语的中间图结构，并将中间图结构与图名关联后存入中间图缓存器；根据图算法请求，生成由外部代码字节码构成的图算法结构，发送至图算法缓存器；以执行请求检索中间图缓存器和图算法缓存器，得到待执行中间图结构、待执行图算法结构与参数列表组成的三元组，并在本地代码缓存器中检索三元组，得到本地代码缓存器中的执行对象，以执行得到结果。本发明在本地代码空间中注入生成代码，消除了数据交换的开销；构建了可二次编译的中间图结构，使图数据的访问代码可进行编译优化；同时增加了中间图结构缓存与图算法缓存，规避了图计算的预处理开销。

96.

发明公开
用于大规模网络数据采集的分布式动态调度方法和系统无效

公开(公告)号：CN109814992A

公开(公告)日：2019-05-28

申请号：CN201811634642.1

申请日：2018-12-29

Applicant: 中国科学院计算技术研究所

Inventor： 孟剑 , 俞晓明 , 程学旗 , 史存会 , 郭岩 , 贺广福 , 周秀花 , 余智华 , 刘悦

IPC: G06F9/48 , G06F9/50

Abstract: 本发明涉及一种用于大规模网络数据采集的分布式动态调度方法，包括：获取网络数据所在的信源；将参与数据采集的节点注册为采集节点或调度节点；获取数据采集的调度策略；根据该调度策略和该信源的信源信息，生成采集任务；将该采集任务传递至该采集节点的采集器，以配置并启动该采集器；通过该采集器执行该采集任务，以获取采集结果。本发明的分布式调度方法是采集器、信息来源无关的通用调度方法，本方法支持多种异构采集器，支持异构节点，支持采集节点与采集器的热插拔，动态扩展。

97.

发明公开
基于细粒度匹配信号的文本相关性度量方法和系统无效

公开(公告)号：CN109753649A

公开(公告)日：2019-05-14

申请号：CN201811466325.3

申请日：2018-12-03

Applicant: 中国科学院计算技术研究所

Inventor： 程学旗 , 庞亮 , 兰艳艳 , 郭嘉丰 , 沈华伟 , 陈丽娟 , 张海楠 , 曾玮 , 李家宁 , 赵峻瑶 , 倪艺函

IPC: G06F17/27

Abstract: 本发明涉及一种基于细粒度匹配信号的文本相关性度量方法和系统，包括：获取待语义匹配的两段文本，将该文本中每一个词映射为词向量，根据其中一段文本中每一个词的词向量，与另一段文本中每一个词向量的语义相似度，将所有该语义相似度集合成二维实数矩阵，作为匹配矩阵；将该匹配矩阵中每个元素的语义相似度转换为灰度值，得到灰度图，使用针对二维数据的卷积神经网络结构对该灰度图进行图像模式提取，得到特征图，该特征图经过全连接网络并通过逻辑斯谛函数处理后，得到0-1之间的一个分数，将该分数作为该两段文本之间的相关性。本发明能够构建细粒度匹配信号，提取多层次的匹配模式。在多种不同任务的实际数据集上的效果突出。

98.

发明授权
一种基于流式数据的局部性非聚簇索引方法及系统有权

公开(公告)号：CN105335475B

公开(公告)日：2018-07-10

申请号：CN201510641703.7

申请日：2015-09-30

Applicant: 中国科学院计算技术研究所

Inventor： 郑天祺 , 程学旗 , 张敬亮 , 黄淳

IPC: G06F17/30

Abstract: 本发明公开了一种基于流式数据的局部性非聚簇索引方法及系统，该方法包括：实时更新步骤，实时更新哈希索引表哈希索引表中针对所接收到的每条流式数据而产生的索引记录，该索引记录记载了该流式数据中出现的索引键、该索引键首次出现时所对应的主键以及从首次出现到当前最末次出现所覆盖的数据个数；写入步骤，当达到触发条件时，将该哈希索引表中的该索引记录写入索引表中，继续执行该实时更新步骤。本发明极大地缩小了索引表的空间及构建索引表所产生的带宽开销，该索引方法将随机访问与顺序扫描结合起来，有效地利用了流式数据的时间局部特性，更符合存储介质的访问模型，提高了索引数据查询的效率。

99.

发明授权
可动态适应的LSM树合并方法及系统有权

公开(公告)号：CN105159915B

公开(公告)日：2018-07-10

申请号：CN201510419480.X

申请日：2015-07-16

Applicant: 中国科学院计算技术研究所

Inventor： 程学旗 , 张虔熙 , 张敬亮 , 廖华明 , 林思明

IPC: G06F17/30

Abstract: 本发明适用于文件处理技术领域，提供了一种可动态适应的LSM树合并方法，所述方法包括：将键值区间划分为若干节点，将所述节点组织为树形结构，每个所述节点对应一键值区间，每个所述键值区间包含对应该键值区间范围的文件；根据当前数据的分布动态调整树的形状；当有新写入的文件时，遍历树寻找最适节点放入；对文件进行处理时，对节点内部进行Minor Compact处理，并且只通过叶节点执行Major Compact。本发明还相应的提供一种实现上述方法的可动态适应的LSM树合并系统。借此，本发明可以实现动态适应数据的分布，提高数据合并效率。

100.

发明授权
一种面向知识库更新的实体细粒度分类方法与系统有权

公开(公告)号：CN104615687B

公开(公告)日：2018-05-22

申请号：CN201510033050.4

申请日：2015-01-22

Applicant: 中国科学院计算技术研究所

Inventor： 程学旗 , 王元卓 , 林海伦 , 贾岩涛 , 靳小龙 , 熊锦华 , 李曼玲 , 常雨骁 , 许洪波

IPC: G06F17/30

Abstract: 本发明提供一种面向知识库更新的实体细粒度分类方法与系统。所述方法包括：从文本中识别出实体；将识别出的实体、知识库中与其相关的实体以及相关实体在知识库中的分类作为结点构建依赖图，其中依赖图中的边的权值表示该边连接的两个结点之间的相关程度；以及，通过在所述依赖图上执行重启动随机游走，得到识别出的实体所属的分类。本发明能够克服现有技术在实体上下文缺乏的情况下难以实现对该实体进行细粒度分类的缺陷，并且提高了实体细粒度分类的准确率。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification