一种复杂网络下基于路径选择的表示学习方法

    公开(公告)号:CN108664652A

    公开(公告)日:2018-10-16

    申请号:CN201810476981.5

    申请日:2018-05-18

    Abstract: 本发明涉及一种复杂网络下基于路径选择的表示学习方法,属于自然语言处理以及知识图谱技术领域。本发明通过在知识图谱上进行规定起始点的随机游走,得到实体间的路径信息,通过训练一个分类器来对高置信度的路径进行筛选。然后利用知识表示的方法将实体,关系和路径用低维向量方式进行表示。通过向量间的运算判断实体之间的关系。本发明提出的方法解决了传统路径推理中路径冗余导致的推理效率低下,是一种可以充分利用路径信息到表示学习中的结合方式。

    一种基于管道的中文篇章结构分析方法及系统

    公开(公告)号:CN107168956A

    公开(公告)日:2017-09-15

    申请号:CN201710385741.X

    申请日:2017-05-26

    Abstract: 本发明涉及一种基于管道的中文篇章结构分析方法及系统,属于自然语言处理应用技术领域;本发明根据中文篇章结构的特点,自下而上地处理句内和句间关系,使得预测句间或更高层次篇章关系时可以动态地利用已识别的句内关系,实现对动态特征的建模。本发明针对管道形式中存在的错误传递问题,将传统端到端模型中的显式篇章关系分析中的三个子任务整合为一个任务,转化为一个序列标注问题并加以实现;本发明利用排序学习的思想缓解了隐式篇章关系判别中存在的篇章关系分布不平衡的问题。

    一种基于超图模型的遥感图像语义相似性度量方法及装置

    公开(公告)号:CN104820992B

    公开(公告)日:2017-07-18

    申请号:CN201510256069.5

    申请日:2015-05-19

    Abstract: 本发明涉及一种基于超图模型的遥感图像语义相似性度量方法,属于遥感图像处理技术领域;本发明利用超图模型对每个时相遥感图像进行建模,通过利用超图模型中顶点和超边实现遥感图像中每个像素点的语义表征,并结合超图匹配思想实现语义相似性度量,将多时相遥感图像语义相似性计算表示为多个超图模型中相同位置上顶点的相似性与顶点对应超边相似性的加权和。对比现有技术,本发明利用超图模型的高阶邻域表征能力提高复杂场景下多时相遥感图像语义相似性度量的准确性,降低了语义奇异性,以及配准误差、光照变化、季节差异等因素导致的噪声干扰;将多时相遥感图像语义相似性度量问题转化为一种超图模型匹配问题,通过最优化求解实现相似性度量。

    一种基于信息量的句子相似度计算方法

    公开(公告)号:CN104090918B

    公开(公告)日:2017-02-22

    申请号:CN201410268361.4

    申请日:2014-06-16

    Inventor: 吴昊 黄河燕

    Abstract: 本发明涉及一种基于信息量的句子相似度计算方法,包括以下步骤:首先,通过两个句子词语间具有最大的信息量的概念确定词语的词义;然后利用语义网的层次结构和语料库统计来计算词语的信息量和多词语间的公共信息量;接下来应用组合数学中容斥原理计算多个词语的总信息量,从而分别得到两个句子各自的信息量,以及两个句子总共的信息量;最后根据Jaccard相似度原理定义并计算出句子的相似度。本发明能逼真的模拟人类对句子相似程度的判断,并且不需要使用语料训练参数或使用经验参数、不依赖语料库的规模、无需词性标注等其他自然语言处理技术;时间性能优秀,对一般长度的句子对,在当前主流多核PC机上获得准实时计算效率。

    一种利用语义信息检索文档的方法

    公开(公告)号:CN103744984B

    公开(公告)日:2017-01-25

    申请号:CN201410018112.X

    申请日:2014-01-15

    Abstract: 本发明涉及一种利用语义信息检索文档的方法,属于计算机信息检索技术领域。通过采用基于关键词的用户检索方法,降低了用户使用难度;采用基于距离和稠密度的文档——本体映射方法,提高映射的准确率;采用基于语义的检索方法,利用多本体索引文档的方法,并且采用了一种结合本体的TF-IDF排序方法,提高了查准率;通过本体语义扩充,提高了系统容纳无效关键词能力,提高了查全率。本方法能够显著提高文档检索的准确率,并且没有带来糟糕的用户交互复杂性。

    一种面向知识管理的自定义知识分类方法

    公开(公告)号:CN103793474B

    公开(公告)日:2017-01-11

    申请号:CN201410003685.5

    申请日:2014-01-04

    Abstract: 本发明属于计算机应用技术领域,涉及应用于知识管理系统的一种自定义知识分类方法。本发明的目的是为了解决知识管理系统中,在缺乏标注文本集合的条件下,实现用户自定义分类管理知识的问题,提出了一种基于词匹配的用户自定义的知识分类方法。本方法绕过了训练文本集合标注的难题,通过用《同义词词林》扩展用户自定义关键词,利用Wu-Manber多模式匹配算法来快速匹配关键词,根据关键词在文档中的命中率来判断分类类别。本方法有适应缺乏标注文本的条件,且速度快的特点。

    一种基于协同训练的双语命名实体识别方法

    公开(公告)号:CN103853710B

    公开(公告)日:2016-06-08

    申请号:CN201310593746.3

    申请日:2013-11-21

    Abstract: 本发明公开了一种基于双语协同训练的命名实体的识别方法,属于计算机科学中的自然语言处理技术领域。把平行的汉语句子和英语句子这两个数据集看作为一个数据集的两个不同的视图进行双语协同训练。在投射过程中使用一个对数线性模型修正投射标记,在利用模型对未见示例进行预测时引入命名实体双语对齐标注一致率作为标记置信度估计的衡量指标。本方法对比现有技术,降低了命名实体识别的领域依赖性,融合了双语识别的优势,解决了单语识别中的部分识别歧义问题,尤其适合用于大规模语料的双语命名实体同步识别。

    一种几何图形到盲文点阵图形的转换方法及装置

    公开(公告)号:CN105550987A

    公开(公告)日:2016-05-04

    申请号:CN201610046116.8

    申请日:2016-01-22

    Inventor: 黄河燕 周强 叶宇

    CPC classification number: G06T3/20

    Abstract: 本发明公开了一种用于盲文图形编辑中几何图形转换盲文点阵图形的方法及装置,属于基于计算机科学的图形处理与分析技术领域;它包括:确定所画几何图形的始末位置并计算该图形方程,将始末位置间背景格横坐标带入方程求纵坐标,得交点;相邻两交点纵坐标差值大于背景格宽度的,计算中间与多条横线的交点;相邻两交点纵坐标差值小于背景格宽度且不在一个背景格内的,计算与中间横线的交点;这样计算出与所有背景格的交点后,再计算相邻交点的中点,中点所在的方格为需要绘制的盲文点。对比现有技术,本发明有效的结合画图功能,将所画几何图形以一种所见即所得的方式进行呈现,方便用户判断和观察图形走向,解决之前画图中效率低、正确率低的问题。

    一种微博文本中产品名实体的规范化方法及装置

    公开(公告)号:CN105468780A

    公开(公告)日:2016-04-06

    申请号:CN201510958361.1

    申请日:2015-12-18

    Inventor: 黄河燕 杨献祥

    CPC classification number: G06F17/30985 G06F17/30864

    Abstract: 本发明涉及一种微博文本中产品名实体的规范化方法及其装置,属于互联网数据处理与分析技术领域。本发明方法利用词向量方法进行词的表示,并采用向量的相似度度量词的语义相似度,将待规范化的实体和与其最相似的K个词进行知识库的匹配,对其所属的品牌名进行权重的计算;同时引入了微博用户的交互关系和局部上下文中出现的实体信息进行产品实体的规范化。对比现有技术,本发明有效的解决了微博文本中因文本短、上下文信息不足等造成的产品名实体歧义问题,提高了微博文本中产品名实体规范化的性能。

Patent Agency Ranking