-
公开(公告)号:CN103268311A
公开(公告)日:2013-08-28
申请号:CN201210439007.4
申请日:2012-11-07
IPC: G06F17/27
Abstract: 本发明公开一种基于事件结构的中文语句分析方法。该方法是将一个中文句子表示为若干事件指示词和与之对应的事件角色包括非事件角色相关成分的树形结构。该方法的分析步骤是:首先对中文语句进行预处理;其次进行基于事件结构的中文语句分析,找出语句中的事件指示词和与之对应的事件角色,分析多角色成分和非事件角色相关成分;最后对各句子成分进行标签标记,并添加各成分的功能说明,给出树形表示结构的括号表示形式。该方法较适用于中文的句法分析,反映事件要素之间的关系,为语义分析提供支持,并可以反映事件的语言表示方法和表示规律;该方法可以处理非动词的事件指示词,并对修饰成分、介词、连接词和其它成分的语义功能进行说明。
-
公开(公告)号:CN101782897A
公开(公告)日:2010-07-21
申请号:CN201010126360.8
申请日:2010-03-17
Applicant: 上海大学
IPC: G06F17/27
Abstract: 本发明公开了一种基于事件的中文语料标注方法,该方法具体步骤如下:(1)语料收集步骤:从互联网上收集生语料;(2)文本预处理步骤:对生语料进行断句和切分词的预处理;(3)文本分析步骤:对预处理后的语料进行句法分析和语义分析;(4)事件标注步骤:对分析后的文本,标注其中的事件指示词和事件要素;(5)一致性检查步骤:检查语料的不同标注版本之间的一致性,以保证语料标注的质量。该方法标注了语料中所有的事件,具有很好的覆盖性;该方法对预处理后的中文文本进行了句法和语义分析,根据分析结果进行标注,符合中文的特点;该方法对标注后的语料进行一致性检查,能保证语料标注的质量。
-
公开(公告)号:CN100357988C
公开(公告)日:2007-12-26
申请号:CN200510024593.6
申请日:2005-03-24
Applicant: 上海大学 , 合肥文康科技有限责任公司
IPC: G08G1/017
Abstract: 本发明涉及一种基于三路并行人工神经网络的移动号牌识别方法。识别步骤为:对运动车辆视频图像的采集采用视频触发方式自动触发进行视频捕捉,对视频捕捉信号中的汽车号牌图像部分进行字符分割后作为神经网络的输入信号;所述的神经网络采用各有分工的三个标准的自适应震荡网络,即汉字识别网络、英文字母识别网络和数字识别网络,三个标准网络同时对输入向量信号进行识别,分别输出相似度最高的类别个体,通过号牌模板控制域值属性,经号牌精确识别滤波后,加上号牌颜色属性作为识别结果输出。采用本发明的方法,能对行驶中的车辆在最大允许运动速度下,迅速准确识别其车牌号。
-
公开(公告)号:CN106445990B
公开(公告)日:2019-10-11
申请号:CN201610470527.X
申请日:2016-06-25
Applicant: 上海大学 , 上海市科技企业联合会
IPC: G06F16/35
Abstract: 本发明涉及一种事件本体构建方法。本方法主要包括以下几个步骤:(1)获取相关领域的文档,(2)构建CEC语料库,(3)通过学习语料库,从文本中抽取事件以及事件各要素,(4)事件类分类以及非分类关系的抽取,(5)从归纳得到的事件类、事件类要素、事件类关系,抽象得到其形式化的描述语言,(6)实现基于事件本体的事件分类关系推理。本发明克服传统本体难以表示动态知识的缺陷,不仅适合于表示静态知识,而且适合于表示动态知识,降低本体中非分类关系的繁杂性,为计算文本语义提供了有效的支持。
-
公开(公告)号:CN103049501A
公开(公告)日:2013-04-17
申请号:CN201210528734.8
申请日:2012-12-11
Applicant: 上海大学
Abstract: 本发明公开了一种基于互信息和条件随机场模型的中文领域术语识别方法,其步骤如下:(1)收集领域文本语料,对语料中所有的标点符号、空格、数字、ASCII字符以及汉字以外字符进行标记;(2)设置字串,计算字串的互信息值;(3)计算字串左右信息熵;(4)定义字串评价函数,设置评价函数阈值,计算各字串的评价函数值,确定字串为词,依次比较该字串中前一字的评价函数值与后一字评价函数值相比较,逐一对字义字串分词;(5)利用条件随机场训练出一个领域术语条件随机场模型,用该模型对进行领域术语识别。该方法在术语识别时,不仅能克服合法术语的数据稀疏,降低了条件随机场算法的运算量,而且能够提高中文领域术语识别精度。
-
公开(公告)号:CN102419774B
公开(公告)日:2013-04-03
申请号:CN201110418812.4
申请日:2011-12-15
Applicant: 上海大学
IPC: G06F17/30
Abstract: 本发明公开了一种面向SNP数据的聚类方法,具体步骤如下:首先将原始SNP数据进行预处理,转换成聚类方法可以处理的数据格式;然后将预处理后的SNP数据进行网格划分,根据每个SNP位点在每个样本中的表达值将SNP数据的每一维划分为3个网格;然后计算划分后的网格的密度,得到包含聚类的子空间;然后对得到的子空间进行聚类,得到被分好类的SNP数据,每个类是共表达的SNP位点的集合;最后将聚类结果保存到文件中。本发明解决了高维分类型数据的聚类问题,能够快速高质量的对SNP数据进行聚类。
-
公开(公告)号:CN101853298A
公开(公告)日:2010-10-06
申请号:CN201010186197.4
申请日:2010-05-26
Applicant: 上海大学
IPC: G06F17/30
Abstract: 本发明公开了一种面向事件的查询扩展方法,其步骤如下:(1)输入查询内容,获取局部文本集合N;(2)从集合N中识别得到事件集合E;(3)分别从查询项中区分事件项Qe和限定项Qe′;(4)计算查询项的事件项Qe与集合E中每个事件的关联强度,从集合E中选择关联强度大的若干个事件添加到Qe中扩展,得到扩展的事件项(5)计算扩展事件项与集合M中的一篇文本d的相似度计算限定项Qe′与集合M中的一篇文本d的相似度为Sim(Qe′,d),计算得到Qexp与集合M中的一篇文本d的相似度为Sim(Qexp,d),依据相似度Sim(Qexp,d)的大小降序排列输出检索文本。该方法使用面向事件的查询扩展技术,区分查询内容中的事件项和限定项,在同样的查询主题上进行信息查询,能显著的提高事件类信息查询结果的准确率。
-
公开(公告)号:CN103049501B
公开(公告)日:2016-08-03
申请号:CN201210528734.8
申请日:2012-12-11
Applicant: 上海大学
Abstract: 本发明公开了一种基于互信息和条件随机场模型的中文领域术语识别方法,其步骤如下:(1)收集领域文本语料,对语料中所有的标点符号、空格、数字、ASCII字符以及汉字以外字符进行标记;(2)设置字串,计算字串的互信息值;(3)计算字串左右信息熵;(4)定义字串评价函数,设置评价函数阈值,计算各字串的评价函数值,确定字串为词,依次比较该字串中前一字的评价函数值与后一字评价函数值相比较,逐一对字义字串分词;(5)利用条件随机场训练出一个领域术语条件随机场模型,用该模型对进行领域术语识别。该方法在术语识别时,不仅能克服合法术语的数据稀疏,降低了条件随机场算法的运算量,而且能够提高中文领域术语识别精度。
-
公开(公告)号:CN102419774A
公开(公告)日:2012-04-18
申请号:CN201110418812.4
申请日:2011-12-15
Applicant: 上海大学
IPC: G06F17/30
Abstract: 本发明公开了一种面向SNP数据的聚类方法,具体步骤如下:首先将原始SNP数据进行预处理,转换成聚类方法可以处理的数据格式;然后将预处理后的SNP数据进行网格划分,根据每个SNP位点在每个样本中的表达值将SNP数据的每一维划分为3个网格;然后计算划分后的网格的密度,得到包含聚类的子空间;然后对得到的子空间进行聚类,得到被分好类的SNP数据,每个类是共表达的SNP位点的集合;最后将聚类结果保存到文件中。本发明解决了高维分类型数据的聚类问题,能够快速高质量的对SNP数据进行聚类。
-
公开(公告)号:CN101727437A
公开(公告)日:2010-06-09
申请号:CN200910199576.4
申请日:2009-11-26
Applicant: 上海大学
IPC: G06F17/21
Abstract: 本发明公开了一种计算文本集合中事件的重要度的方法,该方法其特征在于首先从文本集合中识别出所有的事件,由该所有事件组成事件集合E;其次根据一个事件的发生导致另一个事件发生的概率计算两事件间的影响因子;接着依据两两事件间的影响因子构造事件影响因子矩阵;最后利用链接分析算法迭代计算事件影响因子矩阵中每个事件的重要度。该方法构造了事件间的影响因子矩阵来描述文本集合中事件间的关联强弱,依据事件间影响因子具有双向和不对称的特征,提出了一种综合考虑了事件的Authorities值和Hubs值的链接分析算法,显著地提高了文本集合中事件的重要度计算的准确率。该方法在事件识别规则的基础上,可以自动的实现文本集合中事件的重要度的计算。
-
-
-
-
-
-
-
-
-