-
公开(公告)号:CN104063502A
公开(公告)日:2014-09-24
申请号:CN201410322692.1
申请日:2014-07-08
Applicant: 中南大学
IPC: G06F17/30
CPC classification number: G06F17/30908 , G06F17/30705
Abstract: 本发明提出了一种基于语义模型的WSDL半结构化文档的相似性分析及分类方法,利用WordNet词典建立WSDL半结构化文档语义模型,并通过最大熵模型消除词语歧义,建立WSDL半结构化文档语料库特征向量模型,生成WSDL半结构化文档的文档特征矩阵,从而对两个不同文档进行内容的分类与评估,最终得到服务功能的相似性比较。本发明所述方法提高了文档相似性判断准确度,提升了文档分类速度以及准确度,并对向量空间有降维效果。
-
公开(公告)号:CN104063502B
公开(公告)日:2017-03-22
申请号:CN201410322692.1
申请日:2014-07-08
Applicant: 中南大学
IPC: G06F17/30
Abstract: 本发明提出了一种基于语义模型的WSDL半结构化文档的相似性分析及分类方法,利用WordNet词典建立WSDL半结构化文档语义模型,并通过最大熵模型消除词语歧义,建立WSDL半结构化文档语料库特征向量模型,生成WSDL半结构化文档的文档特征矩阵,从而对两个不同文档进行内容的分类与评估,最终得到服务功能的相似性比较。本发明所述方法提高了文档相似性判断准确度,提升了文档分类速度以及准确度,并对向量空间有降维效果。
-
公开(公告)号:CN104751422B
公开(公告)日:2016-04-06
申请号:CN201510112201.5
申请日:2015-03-12
Applicant: 中南大学
IPC: G06T5/00
Abstract: 本发明公开了一种影印文档图像增强及二值化方法,包括以下几个步骤:步骤1:对输入的彩色图像进行灰度化处理,得到灰度图像;步骤2:采用Sobel水平和垂直算子获取每个像素点对应的局部图像块的边缘梯度;步骤3:进行加权融合改进LC局部增强,获得每个像素点的加权融合局部对照值;步骤4:基于每个像素点的加权融合局部对照值作为对应像素点的像素值,获得输入图像的增强图像。该方法通过改进了现有局部增强算法,对现有的LC算法进行加权融合改进,所提出的图像增强算法不仅效果优于现有文档图像类增强及二值化方法,且具有较好的时间性能,进一步提高了图像的预处理速度。另一方面,相比于现有技术,该发明参数调节简单,实现过程简单易操作。
-
-