-
公开(公告)号:CN104572827A
公开(公告)日:2015-04-29
申请号:CN201410743749.5
申请日:2014-12-08
Applicant: 北京工业大学
CPC classification number: G06F17/30238 , G06F21/6209
Abstract: 本发明涉及一种基于跨明文与密文的混合搜索系统。所述系统包括数据集纵向切分装置,明文搜索装置,密文搜索装置,搜索结果结合装置。搜索结果结合装置还包括重新分组单元和重新排名单元。数据集纵向切分装置根据数据集中的属性值是否需要加密,对数据集进行纵向切分,得到明文数据集与密文数据集;明文搜索装置对明文数据集进行排名搜索得到排名搜索结果;密文搜索装置对密文数据集进行基于倒排索引的加密搜索,快速得到精确匹配搜索结果;搜索结果结合装置对排名搜索结果与精确匹配搜索结果进行重新结合,得到最终的新排名搜索结果。本发明能够在保护个人隐私的基础上,既能快速得到搜索结果,还可对搜索结果排名,得到更具价值的搜索结果。
-
公开(公告)号:CN106228002A
公开(公告)日:2016-12-14
申请号:CN201610567961.X
申请日:2016-07-19
Applicant: 北京工业大学
IPC: G06F19/00
CPC classification number: G06F19/3418
Abstract: 本发明公开一种高效率时序数据异常提取方法,用于从心电图数据(ECG)中查找异常,检测心脏病。该方法包括:系统中距离函数采用DTW距离代替传统的Euclidean距离,减小相移误差;将原始时序数据(ECG)通过SAX技术映射成一系列字符串序列存储在数据结构Array数组和Trie三叉树中;通过Array数组和Trie三叉树找出最有可能的异常序列作为候选异常;通过二次筛选在ECG数据中找出第一个候选异常的最近邻距离,作为第一阈值距离;通过嵌套的内外循环验证该候选异常即为最终要找的异常,否则更新候选异常;内外循环执行完后最终得到ECG数据中的异常时序。本发明的技术方案,解决了因DTW距离冗余度过高导致难以在大量ECG数据中实现快速精确查找异常的难题。
-
公开(公告)号:CN106228002B
公开(公告)日:2021-11-26
申请号:CN201610567961.X
申请日:2016-07-19
Applicant: 北京工业大学
IPC: G16H80/00
Abstract: 本发明公开一种高效率时序数据异常提取方法,用于从心电图数据(ECG)中查找异常,检测心脏病。该方法包括:系统中距离函数采用DTW距离代替传统的Euclidean距离,减小相移误差;将原始时序数据(ECG)通过SAX技术映射成一系列字符串序列存储在数据结构Array数组和Trie三叉树中;通过Array数组和Trie三叉树找出最有可能的异常序列作为候选异常;通过二次筛选在ECG数据中找出第一个候选异常的最近邻距离,作为第一阈值距离;通过嵌套的内外循环验证该候选异常即为最终要找的异常,否则更新候选异常;内外循环执行完后最终得到ECG数据中的异常时序。本发明的技术方案,解决了因DTW距离冗余度过高导致难以在大量ECG数据中实现快速精确查找异常的难题。
-
公开(公告)号:CN105045913B
公开(公告)日:2018-08-28
申请号:CN201510502389.4
申请日:2015-08-14
Applicant: 北京工业大学
IPC: G06F17/30
Abstract: 基于WordNet以及潜在语义分析的文本分类方法涉及计算机领域。本发明考虑文本中单词的同义词及上下位词,同义词及上下位词根据相似度增加各自词频,从而减少多词同义对分类的影响。不同于一般方法中对一个特征矩阵以单一方法做特征提取,我们通过对WordNet调用参数的调整获得多个特征矩阵,使用遗传算法(GA)辅助潜在语义分析(LSA)共同完成特征提取,得到更好的特征矩阵,从而提高了分类效果。
-
公开(公告)号:CN104572827B
公开(公告)日:2017-12-15
申请号:CN201410743749.5
申请日:2014-12-08
Applicant: 北京工业大学
Abstract: 本发明涉及一种基于跨明文与密文的混合搜索系统。所述系统包括数据集纵向切分装置,明文搜索装置,密文搜索装置,搜索结果结合装置。搜索结果结合装置还包括重新分组单元和重新排名单元。数据集纵向切分装置根据数据集中的属性值是否需要加密,对数据集进行纵向切分,得到明文数据集与密文数据集;明文搜索装置对明文数据集进行排名搜索得到排名搜索结果;密文搜索装置对密文数据集进行基于倒排索引的加密搜索,快速得到精确匹配搜索结果;搜索结果结合装置对排名搜索结果与精确匹配搜索结果进行重新结合,得到最终的新排名搜索结果。本发明能够在保护个人隐私的基础上,既能快速得到搜索结果,还可对搜索结果排名,得到更具价值的搜索结果。
-
公开(公告)号:CN105045913A
公开(公告)日:2015-11-11
申请号:CN201510502389.4
申请日:2015-08-14
Applicant: 北京工业大学
IPC: G06F17/30
CPC classification number: G06F17/3071
Abstract: 基于WordNet以及潜在语义分析的文本分类方法涉及计算机领域。本发明考虑文本中单词的同义词及上下位词,同义词及上下位词根据相似度增加各自词频,从而减少多词同义对分类的影响。不同于一般方法中对一个特征矩阵以单一方法做特征提取,我们通过对WordNet调用参数的调整获得多个特征矩阵,使用遗传算法(GA)辅助潜在语义分析(LSA)共同完成特征提取,得到更好的特征矩阵,从而提高了分类效果。
-
-
-
-
-