一种基于SQL的文本数据统计实现方法

    公开(公告)号:CN105335479B

    公开(公告)日:2018-11-23

    申请号:CN201510657159.5

    申请日:2015-10-12

    Abstract: 本发明涉及一种基于SQL的文本数据统计实现方法,其技术特点是:对输入SQL语法进行解析;在结构化数据仓库中建立和子查询投影结构一致的临时表;识别全文索引引擎数据分布规则;将基于SQL的简单子查询翻译为全文索引引擎语法,并在全文索引引擎中执行;获取全文索引查询结果并将结果导入到结构化数据仓库引擎临时表中;完成查询结果导入过程,向数据仓库下发重写后的基于临时表SQL查询语句,并向客户端返回查询结果。本发明结合全文索引引擎和结构化数据仓库引擎的特点,实现对海量文本数据的基于通用SQL语言的统计分析方法,解决了传统方法统计功能薄弱和结构化数据仓库无法支持高效文本检索的问题,大大提高了文本数据统计分析的易用性。

    藏语方言识别方法及系统

    公开(公告)号:CN104036774B

    公开(公告)日:2018-03-06

    申请号:CN201410280868.1

    申请日:2014-06-20

    Abstract: 本发明公开了一种藏语方言识别方法及系统,该方法包括:预先训练语种识别模型,所述语种识别模型包括:多方言DNN并行音素识别器模型、多方言语言模型;接收待识别藏语方言语音信息;提取所述语音信息的声学特征;利用所述多方言DNN并行音素识别器模型获得对应所述声学特征的音素序列;计算各音素序列在每个语言模型上的似然得分;将似然得分最高的语言模型对应的方言作为所述语音信息对应的方言种类。利用本发明,可以提高藏语方言识别效果。

    基于重复数据删除的共享方法

    公开(公告)号:CN104331525B

    公开(公告)日:2018-01-16

    申请号:CN201410717338.9

    申请日:2014-12-01

    Abstract: 本发明是一种基于重复数据删除的共享方法,将重复数据删除技术和NAS(Network Attached Storage)的共享功能进行深度的结合。本发明对存储的数据进行分块,为每个数据块建立局部索引,局部索引包含根据数据块指纹指定的数据块的存储分区和桶区;当NAS接收到客户端发送来的写请求时,对数据块建立局部索引并存储;当NAS接收到客户端发送来的读请求时,获取待读取数据块的指纹,根据数据块的局部索引,读取数据块。本发明方法可以对windows客户端、linux客户端提供例如:nfs/samba(cifs)/ftp等共享方式支持,可有效地将重复数据删除技术融合到后端存储进而实现在线消冗功能。

    一种社交网络低质量图像中的字幕识别方法

    公开(公告)号:CN107480671A

    公开(公告)日:2017-12-15

    申请号:CN201610406013.8

    申请日:2016-06-08

    CPC classification number: G06K9/3266

    Abstract: 本发明为一种社交网络低质量图像中的字幕识别方法,包括(1)图像预处理;(2)MSER提取;(3)文字检测;(4)区域合成;(5)文本检测;最终获取识别结果。本发明支持对社交网络中低质量图像中字幕的检测。支持对低质量图像字幕的识别,低质量主要表现为字幕嵌入在复杂图像背景中、字幕中字符分辨率低,且笔画模糊,部分相邻字符粘连;支持识别常用低质量中英文字符、数字和标点符号,其中中文字符集至少包括GB2312-1内的3755个简体汉字。

    一种自动检索密钥和选择算法的加解密方法

    公开(公告)号:CN104363091B

    公开(公告)日:2017-09-12

    申请号:CN201410717255.X

    申请日:2014-12-01

    Abstract: 本发明公开了一种自动检索密钥和选择算法的加解密方法,包括步骤一、生成加密对象所使用的密钥库;步骤二、提取被加密对象的数据特征,得到经过处理后的数据首字节;步骤三、依据提取的数据特征自动检索密钥库;步骤四、依据数据特性选择加密算法;步骤五、依据不同的加密场景自定义增订扩充方案;步骤六、对被加密对象进行加解密运算。本发明在现行加密算法的基础上,采用密钥库替代传统的单一密钥,增强了密钥管理的安全性,依据数据特征选取密钥,并选择适当的加密算法发挥最佳的加密性能,能够支持增订扩充方案以满足特定的加密场景,因此,该方法具有很强的实用性和适应性,具有很广泛的应用场景。

    一种数据分流的方法及接入设备

    公开(公告)号:CN106302236A

    公开(公告)日:2017-01-04

    申请号:CN201510277552.1

    申请日:2015-05-27

    Abstract: 本发明公开了一种数据分流的方法及接入设备。其中,数据分流的方法包括:对入口数据进行预处理,提取用于分流的至少一个信息元组,对至少一个信息元组进行第一次哈希变换,使得属于同一等价信息组的信息元组的哈希值相同,同一等价信息组为按照预定规则划分的信息组,对第一次哈希变换后的信息元组进行第二次哈希变换,得到组合哈希值,以根据组合哈希值将入口数据均匀的分到出端口输出。通过上述方式,本发明能够对信令或其他具有多宿特征的数据的分流,并且能确保分流后的信令或其他多宿特征数据保持事务完整性。

    预测移动终端位置的方法及装置

    公开(公告)号:CN106028444A

    公开(公告)日:2016-10-12

    申请号:CN201610512948.4

    申请日:2016-07-01

    CPC classification number: H04W64/00 H04W4/029

    Abstract: 本发明公开了一种预测移动终端位置的方法及装置,该方法包括:获取移动终端当前的粗粒度位置信息,粗粒度位置信息包括粗粒度位置名称、粗粒度位置地址以及获取时间;查找粗粒度地理信息数据库,得到与移动终端当前的粗粒度位置信息对应的当前兴趣点POI数据,粗粒度地理信息数据库保存有不同粗粒度位置信息与不同POI数据之间的对应关系,POI数据至少包括粗粒度位置所在地的经度和纬度;根据当前获取时间和当前POI数据,基于移动终端的位置历史数据,预测移动终端下一阶段位置。通过这种方式,本发明能够在没有提供经纬度信息但提供粗粒度位置信息的情况下,对移动终端下一阶段位置进行预测。

Patent Agency Ranking