一种基于多路数据接入方式的未备案网站探寻方法及系统

    公开(公告)号:CN104065532B

    公开(公告)日:2018-08-14

    申请号:CN201410299875.6

    申请日:2014-06-26

    Abstract: 本发明提供一种基于多路数据接入方式的未备案网站探寻方法及系统,该方法包括如下步骤:通过多路数据接入方式获取域名,筛选出未备案域名形成域名种子库;对未备案域名进行DNS解析,获取对应的IP地址;定位IP地址,得出未备案域名库;通过活动性验证得出未备案网站信息。本发明提供的方法和系统通过多路数据接入方式,能够确保最终得到的未备案网站信息准确、全面,该成果已在未备案网站发现及多语言网站识别系统中得到验证;本发明使用轮询机制,各个模块同时、一直运行,能够保证最终得到的未备案网站信息始终是最新的。

    一种方差优化直方图的构建方法和装置

    公开(公告)号:CN107391560A

    公开(公告)日:2017-11-24

    申请号:CN201710428418.6

    申请日:2017-06-08

    Inventor: 史亮 王勇 张鸿

    CPC classification number: G06F16/9024

    Abstract: 本发明提供了一种方差优化直方图的构建方法和装置,该方法按内存大小和查询精度设定样本数目K和直方图桶的个数B,有新元素出现时,为使样本数目保持在K,以在线数据采样方法优化内存空间的数据样本;根据优化的内存空间数据样本,动态构建方差优化直方图;该装置包括优化单元和构建单元。本发明提供的技术方案降低了数据规模与分布特征的影响,能有效减少数据倾斜或数据分布的不均匀带来的区间检索误差。

    一种三级音频索引的创建方法及音频检索方法

    公开(公告)号:CN101833986A

    公开(公告)日:2010-09-15

    申请号:CN201010177959.4

    申请日:2010-05-20

    Abstract: 一种三级音频索引的创建方法及音频检索方法,属于多媒体领域,为了解决现有技术针对大规模数据库和网络环境下的音频样例检索缺少快速、有效的索引机制的问题。本发明创建一种三级索引结构:对n维的音频特征向量降维,生成第一级索引;将第一级索引按单元长度截成一系列片段,计算其向量模,排序后作为第二级索引;计算片段的类别分,分组后作为第三级索引。基于三级索引的检索方法为:首先,计算出查询音频的一级索引值、片段向量模和类别分,然后依次利用第三级和第二级索引缩小查询范围,最后利用第一级索引计算查询音频与索引音频片段的相似度,将满足检出阈值的数据作为结果返回。?

Patent Agency Ranking