基于多处理器平台的视觉特征并行快速匹配方法和系统

    公开(公告)号:CN108052535B

    公开(公告)日:2021-02-05

    申请号:CN201711132235.6

    申请日:2017-11-15

    Abstract: 本发明涉及一种基于多处理器平台的视觉特征并行快速匹配方法和系统,包括:根据层次聚类算法对包含视觉特征的数据集进行层次聚类以获得聚类树,并根据聚类阈值确定该聚类树中各类别的聚类中心;根据该处理器个数和该聚类中心的个数,建立该聚类中心到各处理器的映射,以在各处理器的本地内存中建立哈希表;根据用户输入的查询数据与各聚类中心的距离,选择多个聚类中心所对应的哈希表作为待查表项;在每个待查表项上计算查询数据的哈希值,选择与查询数据哈希值相同的数据作为查询结果的候选点,通过计算该候选点与该查询数据之间的距离,对该候选点进行筛选得到查询结果。由此本发明可显著地提高查询效率,应对千万规模的数据检索。

    一种微博突发话题检测方法及装置

    公开(公告)号:CN106294333B

    公开(公告)日:2019-10-29

    申请号:CN201510236634.1

    申请日:2015-05-11

    Abstract: 本发明提供一种微博突发话题检测方法及装置,用以解决目前微博突发话题难以识别的问题,该方法包括,提取指定的微博数据集合中的特征项,特征项为包含具体语义的语言单元;确定特征项在微博数据集合的文本中的流通度以及特征项当前的热度;以流通度为质量参数项,以热度为位置参数项对特征项进行动力学建模,得到特征项的当前能量和加速度;在得到的能量以及加速度分别大于第一预设值以及第二预设值时,检测突发特征项;根据检测到的突发特征项在同一条微博中同时出现的情况计算突发特征项之间的互信息;当互信息大于第三阈值时,对突发特征项进行合并,得到突发话题,该方案能够提高微博突发话题检测的准确率。

    一种声学事件检测方法及装置

    公开(公告)号:CN110120230A

    公开(公告)日:2019-08-13

    申请号:CN201910015466.1

    申请日:2019-01-08

    Abstract: 本发明提供一种声学事件检测方法及装置,用以解决相关技术中声学事件检测精度较低的问题。该方法包括:提取待检测的音频的目标特征,得到第一特征数据;将所述第一特征数据分别输入第一GMM模型以及第二GMM模型,得到第一似然概率以及第二似然概率,所述第一GMM模型基于声学事件的音频的特征数据进行训练得到,所述第二GMM模型基于非声学事件的音频的特征数据进行训练得到;根据所述第一似然概率以及所述第二似然概率依次确定所述待检测的音频中各单位音频的类型,所述类型包括声学事件以及非声学事件;将确定出的相邻的类型为声学事件的单位音频合并;当合并后的音频持续的时长超过阈值时,确定发生声学事件。本发明有效提高了声学事件检测的精度。

    一种语种训练数据获得方法及装置

    公开(公告)号:CN109741731A

    公开(公告)日:2019-05-10

    申请号:CN201910015434.1

    申请日:2019-01-08

    Abstract: 本发明提供一种语种训练数据获得方法及装置,用以解决相关技术中语种训练数据质量较低的问题。该方法包括:训练用于识别各种语种的语种识别模型;使用各语种识别模型识别数据集中的第二音频数据,获得与各语种识别模型对应的得分;确定第二音频数据对应的识别语种;计算数据集中各条第二音频数据的得分信息熵;将所述数据集中,得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集,训练数据集中的第二音频数据用于训练所述语种识别模型,返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤,直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。

Patent Agency Ranking