语音唤醒方法、装置、电子设备和计算机可读存储介质

    公开(公告)号:CN115312040B

    公开(公告)日:2024-11-19

    申请号:CN202210946385.5

    申请日:2022-08-08

    Abstract: 本公开提供了一种语音唤醒方法、装置、电子设备和计算机可读存储介质,涉及语音处理技术领域。所述方法包括:根据预先训练的神经网络模型对待识别语音的语谱图进行处理,得到待识别语音的声纹特征向量和唤醒词;根据预设的对应关系表,查询与唤醒词对应的注册唤醒词标签,并根据注册唤醒词标签,得到注册特征向量;根据声纹特征向量和注册特征向量,计算向量相似度;在向量相似度大于预设的阈值的情况下,进行语音唤醒。利用一个神经网络模型同时实现声纹识别和语音唤醒词匹配这两个任务,解决了两个任务分别构建模型导致的参数冗余、占用内存过大的问题,本公开流程更加简洁,唤醒速度更快。

    一种语音传输方法、系统及装置
    3.
    发明公开

    公开(公告)号:CN115223566A

    公开(公告)日:2022-10-21

    申请号:CN202210850519.3

    申请日:2022-07-19

    Abstract: 本发明实施例提供了一种语音传输方法、系统及装置,应用于数据通信技术领域。该方案应用于语音传输系统中的发送端,语音传输系统还包括接收端,该方案包括:接收待发送的语音数据;提取所述待发送的语音数据的声纹特征信息和语义信息;向所述接收端发送所提取的声纹特征信息和语义信息,以使所述接收端在接收到所述发送端发送的声纹特征信息和语义信息后,基于所接收的声纹特征信息,将所接收的语义信息转换为语音数据。通过本方案,可以提高语音传输的质量。

    异常检测方法和装置、计算机可读存储介质、电子设备

    公开(公告)号:CN114692767A

    公开(公告)日:2022-07-01

    申请号:CN202210345777.6

    申请日:2022-03-31

    Abstract: 本公开是关于一种异常检测方法和装置、计算机可读存储介质、电子设备,涉及计算机技术领域,该方法包括:获取目标待检测数据,对所述目标待检测数据进行编码,得到编码数据矩阵;生成目标半监督时序卷积神经网络,将所述编码数据矩阵输入所述目标半监督时序卷积神经网络的时序卷积神经网络中,得到输出数据矩阵;将所述输出数据矩阵输入至所述目标半监督时序卷积神经网络的变分自编码器中,得到解码数据矩阵,通过所述解码数据矩阵对所述目标待检测数据进行异常检测。本公开提高了异常检测的精度以及效率。

    图像检索方法与装置
    7.
    发明授权

    公开(公告)号:CN105022752B

    公开(公告)日:2019-04-05

    申请号:CN201410175999.3

    申请日:2014-04-29

    Abstract: 本公开涉及一种图像检索方法与装置。该方法包括自用户终端获取待检索的图像;将待检索的图像由RGB空间转换到HSV空间;将转换后的待检索图像量化为N维颜色特征;将N维颜色特征的特征值按大小降序排序,选取前M维颜色特征作为待检索图像的主颜色;根据主颜色对应的索引值确定待检索图像的聚类索引表名称;根据聚类索引表名称查询已建立的聚类索引表中是否存在与待检索图像的聚类索引表名称相同的聚类索引表;如存在,则自获取相应图像的图像索引;根据获取的图像索引查询对应的图像主色百分比;根据主色百分比计算图像之间的相似度;根据相似度将与待检索图像匹配的图像返回给用户终端。本公开显著提升了对图像的检索效率和准确度。

    图像检索方法与装置
    8.
    发明公开

    公开(公告)号:CN105022752A

    公开(公告)日:2015-11-04

    申请号:CN201410175999.3

    申请日:2014-04-29

    Abstract: 本发明涉及一种图像检索方法与装置。该方法包括自用户终端获取待检索的图像;将待检索的图像由RGB空间转换到HSV空间;将转换后的待检索图像量化为N维颜色特征;将N维颜色特征的特征值按大小降序排序,选取前M维颜色特征作为待检索图像的主颜色;根据主颜色对应的索引值确定待检索图像的聚类索引表名称;根据聚类索引表名称查询已建立的聚类索引表中是否存在与待检索图像的聚类索引表名称相同的聚类索引表;如存在,则自获取相应图像的图像索引;根据获取的图像索引查询对应的图像主色百分比;根据主色百分比计算图像之间的相似度;根据相似度将与待检索图像匹配的图像返回给用户终端。本公开显著提升了对图像的检索效率和准确度。

    获取WEB更新信息的方法和系统

    公开(公告)号:CN103699533A

    公开(公告)日:2014-04-02

    申请号:CN201210365642.2

    申请日:2012-09-27

    CPC classification number: G06F17/3089

    Abstract: 本发明公开了获取WEB更新信息的方法和系统。启动客户端,通过操作系统提供的监视键盘事件和鼠标事件的API来获取键盘和/或鼠标事件,以录制用户对目标网站的操作过程;通过浏览器提供的应用程序接口获取目标网站返回的网页信息;根据录制时获取的操作序列以及设置的任务参数生成代理任务,并提交给服务器;对于到达任务开始运行时间的代理任务,根据资源忙闲情况进行代理任务的调度;在服务器上重放用户对目标网站的操作过程,获取目标网站返回的最新网页信息,将网站返回的最新网页信息与保存的网页信息进行比对,如不同,则通知用户WEB信息已更新。本发明无需重复登录网站就能方便、快捷地获知所要查看的信息是否已更新。

    多基站混合定位方法及装置

    公开(公告)号:CN103179659A

    公开(公告)日:2013-06-26

    申请号:CN201110440039.1

    申请日:2011-12-26

    Abstract: 本发明涉及一种多基站混合定位方法,包括:读取终端周边基站的导频信息,导频信息包括一个或多个小区的到达时间差和导频强度;获取主小区PN,并根据主小区PN确定服务基站的位置坐标和扇区范围;根据至少包括主小区PN的小区PN对应的到达时间差计算距离,并根据距离和服务基站的位置坐标和扇区范围初步确定终端所在区域;根据导频信息的门限值筛选邻小区PN;根据主小区PN和筛选出的邻小区PN对应的导频信息在初步确定区域进行校正求精,确定终端的准确位置。本发明涉及一种多基站混合定位装置。本发明能够解决现有多基站定位算法对不同方向的基站信号传播环境差异缺乏考虑的问题,尽可能减少无线传播环境影响对时差定位技术造成的误差。

Patent Agency Ranking