-
公开(公告)号:CN115798517B
公开(公告)日:2023-04-28
申请号:CN202310080355.5
申请日:2023-02-08
Applicant: 南京邮电大学
IPC: G10L25/54 , G10L25/27 , G10L25/03 , G06F16/683 , G06F16/61 , G06F16/632 , G06F16/638 , G06F16/901 , G06Q30/0601
Abstract: 本发明提供一种基于语音信息特征数据的商品搜索方法及系统,该方法通过卖家用户端收集商品编号id与商品的语音信息,对收集到的商品的语音信息对应的波形图数据转换为三维频谱图序列集;计算获得商品语音信息特征数据的哈希编码后,根据商品编号与得到的商品语音信息特征数据的哈希编码更新数据库服务器中的商品信息;对待搜索商品的语音信息的波形图,转换为待搜索商品的频谱图序列;将待搜索哈希编码与数据库服务器中保存的各商品语音信息特征数据的哈希编码分别计算相似度;将得到的商品信息序列作为商品搜索结果;本发明无需将商品的语音信息转换为文字或普通话等中间形式,能够高效、准确地查找用语音信息作为显著特征的商品。
-
公开(公告)号:CN115798517A
公开(公告)日:2023-03-14
申请号:CN202310080355.5
申请日:2023-02-08
Applicant: 南京邮电大学
IPC: G10L25/54 , G10L25/27 , G10L25/03 , G06F16/683 , G06F16/61 , G06F16/632 , G06F16/638 , G06F16/901 , G06Q30/0601
Abstract: 本发明提供一种基于语音信息特征数据的商品搜索方法及系统,该方法通过卖家用户端收集商品编号id与商品的语音信息,对收集到的商品的语音信息对应的波形图数据转换为三维频谱图序列集;计算获得商品语音信息特征数据的哈希编码后,根据商品编号与得到的商品语音信息特征数据的哈希编码更新数据库服务器中的商品信息;对待搜索商品的语音信息的波形图,转换为待搜索商品的频谱图序列;将待搜索哈希编码与数据库服务器中保存的各商品语音信息特征数据的哈希编码分别计算相似度;将得到的商品信息序列作为商品搜索结果;本发明无需将商品的语音信息转换为文字或普通话等中间形式,能够高效、准确地查找用语音信息作为显著特征的商品。
-
公开(公告)号:CN119691468A
公开(公告)日:2025-03-25
申请号:CN202510194575.X
申请日:2025-02-21
Applicant: 南京邮电大学
IPC: G06F18/22 , G06F18/15 , G06F18/2131 , G06F18/25 , G06F18/27 , G06F18/2415 , G06F18/214
Abstract: 本发明公开了一种基于耳机惯性传感器的汉语失声人群唇语实时识读方法,属于唇语翻译技术领域;方法为:获取惯性数据;利用轻量级方法分割出音节惯性数据;利用一致性方法融合加速度计音节惯性数据和陀螺仪音节惯性数据;利用动态时间规整距离DTW方法识别音节惯性数据;利用汉语的上下文信息完善和纠正字符的选择。本发明通过转换器实现惯性数据的扩充,并对数据进行处理,消除噪声数据;基于归一化最小均方算法NLMS,将干净的清晰度相关信号与受说话人干扰影响的清晰度相关信号分离,实现对耳机扬声器在音频播放过程中产生的振动影响的消除;抑制了用户和设备之间多样性的影响,保证实时唇语翻译的正确率和准确率。
-
-