-
公开(公告)号:CN109684501A
公开(公告)日:2019-04-26
申请号:CN201811420240.1
申请日:2018-11-26
申请人: 平安科技(深圳)有限公司
CPC分类号: G10L25/48
摘要: 本发明公开了一种歌词信息生成方法,包括:根据音乐文件的旋律信息获取歌词生成过程的歌词长度的约束条件;在歌词生成过程中,获取输入的所述音乐文件的种子歌词,在所述约束条件下,根据所述种子歌词生成次级歌词;根据所述种子歌词和次级歌词,生成所述音乐文件的歌词信息。本发明还公开一种歌词信息生成装置。本发明能够快速高效地生成歌词信息,能适应处理量的要求。并且生成的歌词信息与音乐文件匹配程度较高,种子歌词与次级歌词之间的衔接顺畅。本发明在语音语义的处理领域中,应用自然语言处理等相关技术,实现对音乐文件的语义解析,最终生成歌词信息。
-
公开(公告)号:CN109600700A
公开(公告)日:2019-04-09
申请号:CN201811367566.2
申请日:2018-11-16
申请人: 珠海市杰理科技股份有限公司
IPC分类号: H04R3/02 , G10L21/0232 , G10L25/48
CPC分类号: H04R3/02 , G10L21/0232 , G10L25/48
摘要: 本申请涉及一种音频数据处理方法、装置、计算机设备和存储介质。方法包括:获取第一音频数据;将第一音频数据进行插值,获得插值后的音频数据;将插值后的音频数据写入数据缓存区中;当特征音频数据的数据量满足预设条件时,获取到参考音频数据;根据参考音频数据查找到数据缓存区中的特征音频数据的特定位置;将参考音频数据与数据缓存区中以特定位置为起点的特征音频数据进行加权叠加操作,获得叠加后的音频数据;将叠加后的音频数据替换数据缓存区中的特征音频数据;提取出替换后的数据缓存区中的第二音频数据;输出数据缓存区中的第二音频数据。采用本方法能够使得声音无法在某个频率被反馈放大而形成啸叫,达到了啸叫抑制的效果。
-
公开(公告)号:CN107408386B
公开(公告)日:2018-11-23
申请号:CN201680014289.X
申请日:2016-02-04
申请人: 高通股份有限公司
CPC分类号: G10L15/22 , G06F3/167 , G10L25/18 , G10L25/21 , G10L25/48 , G10L2015/223 , H04M2250/74
摘要: 本文揭示一种用于响应于由用户发出的语音来控制电子装置的方法。所述方法可包含通过声音传感器接收输入声音。所述方法还可检测所述输入声音中由所述用户发出的所述语音,响应于检测所述输入声音中的所述语音来确定所述语音的第一频率范围的第一特征和第二频率范围的第二特征,以及基于所述第一特征和所述第二特征来确定由所述用户发出的所述语音的离开方向是否朝向所述电子装置。
-
公开(公告)号:CN108776932A
公开(公告)日:2018-11-09
申请号:CN201810495325.X
申请日:2018-05-22
申请人: 深圳壹账通智能科技有限公司
发明人: 何麒
CPC分类号: G06Q40/06 , G06K9/00268 , G06K9/00288 , G06K9/00302 , G06K9/6292 , G10L25/03 , G10L25/48
摘要: 本发明提供了一种用户投资类型的确定方法、存储介质和服务器,包括:获取用户在面审过程中的音视频文件;从所述音视频文件中分离出视频数据和音频数据;根据所述视频数据提取所述用户的特征图像,根据所述音频数据提取所述用户的语音特征;将提取的所述用户的特征图像输入至图像人格模型,获取针对所述用户的特征图像的第一人格评分;将提取的用户的语音特征输入至音频人格模型,获取针对所述用户的语音特征的第二人格评分;将所述第一人格评分与所述第二人格评分进行融合,根据融合结果确定所述用户的综合人格评分;根据确定的所述用户的综合人格评分评估所述用户的投资类型。本发明可节省人工审核的人力,提高审核评估的效率。
-
公开(公告)号:CN108744542A
公开(公告)日:2018-11-06
申请号:CN201810587142.0
申请日:2018-06-08
申请人: 武汉蛋玩科技有限公司
摘要: 本发明提供了一种机器人舞曲动作设计方法及机器人,通过划分播放音乐的小节的长度、幅度、速度,与机器人动作库内的动作进行相对应的匹配,做到整齐划一的节奏展现;本发明在播放音乐的同时,通过精准解析音频文件各项参数,调用相应的动作库与之匹配达到音乐节奏感的最佳体验,机器人的动作会与音频的长度、幅度保持高度同一,将音乐的旋律通过直观的视觉体验展现出来。
-
公开(公告)号:CN106463142B
公开(公告)日:2018-08-03
申请号:CN201580023601.7
申请日:2015-04-30
申请人: 高通股份有限公司
发明人: 沙拉什·曼朱纳什 , 丹尼尔·贾里德·辛德尔
IPC分类号: G10L21/003 , G10L13/033
CPC分类号: G10L21/003 , G10L13/033 , G10L17/00 , G10L25/48
摘要: 种装置包含接收器、存储器和处理器。所述接收器经配置以接收远程话音简档。所述存储器电耦合到所述接收器。所述存储器经配置以存储与人相关联的本地话音简档。所述处理器电耦合到所述存储器和所述接收器。所述处理器经配置以基于与所述远程话音简档相关联的语音内容或与所述远程话音简档相关联的识别符而确定所述远程话音简档与所述人相关联。所述处理器还经配置以基于所述确定而选择所述本地话音简档用于简档管理。种用于基于人口统计和使用模式参数来修改经文字到语音转换信号的装置。
-
公开(公告)号:CN108322365A
公开(公告)日:2018-07-24
申请号:CN201710026540.0
申请日:2017-01-14
申请人: 富士康(昆山)电脑接插件有限公司 , 鸿腾精密科技股份有限公司
发明人: 黄铭杰
CPC分类号: G10L15/30 , G10L15/01 , G10L15/22 , G10L2015/223 , H04L12/282 , H04L12/2838 , H04N21/42203 , H04N21/42222 , H04L12/2803 , G10L25/48 , H04L12/2816 , H04L2012/2841
摘要: 一种语音控制系统,包括数个开关及一个移动设备,所述数个开关分别控制相应的电子设备。所述数个开关通过无线网格网络彼此相连,所述每个开关均设有麦克风及喇叭。当使用者对任一开关发出语音指令时,该开关通过麦克风接收语音指令且由无线网格网络将语音指令传达至最邻近于移动设备的邻近开关,所述邻近开关通过喇叭发送语音指令至移动设备,所述移动设备则通过互联网控制语音指令中提及的开关执行工作。藉由该语音控制系统,使用者在未携带移动设备时,可以利用无线网格网络功能不受空间限制的达到传递语音指令来完成动作,从而增加智能家庭的便利性。
-
公开(公告)号:CN108206025A
公开(公告)日:2018-06-26
申请号:CN201711177914.5
申请日:2017-11-23
申请人: 包云清
发明人: 包云清
摘要: 本发明涉及一种收音机音频信号分析方法,所述方法包括:使用信号提取设备,设置在收音机的电路板上,与收音机的播放器连接,用于提取收音机的播放器当前播放的音频成分,以作为播放音频信号输出;使用信号采集设备,设置在收音机的电路板上,用于采集收音机所在位置的音频信息,以作为总音频信号输出;使用信号分离设备,设置在收音机的电路板上,分别与所述信号提取设备和所述信号分离设备连接,用于接收所述播放音频信号和所述总音频信号,并从所述总音频信号中剥离出所述播放音频信号,将剥离后的所述总音频信号中剩余的音频成分作为背景音频信号输出。
-
公开(公告)号:CN104246878B
公开(公告)日:2018-04-27
申请号:CN201380022164.8
申请日:2013-05-06
申请人: 高通股份有限公司
CPC分类号: H04R29/005 , G01S3/80 , G10L17/00 , G10L21/00 , G10L25/06 , G10L25/48 , G10L2021/02166 , H04L65/403 , H04N7/15 , H04R1/406 , H04R3/005 , H04R29/008 , H04R2430/20 , H04R2460/01 , H04R2499/11
摘要: 一种执行多个参与者的社交交互分析的系统包含处理器。所述处理器经配置以确定第一经空间滤波输出与多个第二经空间滤波输出中的每一者之间的相似性。所述处理器经配置以基于所述第一经空间滤波输出与所述第二经空间滤波输出中的每一者之间的所述相似性确定所述参与者之间的所述社交交互,且显示表示所述参与者之间的所述社交交互的输出。所述第一经空间滤波输出是从固定麦克风阵列接收,且所述第二经空间滤波输出是从各自对应于不同参与者的多个可导向麦克风阵列接收。
-
公开(公告)号:CN107918726A
公开(公告)日:2018-04-17
申请号:CN201710981331.1
申请日:2017-10-18
申请人: 深圳市汉普电子技术开发有限公司
CPC分类号: G06F21/32 , G06K9/00268 , G10L17/005 , G10L25/48 , G10L25/51
摘要: 本发明公开了一种距离感应方法、设备及存储介质,本发明通过距离感应设备获取当前用户的人脸图像信息,根据所述人脸图像信息计算与所述当前用户之间的第一参考距离,获取当前环境中的声音音频信息,根据所述声音音频信息计算与所述当前用户之间的第二参考距离,根据所述第一参考距离与所述第二参考距离确定目标距离,将所述目标距离与预设距离进行比对,当所述目标距离小于所述预设距离时,启动人机对话功能,能够通过人脸识别和声波感应获得的距离与预设距离比较,从而让设备做出不同响应,不用依赖特定关键词进行设备唤醒,缩短了设备响应的时间,让设备更加智能化和人性化,提升了用户体验。
-
-
-
-
-
-
-
-
-