-
公开(公告)号:CN106504744B
公开(公告)日:2020-05-01
申请号:CN201610946301.2
申请日:2016-10-26
Applicant: 科大讯飞股份有限公司
IPC: G10L13/033 , G10L15/26
Abstract: 本发明实施例提供了一种语音处理方法及装置,其中方法可以包括:获取语音数据;将所述语音数据转换为文本信息;根据预设规则,识别出所述文本信息中所包含的目标信息;对所述语音数据中与所述目标信息相对应的语音片段进行预设处理。在本发明实施例中,将语音数据转换为文本信息后,可根据预设规则识别出文本信息中所包含的说话人隐私等目标信息,然后对所述语音数据中与所述目标信息相对应的语音片段进行预设处理,例如删除该语音片段等。这样便使说话人隐私等目标信息的内容无法被别人获知,保护了说话人的权益,从而消除了语音数据在传播过程中的顾虑和阻碍,实现了隐私保护与语音传播的兼顾。
-
公开(公告)号:CN105390141B
公开(公告)日:2019-10-18
申请号:CN201510676304.4
申请日:2015-10-14
Applicant: 科大讯飞股份有限公司
IPC: G10L21/007 , G10L25/18
Abstract: 本发明提出一种声音转换方法和装置,该声音转换方法包括预先构建声音转换模型;接收源发音人的语音信号,并提取语音信号的频谱特征;确定源发音人对应的声音转换模型;根据频谱特征和源发音人对应的声音转换模型,进行声音转换,以得到目标发音人的语音信息。该声音转换方法能够有效提高声音转换的灵活性。
-
公开(公告)号:CN106156110B
公开(公告)日:2019-07-30
申请号:CN201510159102.2
申请日:2015-04-03
Applicant: 科大讯飞股份有限公司
IPC: G06F16/903 , G06F17/22
Abstract: 本发明公开了一种文本语义理解方法及系统,该方法包括:预先构建基于主网‑子网模式的有向图文法网络,所述有向图文法网络包括一个主网络、以及一个或多个子网络,所述有向图文法网络的每段路径对应一个文本字符或一个子网络标识符;获取待解析文本;基于所述有向图文法网络对所述文本进行解码,得到解码路径;获取所述解码路径的相关语义作为语义理解结果。本发明可以有效地降低有向图文法网络的复杂度,提高解码效率,降低内存消耗。
-
公开(公告)号:CN108566565A
公开(公告)日:2018-09-21
申请号:CN201810292542.9
申请日:2018-03-30
Applicant: 科大讯飞股份有限公司
IPC: H04N21/4788 , H04N21/435 , G06F17/27
Abstract: 本发明实施例提供一种弹幕展示方法及装置,属于视频直播技术领域。该方法包括:获取对语音数据进行识别后的识别文本,语音数据是通过采集直播参与者的发言所得到的;提取识别文本中的关键信息,展示关键信息对应的文本弹幕。本发明实施例通过提取识别文本中的关键信息,展示关键信息对应的文本弹幕。由于直播过程中发言人的发言也可通过文本弹幕进行显示,能够使得直播观众在听到发言人发言的同时,还能够看到发言人发言对应的文本弹幕,从而能够增强直播的节目效果。另外,相较于采用字幕的形式展示所有的发言内容,可展示发言中的关键信息,以使得观众能够注意到发言中的重点,从而进一步增强了直播的节目效果。
-
公开(公告)号:CN105260113B
公开(公告)日:2018-09-21
申请号:CN201510600544.6
申请日:2015-09-18
Applicant: 科大讯飞股份有限公司
IPC: G06F3/0488
Abstract: 本发明公开了一种滑行输入方法、装置及终端设备,该方法包括:采集用户在虚拟键盘上输入的滑行轨迹;分别确定所述滑行轨迹上的激活按键、所述滑行轨迹上及滑行轨迹之外的容错激活按键及其惩罚值,所述激活按键包括:滑行轨迹中的关键点和非关键点对应的按键,所述关键点包括:起点、拐点和终点,所述非关键点包括过点;根据所述激活按键、容错激活按键生成对应所述滑行轨迹的激活按键序列;对所述激活按键序列进行解码,得到候选中文字符或字符串;展现所述候选中文字符或字符串。本发明可以有效提高滑行输入的识别效果。
-
公开(公告)号:CN107562760A
公开(公告)日:2018-01-09
申请号:CN201610513351.1
申请日:2016-06-30
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供了一种语音数据处理方法及装置,其中方法主要包括:将语音数据转换为语音文本;获取所述语音文本的篇章结构信息;对所述语音文本进行段落划分;提取每个段落的结构特征;根据每个段落的结构特征及预设的结构判断模型确定每个段落所属的篇章;标识出各语音数据片段所属的篇章,以实现所述语音数据的结构化。在本发明中,根据获知的篇章结构信息(例如会议的流程安排等)判断出每段内容属于哪个篇章(例如属于会议流程里的哪个环节),从而梳理出语音数据的结构。这样无需再从头到尾、盲目地聆听整个语音数据,而是可以在结构化的语音数据中直接根据各语音数据片段所属的篇章来缩小查找范围,快速定位到目标内容。
-
公开(公告)号:CN106534548A
公开(公告)日:2017-03-22
申请号:CN201611034174.5
申请日:2016-11-17
Applicant: 科大讯飞股份有限公司
CPC classification number: H04M1/72552 , G10L15/22 , H04M1/72547 , H04M1/72555
Abstract: 本申请提出一种语音纠错方法和装置,该语音纠错方法包括:接收用户语音数据;确定当前纠错模式,所述纠错模式包括:语义纠错模式或者索引纠错模式;根据所述用户语音数据和所述当前纠错模式,对待纠错内容进行纠错;将纠错后的内容反馈给用户。该方法能够提高纠错准确度和适用范围,从而更好满足用户需求,提升用户体验。
-
公开(公告)号:CN106504744A
公开(公告)日:2017-03-15
申请号:CN201610946301.2
申请日:2016-10-26
Applicant: 科大讯飞股份有限公司
IPC: G10L13/033 , G10L15/26
Abstract: 本发明实施例提供了一种语音处理方法及装置,其中方法可以包括:获取语音数据;将所述语音数据转换为文本信息;根据预设规则,识别出所述文本信息中所包含的目标信息;对所述语音数据中与所述目标信息相对应的语音片段进行预设处理。在本发明实施例中,将语音数据转换为文本信息后,可根据预设规则识别出文本信息中所包含的说话人隐私等目标信息,然后对所述语音数据中与所述目标信息相对应的语音片段进行预设处理,例如删除该语音片段等。这样便使说话人隐私等目标信息的内容无法被别人获知,保护了说话人的权益,从而消除了语音数据在传播过程中的顾虑和阻碍,实现了隐私保护与语音传播的兼顾。
-
公开(公告)号:CN103065630B
公开(公告)日:2015-01-07
申请号:CN201210585934.7
申请日:2012-12-28
Applicant: 科大讯飞股份有限公司
CPC classification number: G10L15/18 , G06F3/167 , G10L15/083 , G10L15/14 , G10L15/187 , G10L15/197 , G10L19/00 , G10L2015/227
Abstract: 本发明涉及语音识别技术领域,公开了一种用户个性化信息语音识别方法及系统。该方法包括:接收用户输入的语音信号;根据基础静态解码网络逐帧对所述语音信号进行解码,得到当前帧在基础静态解码网络中各活跃节点上的解码路径,所述基础静态解码网络是与基础人名语言模型相关的解码网络;如果确定当前帧有解码路径进入所述基础静态解码网络中的人名节点,则根据所述用户的附属静态解码网络对所述人名节点进行网络扩展,所述附属静态解码网络是与特定用户人名语言模型相关的解码网络;在最后一帧解码完成后,返回识别结果。利用本发明,可以提高连续语音识别中用户个性化信息的识别准确率。
-
公开(公告)号:CN118427327A
公开(公告)日:2024-08-02
申请号:CN202410515278.6
申请日:2024-04-26
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/335 , G06N3/006 , G06F3/0481
Abstract: 本申请公开了一种问题推荐方法、装置、设备和存储介质,该方法包括:将目标智能体中由目标用户配置的自定义任务链,作为目标智能体的问题推荐任务链,问题推荐任务链包括至少一个任务节点,各任务节点协作以按照目标问题推荐逻辑进行问题推荐;利用问题推荐任务链为目标用户进行问题推荐,得到目标智能体向目标用户推送的目标推荐问题。通过上述方式,本申请能够得到符合用户要求的推荐问题,进而能够提高对话的效率和用户体验。
-
-
-
-
-
-
-
-
-