识别文本展示方法及装置

    公开(公告)号:CN108536654B

    公开(公告)日:2022-05-17

    申请号:CN201810330612.5

    申请日:2018-04-13

    Inventor: 胡尹

    Abstract: 本发明实施例提供一种识别文本展示方法及装置,属于语音识别和自然语言处理技术领域。方法包括:获取识别文本中每一分词的分类特征;将每一分词的分类特征输入至分类模型,输出每一分词的分类标记,分类标记用于表示分词在识别文本中的重要程度和/或在识别文本中的异常情况;根据每一分词的分类标记,确定每一分词的展示方式,并基于每一分词的展示方式对识别文本中每一分词进行展示。由于在展示识别文本中文本内容的同时,还可以通过展示方式来体现分词在识别文本中的重要程度和/或在识别文本中的异常情况,从而承载发言人发言时的情感色彩和/或发言时的语义。因此,满足了发言人个性化展示其发言的需求。

    语音数据热度分析方法及系统

    公开(公告)号:CN107507627B

    公开(公告)日:2021-02-02

    申请号:CN201610425701.9

    申请日:2016-06-14

    Abstract: 本发明公开了一种语音数据热度分析方法及系统,该方法包括:接收语音数据;对所述语音数据进行端点检测,得到所述语音数据中的各有效语音段和非有效语音段;对所述有效语音段进行语音识别,得到对应所述有效语音段的识别文本;对各有效语音段提取基于声学上的热度特征;根据各有效语音段及其对应的识别文本提取各有效语音段基于内容上的热度特征;利用所述基于声学上的热度特征和基于内容上的热度特征、以及预先构建的热度预测模型,计算各有效语音段的第一热度值。利用本发明,可以提高语音数据热度分析的准确性。

    一种音频环境展示方法及装置

    公开(公告)号:CN110099332B

    公开(公告)日:2021-08-13

    申请号:CN201910424815.5

    申请日:2019-05-21

    Abstract: 本申请公开了一种音频环境展示方法及装置,该方法包括:在实时获取到每一待预测音频段后,可以先将当前获取的待预测音频段作为目标音频段,然后对目标音频段所属的环境类型进行预测,得到预测环境类型,接着,再展示出得到的目标音频段所属的预测环境类型。可见,本申请不仅能够预测出实时获取到的每一待预测音频段所属的环境类型,还能够将预测结果向用户进行实时展示,从而使得用户能够实时获知每一目标音频段所属的环境类型,进而可以根据该环境类型,从每一目标音频段中获取到其所关注的内容,提升了用户体验。

    语音识别文本分段方法及装置

    公开(公告)号:CN107305541A

    公开(公告)日:2017-10-31

    申请号:CN201610256898.8

    申请日:2016-04-20

    CPC classification number: G06F17/271 G06F17/2785 G10L15/02 G10L15/04

    Abstract: 本发明公开了一种语音识别文本分段方法及装置,该方法包括:对语音数据进行端点检测,得到各语音段及各语音段的开始帧序号和结束帧序号;对各语音段进行语音识别,得到各语音段对应的识别文本;提取各语音段对应的识别文本的分段特征;利用提取的分段特征以及预先构建的分段模型,对所述语音数据对应的识别文本进行分段检测,以确定需要分段的位置;根据分段检测结果对所述语音数据对应的识别文本进行分段。本发明可以自动地实现对识别文本进行分段,使识别文本的篇章结构更加清晰。

    语音识别文本分段方法及装置

    公开(公告)号:CN107305541B

    公开(公告)日:2021-05-04

    申请号:CN201610256898.8

    申请日:2016-04-20

    Abstract: 本发明公开了一种语音识别文本分段方法及装置,该方法包括:对语音数据进行端点检测,得到各语音段及各语音段的开始帧序号和结束帧序号;对各语音段进行语音识别,得到各语音段对应的识别文本;提取各语音段对应的识别文本的分段特征;利用提取的分段特征以及预先构建的分段模型,对所述语音数据对应的识别文本进行分段检测,以确定需要分段的位置;根据分段检测结果对所述语音数据对应的识别文本进行分段。本发明可以自动地实现对识别文本进行分段,使识别文本的篇章结构更加清晰。

    演讲水平评价方法和装置及系统

    公开(公告)号:CN106847263A

    公开(公告)日:2017-06-13

    申请号:CN201710024211.2

    申请日:2017-01-13

    Inventor: 胡尹 潘青华 杨光

    CPC classification number: G10L15/02 G10L15/1822 G10L15/26 G10L25/51

    Abstract: 本申请提出一种演讲水平评价方法和装置及系统,该方法包括:接收待评价的演讲语音数据;对所述演讲语音数据进行语音识别,得到识别文本数据;分别对所述演讲语音数据和所述识别文本数据进行特征提取,得到演讲评价特征,所述演讲评价特征包括:声学演讲评价特征和语义演讲评价特征;根据所述演讲评价特征和预先构建的演讲水平评价模型,对所述演讲语音数据的演讲水平进行评价,得到演讲水平的评价结果。该方法能够在评价演讲水平时,无需人工参与,从而提高实用性、客观性和准确性,以及降低成本。

    实现语音自动分类的方法及系统

    公开(公告)号:CN105427858A

    公开(公告)日:2016-03-23

    申请号:CN201510752871.3

    申请日:2015-11-06

    Abstract: 本发明公开了一种实现语音自动分类的方法及系统,该方法包括:接收待分类语音数据;对待分类语音数据进行语音识别,得到识别文本;对所述待分类语音数据进行声学分析,得到声学上的分类特征;对所述识别文本进行内容分析,得到内容上的分类特征;利用所述声学上的分类特征、内容上的分类特征、以及预先构建的语音分类模型对所述待分类语音数据进行分类,得到所述待分类语音数据所属类型。利用本发明,可以减少人工工作量,并提高语音数据分类的准确率。

    语音处理方法及相关装置、电子设备、存储介质

    公开(公告)号:CN114898755B

    公开(公告)日:2023-01-17

    申请号:CN202210824381.X

    申请日:2022-07-14

    Abstract: 本申请公开了一种语音处理方法及相关装置、电子设备、存储介质,其中,语音处理方法包括:获取持续至当前时刻的空白语音的语音时长,并判断语音时长是否不小于首个检测时长;响应于语音时长不小于首个检测时长,基于截止至当前时刻采集到的有效语音,获取语音处理结果,并基于空白语音的端点时刻,确定参考时刻;将最新使用的检测时长的下一检测时长,作为参考时长,并判断从参考时刻开始持续采集参考时长的参考语音是否仍空白;若是且所有检测时长均已使用,则将最新获取的语音处理结果置为有效。上述方案,能够提升语音交互的响应速度。

    演讲水平评价方法和装置及系统

    公开(公告)号:CN106847263B

    公开(公告)日:2020-09-11

    申请号:CN201710024211.2

    申请日:2017-01-13

    Inventor: 胡尹 潘青华 杨光

    Abstract: 本申请提出一种演讲水平评价方法和装置及系统,该方法包括:接收待评价的演讲语音数据;对所述演讲语音数据进行语音识别,得到识别文本数据;分别对所述演讲语音数据和所述识别文本数据进行特征提取,得到演讲评价特征,所述演讲评价特征包括:声学演讲评价特征和语义演讲评价特征;根据所述演讲评价特征和预先构建的演讲水平评价模型,对所述演讲语音数据的演讲水平进行评价,得到演讲水平的评价结果。该方法能够在评价演讲水平时,无需人工参与,从而提高实用性、客观性和准确性,以及降低成本。

    实现语音自动分类的方法及系统

    公开(公告)号:CN105427858B

    公开(公告)日:2019-09-03

    申请号:CN201510752871.3

    申请日:2015-11-06

    Abstract: 本发明公开了一种实现语音自动分类的方法及系统,该方法包括:接收待分类语音数据;对待分类语音数据进行语音识别,得到识别文本;对所述待分类语音数据进行声学分析,得到声学上的分类特征;对所述识别文本进行内容分析,得到内容上的分类特征;利用所述声学上的分类特征、内容上的分类特征、以及预先构建的语音分类模型对所述待分类语音数据进行分类,得到所述待分类语音数据所属类型。利用本发明,可以减少人工工作量,并提高语音数据分类的准确率。

Patent Agency Ranking