热词管理方法、语音识别方法、装置、设备及存储介质

    公开(公告)号:CN116052676A

    公开(公告)日:2023-05-02

    申请号:CN202211678465.3

    申请日:2022-12-26

    Abstract: 本申请提供了热词管理方法、语音识别方法、装置、设备及存储介质,具体实现方案为:获取语音识别的第一文本以及第二文本,其中,所述第二文本是对所述第一文本进行编辑得到的;利用所述第二文本根据对所述第一文本进行编辑的编辑类型,在所述第二文本中确定热词候选词;利用基于热词库和所述热词候选词在用户历史语音数据中的使用情况,在所述热词候选词中确定目标热词;根据所述目标热词更新所述热词库,得到更新后的热词库;其中,所述热词库用于辅助对待识别语音进行语音识别根据本申请的技术方案,能够有效能够显著提升语音转写文本的准确性。

    稿件生成方法、装置、电子设备和存储介质

    公开(公告)号:CN117710526A

    公开(公告)日:2024-03-15

    申请号:CN202311693721.0

    申请日:2023-12-06

    Abstract: 本发明提供一种稿件生成方法、装置、电子设备和存储介质,其中方法包括:确定目标音频;基于目标音频进行要点提取,得到内容要点;基于内容要点进行稿件生成,得到带有图像的目标稿件;图像与内容要点关联,实现了图文并茂的稿件生成,不仅保证了出稿效率,还提升了稿件质量,具有较好的生动性和真实性,克服了传统方案中人工编辑出稿速度慢、智能写作稿件缺乏真实性和生动性,以及后期需要人工处理,十分不便的缺陷,实现了快速有效的稿件生成,极大地缩短了出稿时间,提升了出稿速度和稿件质量。

    说话人标注方法、装置、电子设备和存储介质

    公开(公告)号:CN115985315A

    公开(公告)日:2023-04-18

    申请号:CN202211635354.4

    申请日:2022-12-19

    Abstract: 本发明提供一种说话人标注方法、装置、电子设备和存储介质,涉及语音处理技术领域,该方法包括:获取语音数据,并对语音数据进行转写,得到转写文本;对语音数据进行切分,得到至少一个语音片段,并提取每个语音片段的声纹特征;针对每个设定时间段,对设定时间段内的声纹特征进行聚类分析,得到说话人分离结果;利用说话人分离结果对第一历史说话人分离结果进行聚类更新,基于更新后的第一历史说话人分离结果对转写文本进行说话人标注;其中,第一历史说话人分离结果是基于设定时间段之前的至少一个设定时间段对应的说话人分离结果确定的。本发明提供的技术方案能够对语音转写文本进行说话人标注,提高说话人标注的准确性。

Patent Agency Ranking