一种特定场景语音内容识别优化方法

    公开(公告)号:CN117095673A

    公开(公告)日:2023-11-21

    申请号:CN202310830037.6

    申请日:2023-07-07

    Abstract: 本发明涉及语音识别领域,尤其为一种特定场景语音内容识别优化方法,包括如下步骤:包括如下步骤:S1:使用网络爬虫技术对网络中特定场景的语音进行爬取,获得初始语音数据;S2:提取初始语音数据并对初始语音数据进行数据预处理获得预处理数据;S3:通过卷积神经网络训练实用模型,对预处理数据进行语音识别并生成初始文本;S4:使用文本规范算法对初始文本进行文本润色保证输出最终文本的正确性。本发明通过对获取的语音进行预处理起到数据增强的作用保证了数据不失真,在获取到不失真的数据后对其进行特征提取确保了工作速度,对提取出的初始文本进行文本规范算法用常见的文本代替初始文本中出现的非人类语言,保证最后出现的文本不会出现错误。

    一种音视频片段分类方法及装置

    公开(公告)号:CN111625661B

    公开(公告)日:2023-09-08

    申请号:CN202010408234.5

    申请日:2020-05-14

    Abstract: 本发明实施例公开了一种音视频片段分类方法及装置,所述方法包括:基于待分类音视频片段的视频帧序列提取目标视频帧,基于待分类音视频片段的音频帧序列提取目标音频帧;基于目标视频帧/目标音频帧的第一出现时刻/第二出现时刻及预设子片段时长确定第一音视频子片段/第二音视频子片段;基于第一音视频子片段/第二音视频子片段提取第一视频分量特征和第一音频分量特征/第二视频分量特征和第二音频分量特征;通过预设音视频分类模型基于第一视频分量特征、第一音频分量特征、第二视频分量特征和第二音频分量特征确定待分类音视频片段的音视频分类结果。采用本发明可以提高音视频分类效率,提高音视频分类的鲁棒性和准确率。

    一种VoIP网络流量所属平台的识别方法

    公开(公告)号:CN111641599A

    公开(公告)日:2020-09-08

    申请号:CN202010394712.1

    申请日:2020-05-11

    Abstract: 一种VoIP网络流量所属平台的识别方法,包括:根据流量特征从流量数据中过滤出VoIP流量,并根据五元组信息对VoIP流量进行拆分,生成新的流量文件;识别每个流量文件中的上下行流量,提取和计算上行、下行、合并流量的特征指标,并构成每个流量文件的特征向量;使用随机森林模型进行建模,构建VoIP平台识别模型,输入是由多个流量文件的特征向量构成的特征向量矩阵,输出是多个流量文件分别对应的VoIP平台标签;将待识别的多个流量文件的特征向量构成的特征向量矩阵输入至VoIP平台识别模型,并获得每个待识别的流量文件分别对应的VoIP平台标签。本发明属于信息技术领域,能有效识别加密后的VoIP流量及其平台归属。

Patent Agency Ranking