将音频内容变换为图像
    11.
    发明公开

    公开(公告)号:CN112840398A

    公开(公告)日:2021-05-25

    申请号:CN201980068378.6

    申请日:2019-09-05

    Abstract: 本文描述了用于将音频内容变换为图像的技术。该技术可以包括:从源接收音频内容;将音频内容转换为音频特征时间流;以及使用经机器训练的一个或多个模型,将音频特征流转换为一个或多个图像。该技术基于对如下各项的识别来生成(多个)图像:传达与音频内容相关联的一个或多个语义主题的语义信息;以及传达与音频内容相关联的一个或多个情感的情感信息。该技术然后生成包括(多个)图像的输出表示,其将输出表示提供给一个或多个显示设备以用于在那里显示。输出表示用作音频内容的显著语义以及情感相关特性的概要。

Patent Agency Ranking