-
公开(公告)号:CN112840398A
公开(公告)日:2021-05-25
申请号:CN201980068378.6
申请日:2019-09-05
Applicant: 微软技术许可有限责任公司
Abstract: 本文描述了用于将音频内容变换为图像的技术。该技术可以包括:从源接收音频内容;将音频内容转换为音频特征时间流;以及使用经机器训练的一个或多个模型,将音频特征流转换为一个或多个图像。该技术基于对如下各项的识别来生成(多个)图像:传达与音频内容相关联的一个或多个语义主题的语义信息;以及传达与音频内容相关联的一个或多个情感的情感信息。该技术然后生成包括(多个)图像的输出表示,其将输出表示提供给一个或多个显示设备以用于在那里显示。输出表示用作音频内容的显著语义以及情感相关特性的概要。