Patent search ap:("微软技术许可有限责任公司") AND inv:"胡厚东" Page 2

11.

发明公开
将音频内容变换为图像有权

公开(公告)号：CN112840398A

公开(公告)日：2021-05-25

申请号：CN201980068378.6

申请日：2019-09-05

Applicant: 微软技术许可有限责任公司

Inventor： 黄丽 , 胡厚东 , 苏从勇

IPC: G10L21/10 , G10L25/63

Abstract: 本文描述了用于将音频内容变换为图像的技术。该技术可以包括：从源接收音频内容；将音频内容转换为音频特征时间流；以及使用经机器训练的一个或多个模型，将音频特征流转换为一个或多个图像。该技术基于对如下各项的识别来生成(多个)图像：传达与音频内容相关联的一个或多个语义主题的语义信息；以及传达与音频内容相关联的一个或多个情感的情感信息。该技术然后生成包括(多个)图像的输出表示，其将输出表示提供给一个或多个显示设备以用于在那里显示。输出表示用作音频内容的显著语义以及情感相关特性的概要。

Patent Agency Ranking