-
公开(公告)号:CN103797483B
公开(公告)日:2017-02-22
申请号:CN201280028522.1
申请日:2012-06-04
申请人: 沙扎姆娱乐有限公司
发明人: A·L-C·王
IPC分类号: G06F17/30
摘要: 提供用于标识数据流中的内容的方法和系统。在一个示例中,客户端设备接收到连续数据流,并且基于存储在该客户端设备上的内容模式基本上连续地执行数据流中的内容的内容标识。存储在该客户端设备上的该内容模式可包括与媒体文件的提取的特征或描述媒体文件的特征的临时映射集关联的信息。该客户端设备可确定该连续数据流是否包括媒体内容,以及基于该确定,在该客户端设备处连续执行数据流中的内容的内容标识。基于接收指令,该客户端设备可查询服务器来确定该数据流中的内容的标识。
-
公开(公告)号:CN102959544B
公开(公告)日:2016-06-08
申请号:CN201180032480.4
申请日:2011-05-04
申请人: 沙扎姆娱乐有限公司
IPC分类号: G06F17/30
CPC分类号: G10L19/00 , G06F16/95 , G10H1/361 , G10H2220/011 , G10L25/48
摘要: 提供了同步媒体的系统和方法。客户端设备可以被用于捕获正被媒体渲染源渲染的媒体流的样本。所述客户端设备将所述样本发送到位置识别模块,以确定指示所述媒体流中对应于所述样本的采样时间的位置的时间偏移,并且可选地确定时间尺度比,所述时间尺度比指示基于所述媒体流的参考速度的由所述媒体渲染源正在渲染所述媒体流的速度。所述客户端设备使用当前时间、所述媒体样本的时间戳、所述时间偏移、以及可选地使用时间尺度比,来计算实时偏移。所述客户端设备接着在对应于所述实时偏移的位置渲染第二媒体流,以与正被所述媒体渲染源渲染的媒体流同步。
-
公开(公告)号:CN103003875B
公开(公告)日:2015-06-03
申请号:CN201180035459.X
申请日:2011-05-16
申请人: 沙扎姆娱乐有限公司
发明人: O.托迪克
IPC分类号: G10L15/05
CPC分类号: G10L15/05 , G10H1/0008 , G10H1/368 , G10H2210/046 , G10H2210/091 , G10H2220/011 , G10H2250/021
摘要: 提供了用于执行音频与相应文本转录的同步并确定定时同步的置信值的方法和系统。可以用语音识别在正向和反向上同步音频和相应文本(例如副本),以输出时间注释的音频-歌词同步的数据。可以计算量度以量化和/或限制同步的置信。基于该量度,示例实施例描述了一种方法,用于增强自动同步过程,以可能使隐马尔科夫模型(HMM)适应同步音频,用于在语音识别时使用。其他例子描述了用于选择合适的HMM来使用的方法。
-
公开(公告)号:CN102959544A
公开(公告)日:2013-03-06
申请号:CN201180032480.4
申请日:2011-05-04
申请人: 沙扎姆娱乐有限公司
IPC分类号: G06F17/30
CPC分类号: G10L19/00 , G06F16/95 , G10H1/361 , G10H2220/011 , G10L25/48
摘要: 提供了同步媒体的系统和方法。客户端设备可以被用于捕获正被媒体渲染源渲染的媒体流的样本。所述客户端设备将所述样本发送到位置识别模块,以确定指示所述媒体流中对应于所述样本的采样时间的位置的时间偏移,并且可选地确定时间尺度比,所述时间尺度比指示基于所述媒体流的参考速度的由所述媒体渲染源正在渲染所述媒体流的速度。所述客户端设备使用当前时间、所述媒体样本的时间戳、所述时间偏移、以及可选地使用时间尺度比,来计算实时偏移。所述客户端设备接着在对应于所述实时偏移的位置渲染第二媒体流,以与正被所述媒体渲染源渲染的媒体流同步。
-
公开(公告)号:CN1592906A
公开(公告)日:2005-03-09
申请号:CN01813565.X
申请日:2001-07-26
申请人: 沙扎姆娱乐有限公司
发明人: 埃弗里·L·C·王 , 朱利叶斯·O·史密斯第三
CPC分类号: G10L19/018 , G06F17/30743 , G06F17/30758 , G10L15/26 , G10L17/26 , G11B27/28
摘要: 识别音频样本方法,从索引大组原始记录的数据库中,定位音频样本匹配的音频文件。数据库索引中,每索引的音频文件由标志时间点和关联指纹代表。标志出现在文件内可再生位置,指纹代表标志时间点处、附近信号特征。为执行识别,未知的样本计算标志和指纹,使用标志和指纹从数据库检索匹配指纹。对每包含匹配指纹的文件,标志与样本的计算出相同指纹的标志相比较。若大量对应标志线性相关,样本和检索文件等价指纹时间演化相同,文件认为与样本同。此法可用于任何声音、音乐,对遭受背景噪声、压缩人工信号、传送信息遗失的线性或非线性失真音频信号特有效。样本可在与数据库项目数对数成比例时间内辨认;给定充分计算力,可随声音采样实时执行识别。
-
公开(公告)号:CN102959543B
公开(公告)日:2016-05-25
申请号:CN201180032224.5
申请日:2011-05-04
申请人: 沙扎姆娱乐有限公司
IPC分类号: G06F17/30
CPC分类号: H04L67/2842 , G06F16/683 , G06F16/95 , G11B27/28 , H04H60/37 , H04H2201/90 , H04L65/601 , H04N21/4394 , H04N21/8549
摘要: 提供用于处理媒体流的样本的方法和系统。在一个示例中,一种方法包括接收由媒体渲染源渲染的媒体流的样本,并且,对于从中获得所述样本的匹配媒体记录,所述方法还包括接收包括在时间上映射的描述所述匹配媒体记录的内容的特征的集合的签名文件。可以将每个接收的签名文件存储在存储器中。另外,可以接收包括从媒体流提取的特征的签名流,并且,可以确定所述媒体流的签名流与用于至少一个匹配媒体记录的签名文件之间的匹配特征的数目。在一个示例中,当所述媒体流的签名流与用于匹配媒体记录的签名文件之间的基本上匹配的特征停止出现时,可以识别中断。
-
公开(公告)号:CN103797483A
公开(公告)日:2014-05-14
申请号:CN201280028522.1
申请日:2012-06-04
申请人: 沙扎姆娱乐有限公司
发明人: A·L-C·王
IPC分类号: G06F17/30
摘要: 提供用于标识数据流中的内容的方法和系统。在一个示例中,客户端设备接收到连续数据流,并且基于存储在该客户端设备上的内容模式基本上连续地执行数据流中的内容的内容标识。存储在该客户端设备上的该内容模式可包括与媒体文件的提取的特征或描述媒体文件的特征的临时映射集关联的信息。该客户端设备可确定该连续数据流是否包括媒体内容,以及基于该确定,在该客户端设备处连续执行数据流中的内容的内容标识。基于接收指令,该客户端设备可查询服务器来确定该数据流中的内容的标识。
-
公开(公告)号:CN103003875A
公开(公告)日:2013-03-27
申请号:CN201180035459.X
申请日:2011-05-16
申请人: 沙扎姆娱乐有限公司
发明人: O.托迪克
IPC分类号: G10L15/05
CPC分类号: G10L15/05 , G10H1/0008 , G10H1/368 , G10H2210/046 , G10H2210/091 , G10H2220/011 , G10H2250/021
摘要: 本发明提供了用于执行音频与相应文本转录的同步并确定定时同步的置信值的方法和系统。可以用语音识别在正向和反向上同步音频和相应文本(例如副本),以输出时间注释的音频-歌词同步的数据。可以计算量度以量化和/或限制同步的置信。基于该量度,示例实施例描述了一种方法,用于增强自动同步过程,以可能使隐马尔科夫模型(HMM)适应同步音频,用于在语音识别时使用。其他例子描述了用于选择合适的HMM来使用的方法。
-
公开(公告)号:CN105843968A
公开(公告)日:2016-08-10
申请号:CN201610334894.7
申请日:2011-05-04
申请人: 沙扎姆娱乐有限公司
CPC分类号: G10L19/00 , G06F16/95 , G10H1/361 , G10H2220/011 , G10L25/48
摘要: 提供了一种方法,包括:接收正被媒体渲染源渲染的媒体流的媒体样本;由计算设备确定与所述媒体样本潜在匹配的多个媒体记录;由所述计算设备向客户端设备提供包括所述多个媒体记录之一的特征的信息的对准文件,其中预计所述多个媒体记录之一在所述对准文件中的特征在预定时间出现在所述媒体流中。
-
公开(公告)号:CN103797482A
公开(公告)日:2014-05-14
申请号:CN201280028132.4
申请日:2012-06-06
申请人: 沙扎姆娱乐有限公司
发明人: A·L-C·王
CPC分类号: G06F17/30026 , G06Q30/0241 , G06Q50/01 , H04H60/37
摘要: 描述用于进行接收到的数据的比较并且基于比较提供后续服务的方法和系统。在一个示例中,表演者可以利用包括麦克风的便携式设备,以记录来自场地的周围环境的内容的数据流,并且向服务器提供内容的数据流。用户可以利用包括麦克风的另外的便携式设备,以记录来自周围环境的内容的样本,并且可以发送样本至服务器。服务器可以进行样本的特性与数据流的特性的比较,并且可以利用元数据向用户提供响应。进一步,基于比较,服务器可以注册用户的设备在演唱会处呈现。服务器可以基于内容标识功能的结果进行社交网络功能。
-
-
-
-
-
-
-
-
-