-
公开(公告)号:CN104023250B
公开(公告)日:2015-10-21
申请号:CN201410265727.2
申请日:2014-06-13
Applicant: 腾讯科技(深圳)有限公司
IPC: H04N21/235 , H04N21/25 , H04N21/437 , H04L29/06
CPC classification number: H04L65/4084 , G06F16/489 , G06F16/9535 , H04L65/602 , H04L67/42 , H04N21/23418 , H04N21/2387 , H04N21/42203 , H04N21/4223 , H04N21/4334 , H04N21/4758 , H04N21/6582 , H04N21/8547
Abstract: 一种基于流媒体的实时互动方法,包括:终端实时录制流媒体数据包,并根据流媒体数据包生成流媒体识别请求,将流媒体识别请求发送给服务器;服务器根据所述流媒体识别请求获取待识别流媒体特征;服务器在各个流媒体源端的流媒体特征序列中搜索与待识别流媒体特征相匹配的特征段,并获取相匹配的特征段的播放时间戳以及所属的流媒体源端的源端标识,流媒体特征序列根据所属流媒体源端实时发送的流媒体数据包进行实时更新;服务器查找获取的源端标识和播放时间戳对应的预先配置的响应互动信息;服务器向终端返回响应互动信息。上述方法可以快速准确地实现终端与服务端之间针对目标流媒体源端的实时互动。此外,还提供一种基于流媒体的实时互动系统。
-
公开(公告)号:CN104023249B
公开(公告)日:2015-10-21
申请号:CN201410262126.6
申请日:2014-06-12
Applicant: 腾讯科技(深圳)有限公司
IPC: H04N21/235 , H04N21/435
CPC classification number: H04N21/482 , H04N21/41407 , H04N21/43637 , H04N21/44008 , H04N21/8146
Abstract: 本发明提供了一种电视频道识别方法,所述方法包括:获取电视视频图像;将所述电视视频图像对应台标模板库中的每个台标模板,进行所述电视视频图像的台标特征提取;将对应每个台标模板所提取的电视视频图像的台标特征与对应的台标模板中的特征进行匹配;将匹配程度最高的台标模板对应的电视频道作为识别结果。采用该方法,能提高电视频道识别精度。此外,还提供了一种电视频道识别装置。
-
公开(公告)号:CN104158790A
公开(公告)日:2014-11-19
申请号:CN201310177304.0
申请日:2013-05-14
Applicant: 腾讯科技(深圳)有限公司
CPC classification number: H04L9/3226 , G06F21/32
Abstract: 本发明公开了一种用户登录方法、装置和设备,属于安全验证领域。方法包括:当接收到当前用户的指定登录请求时,获取当前用户的至少一帧人脸图像;提取至少一帧人脸图像的人脸特征,根据提取的人脸特征与预设特征模板进行比对;当提取的人脸特征与预设特征模板的比对结果超过预设阈值时,根据当前用户的预设用户信息登录。本发明通过在传统记住密码功能上增加人脸认证,在获取到当前使用用户的人脸图像后,提取其人脸特征,并与已经存储的特征模板进行比对,当通过比对确认该当前使用用户与使用该记住密码功能的用户为同一个人时,直接根据预设用户信息进行登录,在提高了登录的安全性的同时保证了登录的快捷性。
-
公开(公告)号:CN104143331A
公开(公告)日:2014-11-12
申请号:CN201310198454.X
申请日:2013-05-24
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明公开了一种添加标点的方法和系统。该方法包括:将待处理语音文件作为整体,根据其中包含的每个词和每个词的语义特征,识别所述待处理语音文件中出现的所有特征单元N1;基于静音检测将所述待处理语音文件分为一个以上的待处理语段,根据每个待处理语段包含的每个词和每个词的语义特征,识别所述待处理语音文件中出现的所有特征单元N2;利用基于分词和词语的语义特征建立的语言模型,根据所述所有特征单元N1和N2确定所述待处理语音文件的各种标点状态的第一综合权重和第二综合权重;对所述第一综合权重和第二综合权重进行加权得到第三综合权重,根据所述第三综合权重为所述待处理语音文件添加标点。应用本发明能提高添加标点准确性。
-
公开(公告)号:CN104143327A
公开(公告)日:2014-11-12
申请号:CN201310288097.6
申请日:2013-07-10
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L15/06
CPC classification number: G06N3/08
Abstract: 本发明实施方式提出一种声学模型训练方法和装置。方法包括:建立深层神经网络模型初始模型;将语音训练数据划分为N个不相交的数据子集合,针对每个数据子集合利用随机梯度下降算法更新深层神经网络模型初始模型,得到N个深层神经网络模型子模型,其中N为至少为2的自然数;融合N个深层神经网络模型子模型以得到深层神经网络模型中间模型,并当该深层神经网络模型中间模型符合预先设定的收敛条件时,判定该深层神经网络模型中间模型为训练后声学模型。本发明实施方式提高了声学模型的训练效率,并且不降低语音识别的性能。
-
公开(公告)号:CN104143079A
公开(公告)日:2014-11-12
申请号:CN201310172492.8
申请日:2013-05-10
Applicant: 腾讯科技(深圳)有限公司
CPC classification number: G06K9/00288 , G06K9/00275 , G06K9/627 , G06K2009/00322
Abstract: 本发明公开了一种人脸属性识别的方法和系统,属于人脸识别技术领域。所述方法包括:获取待测试的图像样本;获取所述图像样本中人脸的有效区域图像;抽取所述有效区域图像的纹理特征;依次根据种族分类器、性别分类器和年龄分类器,对所述有效区域图像的纹理特征进行种族、性别和年龄的分类,得到所述人脸的种族属性、性别属性和年龄属性。本发明通过种族分类器、性别分类器和年龄分类器实现了对人脸属性的识别。
-
公开(公告)号:CN104142915A
公开(公告)日:2014-11-12
申请号:CN201310196391.4
申请日:2013-05-24
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F17/27
Abstract: 本发明公开了一种添加标点的方法和系统。该方法包括:基于静音检测将待处理语音文件分为一个以上的待处理语段,根据每个待处理语段包含的每个词和每个词的语义特征,识别所述待处理语音文件中出现的所有特征单元;利用基于分词和词语的语义特征建立的语言模型,根据所述所有特征单元确定所述待处理语音文件的各种标点状态的综合权重;根据所述综合权重为所述待处理语音文件添加标点。应用本发明能提高添加标点准确性。
-
公开(公告)号:CN104093038A
公开(公告)日:2014-10-08
申请号:CN201410327529.4
申请日:2014-07-10
Applicant: 腾讯科技(深圳)有限公司
IPC: H04N21/24 , H04N21/442 , H04N21/235 , H04N21/435
CPC classification number: H04L41/5038 , H04L65/4076 , H04L65/607 , H04L67/42 , H04N17/004 , H04N21/24
Abstract: 本发明涉及一种用于实时流媒体识别服务的测试和监控方法及系统。所述方法包括以下步骤:获取流媒体信号源,并从所述流媒体信号源中选取输入用例,并记录所述输入用例的特性;接收所述输入用例,并根据所述输入用例发起识别请求,以及接收根据所述识别请求返回的对所述输入用例的识别结果;根据所述输入用例的特性得到预期输出结果,将所述识别结果与所述预期输出结果进行比较,若相同,则表示实时流媒体识别服务正常,否则,表示实时流媒体识别服务异常。因从实时流媒体信号源中提取一段流媒体生成输入用例,记录了该输入用例的预期输出结果,然后将识别结果与预期输出结果进行比较,实现了对实时流媒体识别服务进行实时测试和监控。
-
公开(公告)号:CN103973441A
公开(公告)日:2014-08-06
申请号:CN201310033654.X
申请日:2013-01-29
Applicant: 腾讯科技(深圳)有限公司
CPC classification number: G06F21/32 , G06F2221/2117
Abstract: 本申请提供了基于音视频的用户认证方法和装置。其中,该方法包括:获取用户在进行身份注册时提供的视频图像帧、语音帧;利用视频图像帧和语音帧分别训练出人脸模型和声纹模型,将人脸模型、声纹模型与所述用户的标识对应存储至设定存储空间;在对任一用户进行认证时,采集该被认证用户的视频图像帧和语音帧,从设定存储空间找到与采集的视频图像帧匹配的人脸模型,并获取与该找到的人脸模型对应的第一用户标识,以及,从设定存储空间找到与该采集的语音帧匹配的声纹模型,并获取该找到的声纹模型对应的第二用户标识;比较第一用户标识和第二用户标识是否相同,依据比较结果验证所述被认证用户是否通过认证。采用本发明,能够避免现有用户认证带来的诸多风险问题。
-
公开(公告)号:CN103971690A
公开(公告)日:2014-08-06
申请号:CN201310032846.9
申请日:2013-01-28
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L17/20
CPC classification number: G10L17/18
Abstract: 本发明实施方式提出一种声纹识别方法和装置。方法包括:基于无标注语音数据建立深层神经网络初级模型,并且基于有标注语音数据对该深层神经网络初级模型进行训练,以获取深层神经网络二级模型;利用该深层神经网络二级模型注册说话人高层声纹特征与说话人标识;接收测试语音数据,基于该深层神经网络二级模型从测试语音数据中提取测试语音高层声纹特征,并且基于该测试语音高层声纹特征确定说话人标识。通过深层神经网络自动学习语音信号当中包含能够抵御噪声干扰的高层次说话人信息,可以有效抵御噪声干扰。
-
-
-
-
-
-
-
-
-