Patent search ap:("百度在线网络技术(北京)有限公司") AND inv:"何栋梁" Page 1

1.

发明公开
用于提取视频特征向量的方法和装置有权

公开(公告)号：CN109165573A

公开(公告)日：2019-01-08

申请号：CN201810879268.5

申请日：2018-08-03

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 何栋梁 , 文石磊 , 李甫 , 孙昊

IPC: G06K9/00

Abstract: 本申请实施例公开了用于提取视频特征向量的方法和装置。该方法的一具体实施方式包括：从目标视频中采集多个视频片段，每个视频片段包括一个视频帧序列；对于每一个视频片段，基于该视频片段对应的视频帧序列生成该视频片段的组合图，组合图的各像素的像素值存储于三维数组中；将各视频片段分别对应的三维数组输入到预先训练的视频特征提取模型，得到目标视频的特征向量。该实施方式所得到的视频的特征向量同时蕴含了目标视频的空间信息以及视频对象在时间跨度上的行为信息，有利于提高使用视频的特征向量分析视频内容所属类别的准确率。

2.

发明公开
人体动作识别方法和装置有权

公开(公告)号：CN108985259A

公开(公告)日：2018-12-11

申请号：CN201810878634.5

申请日：2018-08-03

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 沈辉 , 高原 , 何栋梁 , 刘霄 , 李旭斌 , 孙昊 , 文石磊 , 丁二锐

IPC: G06K9/00

Abstract: 本申请实施例公开了人体动作识别方法和装置。该方法的一具体实施方式包括：对输入的待识别视频进行采样，得到待识别视频的采样图像帧序列；采用已训练的人体关键点检测模型对采样图像帧序列进行关键点检测，得到采样图像帧序列中每个采样图像帧的人体关键点位置热图，人体关键点位置热图用于表征预设人体关键点所在位置的概率特征；将采样图像帧序列的人体关键点位置热图输入已训练的动作分类模型进行分类，得到待识别视频对应的人体动作。该实施方式实现了利用待识别视频中人体关键点的协调配合关系及人体动作的时间连续特性进行动作识别，有利于提升识别精度。

3.

发明授权
用于处理视频的方法和装置有权

公开(公告)号：CN109145784B

公开(公告)日：2022-06-03

申请号：CN201810878646.8

申请日：2018-08-03

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 何栋梁 , 李甫 , 文石磊 , 孙昊

IPC: G06V20/40 , G06V10/82 , G06N3/04 , G06N20/00

Abstract: 本申请实施例公开了用于处理视频的方法和装置。该方法的一具体实施方式包括：获取待处理的体育比赛的视频；从视频中识别出第一比分以及与第二比分，以及确定出最后一次出现第一比分的第一视频帧和第一次出现第二比分的第二视频帧；将视频中第一视频帧之前的第一预定时间对应的视频帧与第二视频帧之后的第二预定时间对应的视频帧之间的至少一个视频帧输入预先训练的得分置信度预测模型，得到输入的各视频帧属于得分片段的置信度；基于输入的各视频帧属于得分片段的置信度和预定置信度阈值，从至少一个视频帧中确定出至少一个目标视频帧，以及输出至少一个目标视频帧。该实施方式能够提高定位体育比赛的视频中得分视频片段的速度和准确率。

4.

发明公开
生成信息的方法和装置有权

公开(公告)号：CN109117777A

公开(公告)日：2019-01-01

申请号：CN201810877553.3

申请日：2018-08-03

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 李甫 , 何栋梁 , 文石磊 , 孙昊

IPC: G06K9/00 , G06N3/04

Abstract: 本申请实施例公开了生成信息的方法和装置。该生成信息的方法的一具体实施方式包括：获取待识别视频；提取待识别视频的图像特征序列和语音特征序列；基于图像特征序列和语音特征序列，确定待识别视频对应各个标签的概率值；将概率值大于阈值的标签确定为待识别视频的标签。该实施方式中的图像特征序列和语音特征序列利用了视频的时序结构，可将视频作为一个完整的事件进行考虑，也同时考虑了图像和语音的双流特征，使得为视频确定的标签更加精准和丰富。

5.

发明授权
人体动作识别方法和装置有权

公开(公告)号：CN108985259B

公开(公告)日：2022-03-18

申请号：CN201810878634.5

申请日：2018-08-03

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 沈辉 , 高原 , 何栋梁 , 刘霄 , 李旭斌 , 孙昊 , 文石磊 , 丁二锐

IPC: G06V40/20 , G06V20/40

Abstract: 本申请实施例公开了人体动作识别方法和装置。该方法的一具体实施方式包括：对输入的待识别视频进行采样，得到待识别视频的采样图像帧序列；采用已训练的人体关键点检测模型对采样图像帧序列进行关键点检测，得到采样图像帧序列中每个采样图像帧的人体关键点位置热图，人体关键点位置热图用于表征预设人体关键点所在位置的概率特征；将采样图像帧序列的人体关键点位置热图输入已训练的动作分类模型进行分类，得到待识别视频对应的人体动作。该实施方式实现了利用待识别视频中人体关键点的协调配合关系及人体动作的时间连续特性进行动作识别，有利于提升识别精度。

6.

发明授权
用于输出视频中的音乐片段的方法和装置有权

公开(公告)号：CN108989882B

公开(公告)日：2021-05-28

申请号：CN201810878623.7

申请日：2018-08-03

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 邓玥琳 , 李甫 , 何栋梁 , 文石磊

IPC: H04N21/439 , H04N21/44

Abstract: 本申请实施例公开了用于输出视频中的音乐片段的方法和装置。该方法的一具体实施方式包括：从目标视频中获取视频片段；将视频片段输入至预先训练的音乐片段检测模型，得到视频片段包括的音乐片段的定位信息，其中，音乐片段检测模型用于表征视频片段与视频片段包括的音乐片段的定位信息的对应关系；根据定位信息输出视频片段包括的音乐片段。该实施方式丰富了输出视频中的音乐片段的方法，提高了输出视频中的音乐片段的效率。

7.

发明公开
用于处理视频的方法和装置有权

公开(公告)号：CN109145784A

公开(公告)日：2019-01-04

申请号：CN201810878646.8

申请日：2018-08-03

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 何栋梁 , 李甫 , 文石磊 , 孙昊

IPC: G06K9/00 , G06N3/04 , G06N20/00

CPC classification number: G06K9/00724 , G06N3/0454

Abstract: 本申请实施例公开了用于处理视频的方法和装置。该方法的一具体实施方式包括：获取待处理的体育比赛的视频；从视频中识别出第一比分以及与第二比分，以及确定出最后一次出现第一比分的第一视频帧和第一次出现第二比分的第二视频帧；将视频中第一视频帧之前的第一预定时间对应的视频帧与第二视频帧之后的第二预定时间对应的视频帧之间的至少一个视频帧输入预先训练的得分置信度预测模型，得到输入的各视频帧属于得分片段的置信度；基于输入的各视频帧属于得分片段的置信度和预定置信度阈值，从至少一个视频帧中确定出至少一个目标视频帧，以及输出至少一个目标视频帧。该实施方式能够提高定位体育比赛的视频中得分视频片段的速度和准确率。

8.

发明授权
用于提取视频特征向量的方法和装置有权

公开(公告)号：CN109165573B

公开(公告)日：2022-07-29

申请号：CN201810879268.5

申请日：2018-08-03

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 何栋梁 , 文石磊 , 李甫 , 孙昊

IPC: G06V20/40

Abstract: 本申请实施例公开了用于提取视频特征向量的方法和装置。该方法的一具体实施方式包括：从目标视频中采集多个视频片段，每个视频片段包括一个视频帧序列；对于每一个视频片段，基于该视频片段对应的视频帧序列生成该视频片段的组合图，组合图的各像素的像素值存储于三维数组中；将各视频片段分别对应的三维数组输入到预先训练的视频特征提取模型，得到目标视频的特征向量。该实施方式所得到的视频的特征向量同时蕴含了目标视频的空间信息以及视频对象在时间跨度上的行为信息，有利于提高使用视频的特征向量分析视频内容所属类别的准确率。

9.

发明公开
用于输出视频中的音乐片段的方法和装置有权

公开(公告)号：CN108989882A

公开(公告)日：2018-12-11

申请号：CN201810878623.7

申请日：2018-08-03

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 邓玥琳 , 李甫 , 何栋梁 , 文石磊

IPC: H04N21/439 , H04N21/44

Abstract: 本申请实施例公开了用于输出视频中的音乐片段的方法和装置。该方法的一具体实施方式包括：从目标视频中获取视频片段；将视频片段输入至预先训练的音乐片段检测模型，得到视频片段包括的音乐片段的定位信息，其中，音乐片段检测模型用于表征视频片段与视频片段包括的音乐片段的定位信息的对应关系；根据定位信息输出视频片段包括的音乐片段。该实施方式丰富了输出视频中的音乐片段的方法，提高了输出视频中的音乐片段的效率。

10.

发明授权
生成信息的方法和装置有权

公开(公告)号：CN109117777B

公开(公告)日：2022-07-01

申请号：CN201810877553.3

申请日：2018-08-03

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 李甫 , 何栋梁 , 文石磊 , 孙昊

IPC: G06V20/40 , G06V10/82 , G06N3/04

Abstract: 本申请实施例公开了生成信息的方法和装置。该生成信息的方法的一具体实施方式包括：获取待识别视频；提取待识别视频的图像特征序列和语音特征序列；基于图像特征序列和语音特征序列，确定待识别视频对应各个标签的概率值；将概率值大于阈值的标签确定为待识别视频的标签。该实施方式中的图像特征序列和语音特征序列利用了视频的时序结构，可将视频作为一个完整的事件进行考虑，也同时考虑了图像和语音的双流特征，使得为视频确定的标签更加精准和丰富。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification