Patent search ap:("上海交通大学") AND inv:"宋利" Page 14

131.

发明公开
以图像组结构为并行处理单元的视频集群转码系统无效

公开(公告)号：CN101098483A

公开(公告)日：2008-01-02

申请号：CN200710043983.7

申请日：2007-07-19

Applicant: 上海交通大学

Inventor： 宋利 , 王兴东 , 孙军 , 熊红凯 , 孙思慧

IPC: H04N7/52 , H04N7/26

Abstract: 一种以图像组结构为并行处理单元的视频集群转码系统，属于视频信息转码技术领域。本发明包括：用户界面模块、音视频解复用模块、视频分割模块、集群任务调度模块、网络连接设备、视频转码模块、音频转码模块、视频合并模块、音视频复用模块，本发明针对现有视频转码纯硬件转码和纯软件转码方法的不足，结合现有视频编码标准的编码结构，将集群计算的思想应用于视频转码领域，包括通过对原始多媒体码流进行解复用及分割、调度分发、并行转码、合并及复用等一系列处理转化为新的多媒体码流的系统结构和模块运行流程，为视频转码提供一种高效、低成本的解决方案。

132.

发明授权
一种人脸图像去识别及复原系统和方法有权

公开(公告)号：CN113935915B

公开(公告)日：2025-03-28

申请号：CN202111181272.2

申请日：2021-10-11

Applicant: 上海交通大学

Inventor： 宋利 , 曹靖宜 , 解蓉

IPC: G06T5/77 , G06T1/00 , G06V40/16 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08

Abstract: 本发明提供了一种个性化且可恢复的人脸去识别系统及方法，获得原始人脸图像或去识别人脸图像的身份特征和属性特征；根据用户设定的密码、隐私保护程度对得到的所述身份特征进行编辑，保护阶段中输入原始人脸图像中抽取出的身份特征计算出去识别人脸身份特征，恢复阶段中输入去识别人脸图像中抽取出的身份特征计算出复原人脸身份特征；根据计算得出的去识别人脸身份特征或复原人脸身份特征和输入的人脸图像抽取出的属性特征，合成对应的去识别人脸图像或复原人脸图像。本发明融合编解码网络结构、多尺度特征融合与身份特征编辑，实现了多样化且可恢复的人脸图像隐私保护。

133.

发明授权
一种人脸生成系统及方法有权

公开(公告)号：CN112233012B

公开(公告)日：2023-10-31

申请号：CN202010793914.3

申请日：2020-08-10

Applicant: 上海交通大学

Inventor： 宋利 , 薛涵 , 凌军 , 解蓉 , 张文军

IPC: G06T3/00 , G06V40/16 , G06V10/75 , G06V10/82 , G06N3/0475 , G06N3/0455

Abstract: 本发明提供了一种人脸生成系统及方法，引入几何感知特征转换模块，利用目标人脸解析图去指导源人脸特征图的变换，从而将目标人脸的姿态和表情迁移到源人脸上，同时保留源人脸的身份；引入多尺度空间一致性传输单元，将目标人脸解析图作为条件输入该单元，指导编码器特征传入解码端，最终生成人脸，在提升生成图片质量的同时，不弱化模型对人脸的操纵能力；使用目标人脸解析图引导编码器特征的传输，保持了编码器和解码器特征之间的一致性，解决了编码器和解码器特征在空间上未对齐的问题；通过结合内部和外部的编码器特征，结合了多尺度的信息，提升了生成人脸的质量。本发明能够生成逼真的人脸，同时可以应用到模型训练时未见过的人脸。

134.

发明公开
码率调整方法、装置、电子设备和存储介质审中-实审

公开(公告)号：CN115460406A

公开(公告)日：2022-12-09

申请号：CN202211060999.X

申请日：2022-08-31

Applicant: 咪咕文化科技有限公司 , 中国移动通信集团有限公司 , 上海交通大学

Inventor： 冯亚楠 , 邢刚 , 李琳 , 周冰 , 贝悦 , 李昊勇 , 宋利

IPC: H04N19/149 , H04L65/60 , H04L65/80

Abstract: 本发明公开了一种码率调整方法、装置、电子设备和存储介质，属于通信技术领域。其中方法包括：获取最近的预设间隔时间段内的通信数据包，解析通信数据包得到包级信息和帧级信息；根据包级信息和帧级信息得到与最近的预设间隔时间段相应的奖励值；根据包级信息、帧级信息、系统信息形成状态向量，将状态向量和奖励值输入到经预训练的神经网络模型中，得到神经网络模型输出；利用映射函数将神经网络模型输出映射为码率调整参数；根据码率调整参数调整下一个预设间隔时间段的编码器码率。本发明可以快速应对变化的网络环境，同时高效利用带宽，保证视频传输的低延迟、低丢帧率和高质量，以达到优秀的用户体验质量QoE，对拥塞控制有着更好的表现。

135.

发明公开
人脸隐私保护方法、装置、设备以及计算机可读存储介质审中-实审

公开(公告)号：CN115357937A

公开(公告)日：2022-11-18

申请号：CN202211062905.2

申请日：2022-08-31

Applicant: 咪咕文化科技有限公司 , 中国移动通信集团有限公司 , 上海交通大学

Inventor： 冯亚楠 , 樊刚 , 蔡卫勇 , 李琳 , 贝悦 , 曹靖宜 , 宋利

IPC: G06F21/62

Abstract: 本发明实施例涉及计算机视觉技术领域，公开了一种人脸隐私保护方法、装置、设备以及计算机可读存储介质，该方法包括：对原始人脸数据进行平均化处理，得到平均后特征；对所述平均后特征进行隐私保护处理，得到保护后特征；根据所述平均后特征以及保护后特征确定待编辑特征；将所述待编辑特征以及所述原始人脸数据输入预设的人脸编辑模型，得到处理后人脸数据；其中，所述人脸编辑模型用于根据所述待编辑特征对所述原始人脸数据选择性进行特征编辑。通过上述方式，本发明实施例能够实现确保在对人脸修改较小的同时隐藏人脸的身份信息，从而实现人脸隐私保护和人脸图像效用之间的平衡。

136.

发明公开
运动目标的跟踪方法、装置、设备和介质有权

公开(公告)号：CN114820705A

公开(公告)日：2022-07-29

申请号：CN202210427115.3

申请日：2022-04-22

Applicant: 咪咕文化科技有限公司 , 中国移动通信集团有限公司 , 上海交通大学

Inventor： 冯亚楠 , 王涵 , 宋利 , 任化强 , 周效军 , 李琳

IPC: G06T7/246 , G06K9/62 , G06V20/40 , G06N3/04 , G06N3/08 , G06V10/774

Abstract: 本发明公开了一种运动目标的跟踪方法、装置、设备和介质，所述方法包括：获取待跟踪视频的视频帧；确定所述视频帧中的单目标跟踪框、多目标跟踪框和多目标的特征信息；其中，所述多目标为所述视频帧中的多个运动目标，所述特征信息用于区分所述多个运动目标；根据所述单目标跟踪框、所述多目标跟踪框和所述多目标的特征信息确定待跟踪运动目标的实际跟踪框，以根据所述实际跟踪框跟踪所述待跟踪运动目标在所述待跟踪视频中的实际位置。本发明提高了用于确定待跟踪运动目标的实际位置的实际跟踪框的准确性，有利于准确跟踪待跟踪目标。

137.

发明公开
一种切片大小预测和自适应码率控制方法、系统及介质有权

公开(公告)号：CN113747229A

公开(公告)日：2021-12-03

申请号：CN202110885078.6

申请日：2021-08-03

Applicant: 上海交通大学

Inventor： 宋利 , 袁靖昊 , 解蓉 , 张文军

IPC: H04N21/433 , H04N21/845 , H04N17/00 , H04L29/06

Abstract: 本发明提供一种切片大小预测和自适应码率控制方法、系统及介质，包括：S1，对于前Start_Num个切片提供优化缓冲区精度、优化首开延迟两种下载策略，用于在首开延迟和精度缓冲区之间进行权衡；S2，在S1的基础上，获取自适应流媒体过程中的缓冲区信息，对于优化首开延迟策略未下载的增强层切片大小做补齐操作，建立完整的参考缓冲区历史信息；S3，利用所述参考缓冲区历史信息和当前切片的下载情况，预测当前时间槽处的增强层切片大小。本发明设计了一个切片大小预测模块去代替传统ABR算法中切片大小的平均表示，并将该模块加在现有ABR算法之上，带来了很大的性能提升。

138.

发明授权
神经网络优化的无参考自适应流媒体质量评价方法及系统有权

公开(公告)号：CN111083125B

公开(公告)日：2021-02-02

申请号：CN201911216042.8

申请日：2019-12-02

Applicant: 上海交通大学 , 咪咕文化科技有限公司

Inventor： 宋利 , 杨再欣 , 解蓉 , 张文军 , 李琳 , 苏毅

IPC: H04L29/06 , H04N17/00 , G06N3/04 , G06Q10/06

Abstract: 本发明提供了一种神经网络优化的无参考自适应流媒体质量评价方法，通过卡顿信息计算卡顿感知指标；通过视频质量变化特征计算视频质量切换损伤和视频振荡损伤，结合视频压缩质量形成结合视频质量切换和视频振荡损伤的视频整合质量；计算视频的视频质量特征，并将视频质量特征以及卡顿次数，卡顿总时长和视频时长作为输入特征建立神经网络模型并进行拟合训练；将卡顿感知指标、视频整合质量和拟合结果进行整合，得到最终用户体验质量评价结果。同时提供了一种用于执行上述方法的系统。本发明需要的卡顿缓冲事件的相关参数少，提高了实际应用中的适应性和可行性，并通过神经网络引入对时间效应相关的考量，增加评价的全面性和准确性。

139.

发明公开
一种人脸生成系统及方法有权

公开(公告)号：CN112233012A

公开(公告)日：2021-01-15

申请号：CN202010793914.3

申请日：2020-08-10

Applicant: 上海交通大学

Inventor： 宋利 , 薛涵 , 凌军 , 解蓉 , 张文军

IPC: G06T3/00 , G06K9/00 , G06K9/62 , G06N3/04

Abstract: 本发明提供了一种人脸生成系统及方法，引入几何感知特征转换模块，利用目标人脸解析图去指导源人脸特征图的变换，从而将目标人脸的姿态和表情迁移到源人脸上，同时保留源人脸的身份；引入多尺度空间一致性传输单元，将目标人脸解析图作为条件输入该单元，指导编码器特征传入解码端，最终生成人脸，在提升生成图片质量的同时，不弱化模型对人脸的操纵能力；使用目标人脸解析图引导编码器特征的传输，保持了编码器和解码器特征之间的一致性，解决了编码器和解码器特征在空间上未对齐的问题；通过结合内部和外部的编码器特征，结合了多尺度的信息，提升了生成人脸的质量。本发明能够生成逼真的人脸，同时可以应用到模型训练时未见过的人脸。

140.

发明授权
基于卷积神经网络的镜头边界检测方法有权

公开(公告)号：CN106327513B

公开(公告)日：2020-11-17

申请号：CN201610670319.4

申请日：2016-08-15

Applicant: 上海交通大学

Inventor： 宋利 , 许经纬 , 解蓉

IPC: G06T7/13

Abstract: 本发明公开一种基于卷积神经网络的镜头边界检测方法，所述方法将视频分段，计算各段局部阈值，排除段内亮度距离低于阈值的段，对高于阈值的段进行两次二分处理，根据候选段和二分处理得到的小段的段内亮度距离的关系排除不含镜头边界的段，并对衡量结果进行分类得到突变边界候选段和渐变边界候选段；用卷积神经网络提取段内每帧的特征并利用特征间的余弦距离衡量帧间相似度；对突变边界候选段，根据连续两帧的帧间相似度和候选段首末帧的帧间相似度的关系确定该段是否存在突变边界及位置；对渐变边界候选段，计算绝对距离差并绘制曲线，进而确定该段是否为渐变边界并将相邻的渐变边界融合。本发明能准确的检测突变镜头边界和渐变镜头边界。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification