Patent search ap:("同济大学") AND inv:"伊晓凯" Page 1

1.

发明公开
一种面向交通路口协同感知的视觉分析方法审中-实审

公开(公告)号：CN119810555A

公开(公告)日：2025-04-11

申请号：CN202411995150.0

申请日：2024-12-31

Applicant: 同济大学 , 新联数城(上海)信息技术有限公司

Inventor： 王瀚漓 , 杨京 , 惠帅雄 , 李腾鹏 , 伊晓凯 , 余晙 , 陈欢 , 庄子杰

IPC: G06V10/764 , G06V10/25 , G06V10/46 , G06T7/246 , G06T3/02 , G06V10/44 , G06V10/766 , G06V10/80 , G06V10/74 , G06N3/0464

Abstract: 本发明涉及一种面向交通路口协同感知的视觉分析方法，方法包括以下步骤：S1、采用路口快速标定算法，并获取不同位置的摄像头图像；S2、对于每个位置的摄像头图像，输入目标检测模型，得到目标检测结果；S3、每个位置的目标检测结果输入目标跟踪模型，输出目标跟踪结果；S4、基于仿射变换矩阵将目标跟踪结果转化到统一的全局坐标系中，执行全局的跨镜头ID匹配，得到跨摄像头跟踪结果；S5、对跨摄像头跟踪结果进行平滑处理，得到平滑跟踪结果；S6、基于平滑跟踪结果进行视觉感知，得到视觉感知结果。与现有技术相比，本发明具有确保同一目标在不同摄像头视角下能够被正确关联，实现跨摄像头的一致性识别等优点。

2.

发明授权
一种面向人机混合视觉的视频压缩方法有权

公开(公告)号：CN115460415B

公开(公告)日：2024-07-23

申请号：CN202211030454.4

申请日：2022-08-26

Applicant: 同济大学

Inventor： 王瀚漓 , 伊晓凯

IPC: H04N19/20 , H04N19/117 , H04N19/513 , H04N19/57

Abstract: 本发明涉及一种面向人机混合视觉的视频压缩方法，该方法包括以下步骤：1)视频压缩网络获取待压缩视频序列通过编码器进行编码，将其压缩成编码码流；2)所述的编码码流进入下游任务处理网络，若面向人类视觉需求，进入3)，若用于机器视觉分析，进入4)；3)人类视觉分支模块中解码器接收编码码流将其解码成视频，经视频增强后输出；4)机器视觉分支模块中解码器接收编码码流对其解码生成视频，根据视觉任务分析视频，并输出分析结果。与现有技术相比，本发明可以同时满足人类视觉和机器视觉的需求，并且极大提升了视频压缩效率、可移植性强。

3.

发明公开
一种多源协同的智慧交通管理方法审中-实审

公开(公告)号：CN119810769A

公开(公告)日：2025-04-11

申请号：CN202411994621.6

申请日：2024-12-31

Applicant: 同济大学 , 新联数城(上海)信息技术有限公司

Inventor： 王瀚漓 , 惠帅雄 , 杨京 , 李腾鹏 , 伊晓凯 , 余晙 , 陈欢 , 庄子杰

IPC: G06V20/54 , G06V20/62 , G06T7/80 , G06V10/25 , G06V10/56 , G06V10/44 , G06N3/0464 , G06V10/74

Abstract: 本发明涉及一种多源协同的智慧交通管理方法，方法包括以下步骤：S1、构建仿射变换方程组，标定相机的内外参矩阵；S2、获取各视角下的目标感知结果，进行跨镜头匹配与优化，得到路端全局感知结果；S3、将任务提示词、路端全局感知结果和原始视频流输入云端的Qwen2‑VL模型之中，得到先验信息；S4、端到端云端感知模型以四路视频数据为输入，输出云端全局感知结果；S5、进行位置‑语义混合对齐，得到增强后的全局感知结果；S6、基于交通规则先验信息与感知结果的历史数据优化增强后的全局感知结果。与现有技术相比，本发明具有提高云路两端感知数据的匹配精度，增强端云协同的稳定性等优点。

4.

发明公开
一种面向人机混合视觉的视频压缩方法有权

公开(公告)号：CN115460415A

公开(公告)日：2022-12-09

申请号：CN202211030454.4

申请日：2022-08-26

Applicant: 同济大学

Inventor： 王瀚漓 , 伊晓凯

IPC: H04N19/20 , H04N19/117 , H04N19/513 , H04N19/57

Abstract: 本发明涉及一种面向人机混合视觉的视频压缩方法，该方法包括以下步骤：1)视频压缩网络获取待压缩视频序列通过编码器进行编码，将其压缩成编码码流；2)所述的编码码流进入下游任务处理网络，若面向人类视觉需求，进入3)，若用于机器视觉分析，进入4)；3)人类视觉分支模块中解码器接收编码码流将其解码成视频，经视频增强后输出；4)机器视觉分支模块中解码器接收编码码流对其解码生成视频，根据视觉任务分析视频，并输出分析结果。与现有技术相比，本发明可以同时满足人类视觉和机器视觉的需求，并且极大提升了视频压缩效率、可移植性强。

Patent Agency Ranking