视频字幕生成方法、装置及存储介质

    公开(公告)号:CN118695047A

    公开(公告)日:2024-09-24

    申请号:CN202410694213.2

    申请日:2024-05-31

    Applicant: 同济大学

    Abstract: 本发明涉及一种视频字幕生成方法、装置及存储介质。该方法获取原始视频数据并采样得到视频帧;利用训练好的图像字幕模型生成帧字幕、利用目标检测模型获取每帧目标检测区域及相应的标签、利用视频编码器提取视频嵌入特征;从预先获取的知识图谱中导出子图作为额外的输入特征,并利用字幕时序编码器对每帧字幕进行时序特征编码得到相应的帧字幕嵌入特征;进行聚类和计数并利用区域时空编码器对经聚类和计数的区域特征进行编码,得到经聚类和计数的区域嵌入特征;将获取的多模态特征输入多模态解码器模型中,得到最终的视频字幕。与现有技术相比,本发明具有等优点。

    一种飞机客舱环境感知系统
    2.
    发明公开

    公开(公告)号:CN117456448A

    公开(公告)日:2024-01-26

    申请号:CN202311327809.0

    申请日:2023-10-13

    Applicant: 同济大学

    Abstract: 本发明涉及一种飞机客舱环境感知系统。该系统采用松耦合的架构;其中,所述架构包括8个层级,从上到下依次为:接入终端层、API接口层、API网关层、业务服务层、基础服务层、数据层、数据库层和硬件层;所述系统还包括相互独立的不同模块,所述模块具体包括:客舱监控模块、数据管理功能模块、系统控制功能模块和用户模块;各模块之间通过局域网进行通信。与现有技术相比,本发明具有能够自动监测和识别行李架状态和座椅上的乘客状态,提高监测的准确性和实时性,减轻空乘人员的工作量,保障乘客的航行安全和提高乘客的舒适感等优点。

Patent Agency Ranking