一种基于多模态处理的音视频传输系统

    公开(公告)号:CN118694752B

    公开(公告)日:2024-12-17

    申请号:CN202411170581.3

    申请日:2024-08-26

    Abstract: 本发明涉及音视频传输技术领域,尤其涉及一种基于多模态处理的音视频传输系统,包括:端口数据获取模块,其用以获取当前会话环境的各用户端信息;测试模块,用以通过传输测试获取各用户端的可用传输阈值;环境识别模块,其用以获取当前会话环境的维护模态以及确定对各用户端的传输匹配结果;数据流驱动模块,用以确定传输流分配比例、确定各模态数据流的压缩比例以及基于会话环境的维护模态的调整,更新所述压缩比例;本发明通过基于多模态数据的各客户端间的传输速度差异、数据量差异,调整音视频传输压缩方式,能够将同一会话环境中的各用户端的多模态数据的传输数据量通过压缩比例设定进行调整,保证各模态数据的传输同步性。

    一种人工智能内容生成方法和系统

    公开(公告)号:CN117273006A

    公开(公告)日:2023-12-22

    申请号:CN202311055327.4

    申请日:2023-08-21

    Abstract: 本发明提供一种人工智能内容生成方法和系统,通过在内容生成之前进行语义分析检查,得到多个可扩展项,为后续内容生成提供多个版本,内容生成之后进行安全性检查,确保人工智能生成的内容符合语法逻辑要求,同时还会对生成的内容预测其可能的走向是否包含可扩展项,选择包含可扩展项最多的走向继续生成内容,最后输出内容,克服现有技术生成的内容质量不够高、不够多样化的问题。

    一种场景划分和内容检测的方法和系统

    公开(公告)号:CN115019235B

    公开(公告)日:2023-06-27

    申请号:CN202210685018.4

    申请日:2022-06-15

    Inventor: 孙涛 孙中民

    Abstract: 本发明提供一种场景划分和内容检测的方法和系统,通过提取多媒体数据中的多种特征,生成第一向量矩阵,将其输入到状态链模型,得到显性特征分布区域,进而确定出需要的隐性特征分布区域的语义特征集合,将所述第一向量矩阵和所述语义特征集合输入计算函数,同时引入状态链模型的概率密度参数,计算确定出不同场景划分的分界线,实现精确地分段内容检测。

    一种视频检测方法及系统
    35.
    发明公开

    公开(公告)号:CN110991246A

    公开(公告)日:2020-04-10

    申请号:CN201911063182.6

    申请日:2019-10-31

    Inventor: 夏光升 孙涛

    Abstract: 本发明涉及一种视频检测方法,包括以下步骤:提取视频的关键帧,并将所述关键帧进行汇总;利用神经网络对所述关键帧进行逐帧识别,得出每个所述关键帧的识别结果;对所述关键帧的识别结果进行权重分析,筛选出违规的视频。通过训练好的神经网络对视频的关键帧进行逐帧识别,根据识别结果进行权重分析,从而准确高效的筛查出包含有违规信息的视频文件;系统采用了人脸检测及人脸识别技术以满足在海量视频中对特定人物进行检索的需求;对于一些违规视频其中包含了特定自然人的音频特征,其中经常出现于一些暴恐类视频当中,系统将采用GMM-UBM模型实现特定自然人的声纹识别,从而对特定自然人的身份进行确认。

    一种网络视频采集方法及系统

    公开(公告)号:CN110866165A

    公开(公告)日:2020-03-06

    申请号:CN201911063184.5

    申请日:2019-10-31

    Inventor: 夏光升 孙涛

    Abstract: 本发明属于网络安全监控技术领域,特别涉及一种网络视频采集方法及系统。所述视频采集方法包括:对网络地址数据进行清洗处理;根据清洗处理后的所述网络地址数据,生成网页抓取任务;执行所述网页抓取任务,下载网页中的视频数据;对完成下载的所述视频数据进行保存。本发明可以对海量的视频数据实现分布式下载,处理能力强、系统可靠,可以根据处理量的规模,适应性调整系统中各服务器的数量。

Patent Agency Ranking