一种基于大语言模型的动态迭代式长视频理解方法

    公开(公告)号:CN119863745A

    公开(公告)日:2025-04-22

    申请号:CN202510355760.2

    申请日:2025-03-25

    Inventor: 周媛 华立涛

    Abstract: 本发明提供了一种基于大语言模型的动态迭代式长视频理解方法,步骤1,对视频理解任务进行数学建模与分析;步骤2,对用户输入的视频进行预处理,通过问答Agent进行初步推理;步骤3,进行自监督信息反馈,在推理过程中的每一步都引入评判Agent对答案进行认知;步骤4,采用问答准确率、平均检索帧数作为评价指标进行定量分析,验证方法的有效性;采用用户提供的任一视频和问题进行定性分析,验证结果是否符合预期。该方法通过模拟人类逻辑思维链的动态优化过程,实现了视频内容的智能分析与推理。本发明广泛应用于视频智能分析、视频问答系统、视频内容推荐等领域,有利于推动长视频快速理解与精准推理的技术发展。

Patent Agency Ranking