-
公开(公告)号:CN119863745A
公开(公告)日:2025-04-22
申请号:CN202510355760.2
申请日:2025-03-25
Applicant: 南京信息工程大学
IPC: G06V20/40 , G06V10/40 , G06V10/82 , G06N3/0499 , G06N3/08
Abstract: 本发明提供了一种基于大语言模型的动态迭代式长视频理解方法,步骤1,对视频理解任务进行数学建模与分析;步骤2,对用户输入的视频进行预处理,通过问答Agent进行初步推理;步骤3,进行自监督信息反馈,在推理过程中的每一步都引入评判Agent对答案进行认知;步骤4,采用问答准确率、平均检索帧数作为评价指标进行定量分析,验证方法的有效性;采用用户提供的任一视频和问题进行定性分析,验证结果是否符合预期。该方法通过模拟人类逻辑思维链的动态优化过程,实现了视频内容的智能分析与推理。本发明广泛应用于视频智能分析、视频问答系统、视频内容推荐等领域,有利于推动长视频快速理解与精准推理的技术发展。