一种视频检索方法及装置

    公开(公告)号:CN119155481B

    公开(公告)日:2025-03-04

    申请号:CN202411659021.4

    申请日:2024-11-19

    Abstract: 本申请实施例提供了一种视频检索方法及装置,涉及视频处理技术领域,上述方案为:获得检索时间段;若所述检索时间段中存在从第一时间开始向前的第一子时间段,则生成针对所述第一子时间段进行检索的第一视频检索请求,向检索服务器发送所述第一视频检索请求,获得所述检索服务器基于已存储的视频检索信息响应所述第一视频检索请求得到的第一检索结果,若所述检索时间段中存在位于所述第一时间之后的第二子时间段,则生成针对第二子时间段进行检索的第二视频检索请求,向视频采集设备发送所述第二视频检索请求,获得所述视频采集设备针对所述第二视频检索请求反馈的第二检索结果。应用本申请实施例提供的视频检索方案,能够提高视频检索效率。

    多模态数据生成方法、装置、计算机设备及存储介质

    公开(公告)号:CN119537511A

    公开(公告)日:2025-02-28

    申请号:CN202411574006.X

    申请日:2024-11-05

    Inventor: 梁亚妮

    Abstract: 本发明涉及数据处理领域,尤其涉及一种多模态数据生成方法、装置、计算机设备及存储介质,其方法包括:对用户提问数据进行主题提取,得到主题信息;并对用户提问数据进行逻辑结构解析,得到用户提问数据的逻辑结构信息;根据主题信息和辑结构信息,在多模态数据库中检索与用户提问数据对应的文字资料、图片资料和视频资料;对文字资料、图片资料和视频资料进行整合处理,得到初始多模态数据;对所有目标文字文本、所有目标图片和所有目标视频进行风格迁移处理,得到目标多模态数据。本发明可实现以目标多模态数据形式对推荐信息进行更加全面的展示,提高用户体验感。

    视频检索方法、装置、计算机设备及存储介质

    公开(公告)号:CN119474459A

    公开(公告)日:2025-02-18

    申请号:CN202411543277.9

    申请日:2024-10-30

    Abstract: 本发明涉及多媒体信息处理、自然语言处理及机器学习技术领域,公开了上述视频检索方法、装置、计算机设备及存储介质,通过将检索文本输入到视频检索模型的文本编码器,得到检索文本的文本特征表征;将视频数据输入到视频检索模型的视频编码器,得到每个视频数据的多模态特征表征;然后,分别计算文本特征表征与每个多模态特征表征的特征相似度,选择特征相似度最大的视频数据作为检索到的目标视频数据。可见,本发明通过视频编码器提取视频数据的多模态特征表征来对视频数据进行检索,相较于通过视频数据中的单一图像特征来对视频数据进行检索,可以达到提高视频检索精度的目的。

    视频数据处理方法、装置、设备及存储介质

    公开(公告)号:CN116095400B

    公开(公告)日:2025-02-18

    申请号:CN202211456992.X

    申请日:2022-11-21

    Inventor: 王勇

    Abstract: 本申请涉及一种视频数据处理方法、装置、设备及存储介质,应用在图像处理领域,其中方法包括:获取视频图像,将视频图像存储至预设的资源缓存区中,读取闪存中预设的图像数据,将图像数据叠加到视频图像中,得到已处理视频图像,将已处理视频图像发送至视频输出通道进行显示。本申请具有的技术效果是:提高了视频叠加处理的性能,降低了视频叠加处理的时间消耗。

    数据查询反馈方法、装置、电子设备及存储介质

    公开(公告)号:CN119415734A

    公开(公告)日:2025-02-11

    申请号:CN202411334733.9

    申请日:2024-09-24

    Inventor: 戴玺玲

    Abstract: 本申请实施例涉及一种数据查询反馈方法、装置、电子设备及存储介质,该方法包括:获取用户输入的咨询语句;利用预先训练的语言模型,对咨询语句进行咨询类型判断,得到咨询语句的咨询类型;基于咨询类型,确定咨询语句所提问题的影响因素,并生成影响因素对应的数据库查询语句;基于数据库查询语句,从目标数据库中查询影响因素对应的数据;基于数据,生成咨询语句的回答语句。本申请实施例实现了利用模型自动对用户咨询的问题进行分析,无需人工参与,提高了向用户提供关于咨询问题的数据分析和回复的效率,降低了数据分析和回复的成本。

    基于大语言模型的长视频问答处理系统

    公开(公告)号:CN119377440A

    公开(公告)日:2025-01-28

    申请号:CN202411408884.4

    申请日:2024-10-10

    Abstract: 本发明公开了一种基于大语言模型的长视频问答处理系统,包括:预处理模块,用于将长视频分离为视觉部分信息和音频部分信息;问题分类模块,用于对输入的问题进行分类,具体分为普通视频问题、视频时间相关问题、视频视觉相关问题、视频音频相关问题;问题处理流程模块,与预处理模块和问题分类模块通信连接,接收问题分类模块分类的四种不同的问题,之后结合预处理模块的视频部分信息和音频部分信息进入不同的处理流程,完成长视频的问答处理。本发明的基于大语言模型的长视频问答处理系统,不仅简化了模型设计,还显著提升了长视频问答的性能和效率,为实际应用提供了更具可操作性和高效的解决方案。

    一种视觉问答处理方法及系统
    7.
    发明公开

    公开(公告)号:CN119357430A

    公开(公告)日:2025-01-24

    申请号:CN202411920674.3

    申请日:2024-12-25

    Applicant: 福州大学

    Abstract: 本发明公开了一种视觉问答处理方法及系统,包括预设产品的知识图谱,对对话信息进行分析以确定用户对产品的问题诉求,根据问题诉求和产品的知识图谱,从较长的产品问题视频中提取出与问题诉求最相关的一系列帧,然后使用上述帧生成时长较短的短视频,并将短视频与问题诉求同步显示。在应用本发明时,当电商客服在接收到较长的产品问题视频,可以不用观看该产品问题视频,通过观看对应的短视频就可以准确的掌握用户对产品问题的诉求,从而为准确并及时的答复用户提供准确的数据支持和赢得宝贵时间,大大提高了电商客服的回复时效和质量。

    一种基于文本挖掘的标准智能推荐方法

    公开(公告)号:CN118708758B

    公开(公告)日:2025-01-24

    申请号:CN202410761375.3

    申请日:2024-06-13

    Abstract: 本发明涉及文本数据分析技术领域,尤其涉及一种基于文本挖掘的标准智能推荐方法,本发明通过将线上教学视频按播放时间进度划分为若干播放时段,通过若干播放时段内的特征动作次数的波动程度判定线上教学视频是否为特征动作显性视频,并确定特征动作显性时段,通过确定用户在线上教学视频发出提问所对应的播放时刻是否在特征动作显性时段内,以确定提问的索引类别,通过对提问文本进行分词得到若干提问词组,通过提问的索引类别确定内容推荐的响应方式,进而,实现了根据用户提问的时机分析提问内容的难度,以及根据提问难度差异快速推荐对应的教学内容,避免线上教学推荐内容的信息过载,提高了线上教学推荐内容的个性化。

    一种多模态大模型驱动的视频理解与检索方法

    公开(公告)号:CN118779492B

    公开(公告)日:2024-11-22

    申请号:CN202411276188.2

    申请日:2024-09-12

    Abstract: 本发明涉及视频检索技术领域,公开了一种多模态大模型驱动的视频理解与检索方法,包括:对待检索的视频文件,进行预处理;抽取视频片段中的语音,使用语音识别模型将语音转化成文字,作为视频片段的听觉元素文字表示;通过多模态大模型,将视频片段对应的帧组中各帧图像的图像信息转为文字,作为视频片段的视觉元素文字表示;通过SBERT模型计算每个视频片段的文字表示的向量,将得到的视频片段编码向量存入数据库中;使用倒数排序融合将向量检索结果与全文检索结果进行综合排序,给出最终检索结果。本发明通过使用预训练模型从视觉和听觉角度理解视频,不需要大规模人工标注的视频数据,泛化性高,扩展性强。

Patent Agency Ranking