-
公开(公告)号:CN118921522A
公开(公告)日:2024-11-08
申请号:CN202410773906.0
申请日:2024-06-14
Applicant: 小米科技(武汉)有限公司 , 北京小米移动软件有限公司 , 北京小米松果电子有限公司
Abstract: 本公开提供一种多媒体数据处理方法、装置、电子设备、芯片及介质,该方法涉及图像处理领域。该方法由终端执行,包括:获取多个待处理多媒体片段;分别对多个待处理多媒体片段进行第一处理,得到多个待处理多媒体片段的第一信息;将第一信息上传至云端,并获取云端基于第一信息生成的多个待处理多媒体片段的剪辑脚本;按照剪辑脚本,对多个待处理多媒体片段进行处理,得到目标多媒体数据。本公开提供的方法,在终端侧对原始视频进行处理,无需将原始视频上传至云端,保护了用户隐私,并可以在获取视频后直接得到剪辑后的视频,无需用户输入提示类的信息,提高了处理的效率,解决了人工剪辑繁琐的操作流程,简化了处理方式。
-
公开(公告)号:CN110602527A
公开(公告)日:2019-12-20
申请号:CN201910867365.7
申请日:2019-09-12
Applicant: 北京小米移动软件有限公司
IPC: H04N21/234 , H04N21/44 , G06K9/62
Abstract: 本公开是关于一种视频处理方法、装置及存储介质。视频处理方法包括:在待处理视频中按照时序采集多个视频帧;对多个视频帧中每一视频帧对应的图像分别进行分类以获得分类结果;对每一视频帧对应的图像的分类结果进行时序平滑处理,以确定与每一视频帧相关联的至少一个类别;将时序上相邻且同一类别的视频帧,划分为同一个视频片段,以获得多个视频片段;其中,如果同一视频帧属于不同的类别,则将该视频帧划分到对应类别的不同视频片段中。通过本公开实施例,可对视频中同时出现的不同类别实例进行分类,并确定不同类别实例在视频中出现的起止位置。
-
公开(公告)号:CN118152606A
公开(公告)日:2024-06-07
申请号:CN202410296006.1
申请日:2024-03-14
Applicant: 小米科技(武汉)有限公司 , 北京小米移动软件有限公司 , 北京小米松果电子有限公司
IPC: G06F16/583 , G06F16/535 , G06F18/213 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/045
Abstract: 本公开提供一种图像获取方法、装置、设备及存储介质,涉及人工智能技术领域。在本公开的一些实施例中,将搜索文本输入文本编辑器中,得到搜索文本特征;其中,文本编辑器是对每个网络层的输出误差进行监督得到的第一量化参数进行量化得到的编辑器;根据搜索文本特征,从图像特征数据库中选择出与搜索文本对应的目标图像,其中,图像特征数据库中存储有目标图像的目标图像特征,目标图像特征是通过图像编辑器提取到的特征,图像编辑器是对每个块的输出误差进行监督得到的第二量化参数进行量化得到的编辑器,每个块包括多个网络层;本公开对卷积层较多的图像编辑器以块为单位,监督每个块的输出误差得到第二量化参数,提高量化后模型的精度。
-
公开(公告)号:CN117827873A
公开(公告)日:2024-04-05
申请号:CN202311827988.4
申请日:2023-12-27
Applicant: 小米科技(武汉)有限公司 , 北京小米移动软件有限公司 , 北京小米松果电子有限公司
IPC: G06F16/242 , G06F16/245 , G06F16/2457 , G06F18/22
Abstract: 本申请提出一种信息检索方法、装置、电子设备及存储介质。该方法包括:对待查询信息与信息库中的候选信息进行相似度计算,得到第一相似度集合;获取第一相似度集合的第一均值和第一标准差,并基于第一均值和第一标准差,确定第一信息过滤阈值;基于第一信息过滤阈值,对信息库中的候选信息进行筛选,得到待查询信息对应的目标候选信息。由此,本方案通过确定第一信息过滤阈值,并根据第一信息过滤阈值,对候选信息进行筛选,确定待查询信息对应的目标候选信息,能够根据待查询信息及信息库内候选信息的变化,动态的设定第一信息过滤阈值,使得返回给用户的目标候选信息的数量更合理,避免了繁琐的阈值调优工作。
-
公开(公告)号:CN116363559A
公开(公告)日:2023-06-30
申请号:CN202310291290.9
申请日:2023-03-21
Applicant: 小米科技(武汉)有限公司 , 北京小米移动软件有限公司 , 北京小米松果电子有限公司
Abstract: 本公开提供一种模型训练方法、视频语义分割方法及装置。其中,该方法包括:获取样本视频数据中的样本视频帧图像,以及样本视频帧图像对应的标注结果;根据样本视频帧图像和标注结果对教师网络模型进行训练得到训练好的教师网络模型;根据样本视频帧图像、标注结果、样本视频帧图像对应的相邻视频帧图像、以及训练好的教师网络模型,对学生网络模型进行训练得到训练好的学生网络模型。由此,采用上述方法得到的训练好的学生网络模型,可以节省计算资源和减少训练的时间开销,提高效率,并且训练过程中考虑了相邻视频帧图像,还能够提高时序一致性。
-
公开(公告)号:CN110602527B
公开(公告)日:2022-04-08
申请号:CN201910867365.7
申请日:2019-09-12
Applicant: 北京小米移动软件有限公司
IPC: H04N21/234 , H04N21/44 , G06K9/62 , G06V10/764
Abstract: 本公开是关于一种视频处理方法、装置及存储介质。视频处理方法包括:在待处理视频中按照时序采集多个视频帧;对多个视频帧中每一视频帧对应的图像分别进行分类以获得分类结果;对每一视频帧对应的图像的分类结果进行时序平滑处理,以确定与每一视频帧相关联的至少一个类别;将时序上相邻且同一类别的视频帧,划分为同一个视频片段,以获得多个视频片段;其中,如果同一视频帧属于不同的类别,则将该视频帧划分到对应类别的不同视频片段中。通过本公开实施例,可对视频中同时出现的不同类别实例进行分类,并确定不同类别实例在视频中出现的起止位置。
-
-
-
-
-