-
公开(公告)号:CN116912902A
公开(公告)日:2023-10-20
申请号:CN202310673373.4
申请日:2023-06-07
申请人: 北京明略昭辉科技有限公司
IPC分类号: G06V40/16 , G06V40/40 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/0475 , G06N3/084 , G06N3/094 , G06N3/096
摘要: 本申请涉及人脸识别技术领域,公开一种用于多种攻击风格人脸图片的生成方法及装置,其中,所述生成方法,包括:根据预设的人脸图片数据集和高清人脸数据集,训练得到一个生成对抗网络并保留所述生成对抗网络中的生成器;根据所述人脸图片数据集中的多张人脸图片以及每张人脸图片对应的描述文本,训练得到一个基于模型微调的多模态模型;根据多种攻击风格分别对应的描述文本,通过所述生成器和所述多模态模型,生成多种攻击风格分别对应的人脸图片。
-
公开(公告)号:CN115205736A
公开(公告)日:2022-10-18
申请号:CN202210784195.8
申请日:2022-06-28
申请人: 北京明略昭辉科技有限公司
IPC分类号: G06V20/40 , G06V10/44 , G06V10/764 , H04N21/234 , H04N21/44
摘要: 本申请提供了一种视频数据的识别方法和装置、电子设备和存储介质,其中,该方法包括:获取待处理的目标视频片段;将所述目标视频片段输入目标模型中,得到视频特征,其中,所述目标模型用于得出能够表征所述目标视频片段内包含的视频的特征信息,所述目标模型是通过对初始模型的模型参数进行调整后得到的;根据所述视频特征,确定对所述目标视频片段中的视频数据的识别结果。通过本申请,解决了相关技术中存在的自动化程度较低,不能准确识别出视频片段的视频内容特征的问题。
-
公开(公告)号:CN114896449A
公开(公告)日:2022-08-12
申请号:CN202210578522.4
申请日:2022-05-25
申请人: 北京明略昭辉科技有限公司
IPC分类号: G06F16/65 , G06V10/764 , G06V10/80 , G06V10/40 , G06V10/82 , G06N3/04 , G06N3/08 , G10L25/57 , G10L25/27
摘要: 本申请涉及一种视频分类方法、装置、设备及介质,该方法包括:构建多层特征融合网络;提取目标视频中的图像特征集和音频特征集;利用瓶颈单元向量交替在多层特征融合网络中进行图像特征和音频特征的联合学习,得到最后一层特征融合网络的图像特征融合单元输出的目标整体图像特征和最后一层特征融合网络的音频特征融合单元输出的目标整体音频特征;将目标整体图像特征和目标整体音频特征输入分类器,以确定目标视频的类别。本申请通过设置瓶颈单元向量在视频的图像特征和音频特征的融合过程中获得用于分类的重要特征信息,进行数据交互,解决了特征融合过程速度较慢且容易过拟合的问题。
-
公开(公告)号:CN114724066A
公开(公告)日:2022-07-08
申请号:CN202210348257.0
申请日:2022-04-01
申请人: 北京明略昭辉科技有限公司
摘要: 本申请涉及一种媒体广告播放次数统计方法和装置、电子设备、存储介质,其中,该方法包括:获取目标视频,其中,目标视频是在媒体终端播放媒体广告的过程中采集到的、待确定对目标媒体广告的播放次数的视频;提取目标视频的多模态特征,其中,多模态特征是对视频的多种感官信息分别提取特征后组合而成的;在目标视频的多模态特征中匹配目标媒体广告的多模态特征,以确定目标视频对目标媒体广告的播放次数。本申请解决了由于人工监播耗时耗力造成无法及时检测媒体广告是否按照预定的次数播放的技术问题。
-
公开(公告)号:CN114722279A
公开(公告)日:2022-07-08
申请号:CN202210348084.2
申请日:2022-03-29
申请人: 北京明略昭辉科技有限公司
IPC分类号: G06F16/9535 , G06V20/40 , G06F16/36 , G06N3/04 , G06K9/62 , G06V10/82 , G06V10/764 , G06V10/80
摘要: 本申请涉及一种内容推荐方法、装置、电子设备及存储介质。该方法包括:获取目标对象在聊天应用中的聊天记录,其中,聊天记录包括文本内容和多媒体内容;对多媒体内容进行识别,得到物体识别结果,其中,物体识别结果用于表示在多媒体内容中识别出来的物体;根据文本内容和物体识别结果构建结构化数据,其中,结构化数据是采用与物体识别结果相关的问题和答案表示的结构化数据;根据结构化数据确定聊天记录中的关键词,并在聊天应用中向目标对象推送目标内容。该方法,将文本内容和多媒体内容结合到一起分析目标对象的关键词,从而给目标对象推送更加感兴趣的目标内容,进而解决了相关技术中所推荐的内容与用户需求不匹配的问题。
-
公开(公告)号:CN114708579A
公开(公告)日:2022-07-05
申请号:CN202210331329.0
申请日:2022-03-30
申请人: 北京明略昭辉科技有限公司
摘要: 本发明公开了一种LOGO的识别方法及装置、存储介质、电子设备。其中,该方法包括获取样本LOGO图像的全局图像与局部图像;通过第一模型提取所述全局图像的第一特征向量,通过第二模型提取所述全局图像和所述局部图像的第二特征向量;对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量;将学习完成之后的第二模型输出为残缺LOGO识别模型。通过本发明,解决了相关技术中LOGO的识别准确率不够高的技术问题,提高了对残缺LOGO图像的识别准确率。
-
公开(公告)号:CN114707016A
公开(公告)日:2022-07-05
申请号:CN202210323525.3
申请日:2022-03-29
申请人: 北京明略昭辉科技有限公司
IPC分类号: G06F16/58 , G06F40/295 , G06K9/62
摘要: 本申请涉及一种目标对象检索方法、装置、电子设备及存储介质,其中,方法包括:获取待检索对象,并对待检索对象进行编码,以得到待检索编码;在检索编码集中查找与待检索编码匹配的对象编码,检索编码集为通过对象编码模型对检索对象集中每个对象进行编码处理,得到的编码结果集;将与待检索编码匹配的对象编码作为目标对象编码,根据目标对象编码获取目标对象;通过将待检索对象进行编码处理,然后在检索编码集中查找与之相似的对象编码,进而实现在检索编码集中快速查找到与待检索对象对应的目标对象,提升了检索的效率,通过对象编码模型来对检索对象集中每个对象进行编码处理,统一了对象编码的标准,进而提升了检索的准确度。
-
公开(公告)号:CN114639154A
公开(公告)日:2022-06-17
申请号:CN202210326351.6
申请日:2022-03-30
申请人: 北京明略昭辉科技有限公司
摘要: 本申请涉及人脸识别技术领域,公开一种人脸图片的风格转换方法,包括:基于Cycle GAN算法构造第一生成器和第二生成器,以使所述第一生成器实现从第一风格到第二风格的图片风格转换,并以使所述第二生成器实现从第二风格到第一风格的图片风格转换;根据获取到的第一人脸数据集和第二人脸数据集,对所述第一生成器和第二生成器进行训练,以使所述第一生成器与第二生成器之间的损失值收敛;获取任意第一风格或第二风格的攻击人脸图片,通过所述第一生成器或第二生成器实现所述攻击人脸图片的图片风格转换。本申请还公开一种人脸图片的风格转换装置、电子设备及存储介质。
-
公开(公告)号:CN114639055A
公开(公告)日:2022-06-17
申请号:CN202210323564.3
申请日:2022-03-29
申请人: 北京明略昭辉科技有限公司
摘要: 本发明提供了一种视频处理方法、视频分类方法、装置、电子设备及介质,该方法包括:获取目标视频,其中,所述目标视频的画面中至少包含第一对象和第二对象;从所述目标视频中抽取多个帧图像;选定所述多个帧图像中未被选过的目标帧图像,提取所述目标帧图像中的每个对象对应的图像特征;根据所述目标帧图像中每个对象对应的图像特征构建所述第一对象的关系图;根据所述多个帧图像对应的多个关系图识别所述第一对象的动作,得到所述第一对象的动作识别结果。本发明通过构建目标视频中的第一对象在每个帧图像中与第二对象之间的关系图,根据关系图识别第一对象的动作,提高了视频中动作识别的准确率。
-
公开(公告)号:CN114612840A
公开(公告)日:2022-06-10
申请号:CN202210270938.X
申请日:2022-03-18
申请人: 北京明略昭辉科技有限公司
摘要: 本申请涉及深度学习技术领域,公开了一种基于视频的检测吸烟行为的方法。该基于视频的检测吸烟行为的方法包括:获得待识别视频片段;对待识别视频片段中每一视频帧进行编码处理,获得每一视频帧的单帧特征向量;对全部单帧特征向量及其对应的位置编码进行编码处理,获得帧序列特征向量;其中,单帧特征向量对应的位置编码用于表示每个单帧特征向量对应的视频帧在待识别视频片段中的先后顺序;对帧序列特征向量进行分类处理,获得吸烟行为的检测结果。采用该基于视频的检测吸烟行为的方法可更加准确地识别吸烟行为。本申请还公开一种基于视频的检测吸烟行为的装置、电子设备以及存储介质。
-
-
-
-
-
-
-
-
-