-
公开(公告)号:CN117557947B
公开(公告)日:2024-04-12
申请号:CN202410039344.7
申请日:2024-01-11
Applicant: 湖北微模式科技发展有限公司
Abstract: 本发明公开一种基于均方误差的静态场景视频真伪鉴定方法及装置,涉及静态场景视频真伪鉴定技术领域,首先,使用解码器对一段视频流进行解码,得到连续多帧的视频流图像。然后,检测者选择一个需要检测的静态视频画面矩形区域,通常是视频中的背景区域,并从多帧的视频流图像画面中都截取该区域,得到同等尺寸的连续多帧的局部画面。计算相邻两帧的像素点数值的残差,得到一组残差图像,并计算残差图像的均方误差。再将上一步骤中的局部画面图像顺序置乱后,按照同样方法再次计算相邻的残差图像,并计算残差图像的均方误差。最后,查看根据这两种方法计算出的均方误差相差数值是否超过既定阈值,超过则判定为真实视频,否则判定为伪造视频。
-
公开(公告)号:CN117274885B
公开(公告)日:2024-02-09
申请号:CN202311574312.9
申请日:2023-11-23
Applicant: 湖北微模式科技发展有限公司
Abstract: 本发明公开一种人脸伪造视频检测方法,涉及人脸伪造视频检测技术领域,对待检测视频的视频帧进行语义分割,得到语义分割图,同时对视频帧计算光流图;根据语义分割图生成类别注意力图;对光流图提取光流特征图,并采用多尺度特征融合算法得到光流多尺度特征融合图;将类别注意力图和光流多尺度特征融合图进行乘法运算,并进行降维处理得到帧特征图;分别收集多个视频帧的帧特征图,并利用多层感知器进行融合;对融合后的特征进行分类,根据分类结果判断待检测视频是否为经过伪造的视频。本发明可以有效地检测出人脸伪造视频,提高视频的安全性和可靠性;具有较高的准确性和鲁棒性,
-
公开(公告)号:CN117057971A
公开(公告)日:2023-11-14
申请号:CN202311278634.9
申请日:2023-10-07
Applicant: 湖北微模式科技发展有限公司
IPC: G06T1/00
Abstract: 本发明公开一种基于亮度收缩校准的JPEG图像半脆弱水印算法及装置,涉及图像隐写与数字水印技术领域,首先将JPEG图像中亮度分量进行中部收缩;然后,对经过该处理的JPEG图像使用相同的量化表进行二次压缩得到校准图像;接着,将校准后的DCT系数与原始DCT系数进行比对,得到量化索引调制的量化方向;最后进行量化索引调制完成量化;提取时,对JPEG图像的亮度DCT系数进行解量化得到半脆弱水印。本发明采用亮度收缩校准方法和量化索引调整技术的结合创新地解决了传统水印技术的诸多问题,提升了数字水印技术在JPEG图像中的应用前景。在图像的版权保护、身份验证、图像防篡改、信息隐藏等领域都具有广泛的应用价值。
-
公开(公告)号:CN116312552B
公开(公告)日:2023-08-15
申请号:CN202310569405.6
申请日:2023-05-19
Applicant: 湖北微模式科技发展有限公司
Abstract: 本发明提供了一种视频说话人日志方法及系统,所提出的方法将一段录音录像视频分离为音频部分和视频部分,一方面利用语音识别技术,对整个音频部分进行分割,得到仅包含单个说话人的语音片段,对每个语音片段进行发声者属性检测获取发声者属性信息并提取声纹特征;另一方面对视频部分中的人物目标进行目标检测和跟踪,得到目标人属性信息;最后结合发声者属性信息和目标人属性信息的匹配结构以及声纹特征比对来确定说话人。用于实现上述方法的视频说话人日志系统包括录音录像装备、存储器、处理器、显示设备、扬声器和输入设备。使用该方法及系统最终生成的说话人日志不仅包含说话人时间起止信息,还包含说话人图像信息和说话文字信息。
-
公开(公告)号:CN116092496A
公开(公告)日:2023-05-09
申请号:CN202211551039.3
申请日:2022-12-05
Applicant: 湖北微模式科技发展有限公司
Abstract: 一种话术表达完整性判别的方法与系统,步骤1,根据工作人员某次双录销售过程所销售产品的特点制定标准话术,并把标准话术根据语义切分为至少一个话术环节,每个话术环节包含一个需要向客户说明的完整信息。步骤2,获取工作人员双录过程中的语音数据;步骤3,使用语音识别技术把语音数据转换为文本数据;步骤4,基于编辑距离算法完成话术表达完整性的判断,将步骤3中的文本数据和标准话术的每个话术环节进行编辑距离算法比较,根据比较结果判断工作人员的语音内容对于标准话术的表达是否完整。能够准确地判断工作人员的话术表达是否完整,省略了深度学习的训练过程,采用简单的编辑距离完成话术表达完整性判断,具有快速、准确的特点。
-
公开(公告)号:CN115330359B
公开(公告)日:2023-01-17
申请号:CN202211239431.4
申请日:2022-10-11
Applicant: 湖北微模式科技发展有限公司
IPC: G06Q10/10 , G06Q40/00 , G06Q50/10 , H04N21/231 , H04N21/433 , H04N21/437 , H04N21/443
Abstract: 一种实现本地化双录质检稽核服务的方法,在同一台用于金融双录的前端设备上设置金融业务流程程序和金融双录质检稽核系统两套程序,所述金融业务流程程序调用前端设备的录音录像硬件完成金融双录音视频的录制,生成待质检稽核的音视频文件及其对应的用于质检稽核的参数信息,并通过网络协议将该参数信息和待质检稽核的音视频文件地址信息传输给后台运行的金融双录质检稽核系统,金融双录质检稽核系统在所述前端设备的后台完成音视频质检稽核,并将质检稽核报告通过网络协议传输给音视频录制程序,工作人员确认质检稽核报告后,将质检稽核报告和音视频文件打包传输给金融远端服务器存档。本发明大大缩减了金融双录音视频的质检稽核等待时间。
-
公开(公告)号:CN115330359A
公开(公告)日:2022-11-11
申请号:CN202211239431.4
申请日:2022-10-11
Applicant: 湖北微模式科技发展有限公司
IPC: G06Q10/10 , G06Q40/00 , G06Q50/10 , H04N21/231 , H04N21/433 , H04N21/437 , H04N21/443
Abstract: 一种实现本地化双录质检稽核服务的方法,在同一台用于金融双录的前端设备上设置金融业务流程程序和金融双录质检稽核系统两套程序,所述金融业务流程程序调用前端设备的录音录像硬件完成金融双录音视频的录制,生成待质检稽核的音视频文件及其对应的用于质检稽核的参数信息,并通过网络协议将该参数信息和待质检稽核的音视频文件地址信息传输给后台运行的金融双录质检稽核系统,金融双录质检稽核系统在所述前端设备的后台完成音视频质检稽核,并将质检稽核报告通过网络协议传输给音视频录制程序,工作人员确认质检稽核报告后,将质检稽核报告和音视频文件打包传输给金融远端服务器存档。本发明大大缩减了金融双录音视频的质检稽核等待时间。
-
公开(公告)号:CN114299953B
公开(公告)日:2022-08-23
申请号:CN202111632122.9
申请日:2021-12-29
Applicant: 湖北微模式科技发展有限公司
IPC: G10L15/25 , G10L15/02 , G10L15/04 , G10L15/18 , G10L17/02 , G10L17/14 , G10L25/27 , G10L25/57 , G06V20/40 , G06V40/16 , G06V40/20 , G06T7/20
Abstract: 一种结合嘴部运动分析的话者角色区分方法与系统,方法包括:步骤1:分割视频,分割后得到音频信息和视频信息;步骤2:音频信息分析,截取音频信息中出现语音特征的语音片段,记录所述语音片段的时间节点,并提取语音片段的声纹特征用于角色区分;步骤3:视频信息分析,分析视频信息中各角色的嘴部状态,检测视频中对应角色识别到嘴部状态符合说话特征的起始时间节点;步骤4:音视频融合分析划分话者角色。一方面利用音频信息,提取音频特征,并基于音频特征进行说话人转换检测,然后提取声纹特征用于话者角色区分;另一方面利用视频信息,对视频中人说话的起始时间进行判断;最后融合两种检测结果得到更准确的角色区分结果。
-
公开(公告)号:CN114299953A
公开(公告)日:2022-04-08
申请号:CN202111632122.9
申请日:2021-12-29
Applicant: 湖北微模式科技发展有限公司
IPC: G10L15/25 , G10L15/02 , G10L15/04 , G10L15/18 , G10L17/02 , G10L17/14 , G10L25/27 , G10L25/57 , G06V20/40 , G06V40/16 , G06V40/20 , G06T7/20
Abstract: 一种结合嘴部运动分析的话者角色区分方法与系统,方法包括:步骤1:分割视频,分割后得到音频信息和视频信息;步骤2:音频信息分析,截取音频信息中出现语音特征的语音片段,记录所述语音片段的时间节点,并提取语音片段的声纹特征用于角色区分;步骤3:视频信息分析,分析视频信息中各角色的嘴部状态,检测视频中对应角色识别到嘴部状态符合说话特征的起始时间节点;步骤4:音视频融合分析划分话者角色。一方面利用音频信息,提取音频特征,并基于音频特征进行说话人转换检测,然后提取声纹特征用于话者角色区分;另一方面利用视频信息,对视频中人说话的起始时间进行判断;最后融合两种检测结果得到更准确的角色区分结果。
-
公开(公告)号:CN112040086A
公开(公告)日:2020-12-04
申请号:CN201910478538.6
申请日:2019-06-03
Applicant: 湖北微模式科技发展有限公司
Abstract: 本发明公开了一种图像加密、解密方法及装置、设备和可读存储介质。该图像加密方法包括:根据原始图像中需要加密的图像内容生成二值标记矩阵;使用生成的标记矩阵对原始图像进行标记;采用密钥随机形成加密矩阵,加密矩阵与标记矩阵进行与运算得到掩码矩阵;通过掩码矩阵对标记后的图像进行异或运算,形成加密图像。解密时首先使用异或运算在相应位平面上还原出加密像素标记矩阵,并对所有加密的像素的相应比特平面再次进行异或运算还原图像加密像素内容。通过本发明,用户可以约束部分人对于图像部分内容的访问权限。在条件允许时,用户自己或者被授权的一方通过该受保护的图像还原出原始内容。
-
-
-
-
-
-
-
-
-