一种基于频率学习的深度伪造人脸检测方法

    公开(公告)号:CN114898437A

    公开(公告)日:2022-08-12

    申请号:CN202210577016.3

    申请日:2022-05-25

    Abstract: 本发明公开了一种基于频率学习的深度伪造人脸检测方法,提出一种频率感知注意力模块来检测伪造的人脸图像,可以细化频域的表示,促进对频率伪影的学习,有效提取了频域的伪影信息,通过双流框架来提取图像的特征,同时捕捉空间域中的伪影信息以及在空间域中难以捕获但在频域较为明显的伪影信息,通过对空间域和频域的交融学习,充分利用已有数据获得最好的表征结果。同时通过引入深度伪造对比损失函数,可以在区别真假人脸的基础上保留了由不同篡改技术获得的伪造人脸的相对分布,减少真实人脸的类内方差,且放大特征空间中的类间多样性,大大提高了伪造人脸检测的泛化性以及面对真实场景中各种未知篡改方法的鲁棒性。

    同话题定位跟踪式论坛爬虫系统

    公开(公告)号:CN101436197B

    公开(公告)日:2010-09-08

    申请号:CN200810180824.6

    申请日:2008-11-25

    Inventor: 杨溥 郭军 徐蔚然

    Abstract: 本发明公开了一种同话题定位跟踪式论坛爬虫系统,包括以下部件:非文本粗略过滤器,非文本精确过滤器,超链接补全器,纯网页超链接存储库,同话题定位跟踪器,同话题网页超链接存储库,网页组数据下载器,统一编号器,网页组数据存储库,以及纯网页超链接供应器。通过应用本发明所描述的系统,可以有效地解决爬虫系统采集论坛数据大量冗余和凌乱无序的问题;可以为搭建论坛搜索引擎系统的重要组成部分——论坛数据采集系统提供通用可靠的搭建框架;显著降低论坛爬虫系统的开发难度,进一步有效地降低论坛搜索引擎系统开发成本。

    一种连续语音识别结果评价的方法和装置

    公开(公告)号:CN101609671A

    公开(公告)日:2009-12-23

    申请号:CN200910088866.1

    申请日:2009-07-21

    Abstract: 本发明实施例公开了一种基于字词混合的连续语音识别结果评价方法,包括:根据输入的语音识别结果序列和参考序列,生成字词混合的R-T匹配平面;根据DP算法在R-T平面中进行匹配,局部匹配路径采用基于字词混合的多匹配路径,并采用多种路径得分函数;进行路径回溯,获取最佳匹配结果,统计语音识别性能相关信息。还公开了一种基于字词混合的连续语音识别结果评价装置,利用本发明实施例,能够有效降低识别结果评价中的虚假错误,有效提高基于词的连续语音识别结果评价精度。

    并行式关联布告栏爬虫系统

    公开(公告)号:CN101446953A

    公开(公告)日:2009-06-03

    申请号:CN200810180822.7

    申请日:2008-11-25

    Inventor: 杨溥 郭军 徐蔚然

    Abstract: 本发明公开了一种并行式关联布告栏爬虫系统,包括以下部件:并行爬取器,超链接剥离器,数据分拣器,网页超链接存储器,数据关联器,存储器,以及超链接投递器。通过应用本发明所描述的系统,可以为开发复式综合布告栏搜索引擎系统的爬虫系统提供通用的设计架构;可以有效地快速地将多个布告栏信息综合分类,并且获得分类关联的信息数据集;从而为复式综合布告栏搜索引擎系统的其他子系统的设计和开发创造便利的条件和基础,尤其是给检索子系统提供设计开发的便利,大大地提高系统的开发效率和降低系统的开发成本。

    布告栏搜索引擎的爬虫系统构建方法

    公开(公告)号:CN101404025A

    公开(公告)日:2009-04-08

    申请号:CN200810180821.2

    申请日:2008-11-25

    Inventor: 杨溥 郭军 徐蔚然

    Abstract: 本发明公开了一种布告栏搜索引擎的爬虫系统构建方法,该方法包括下列步骤:(1)分析处理网页页面;(2)分析和归类网页内超链接和超链接的指向数据;(3)重复执行步骤(1)和(2),直到超链接全部处理完为止。通过应用本发明所描述的方法,可以为搭建布告栏搜索引擎系统所需的重要子系统——布告栏爬虫系统提供通用的设计方法;可以为布告栏搜索引擎提供清晰类化的数据集,从而简单便利化布告栏搜索引擎的其他部分的设计和开发,大幅度地降低爬虫子系统和搜索引擎大系统的开发成本。

    基于贝叶斯分类器的文字字体判断设备及其方法

    公开(公告)号:CN1234094C

    公开(公告)日:2005-12-28

    申请号:CN02157957.1

    申请日:2002-12-23

    Abstract: 本发明公开了一种基于贝叶斯分类器的文字字体判断设备及其方法。所述的设备包括:文字图像输入装置与前端处理装置、特征提取器、训练样本存储器、PCA分析器,PCA变换器、分类器参数估计器、贝叶斯分类器、可信度估计装置、判断结果输出装置和控制处理器。根据训练样本,利用统计处理方法自动学习知识,从而准确判断文字字体的设备。该设备结构化好,操作简单,判别精度高,并且对于被印章和底纹严重污染的文字,同样可以获得高精度,只需4~5个汉字即可准确判断字体,而且人工设定参数少,不依赖人的经验,回避了复杂而且容易出错的文字切分步骤,不需要对图像进行二值化。该设备适用于对识别精度要求严格的文字识别系统中,如银行支票识别系统、信函地址识别系统、表格识别系统等。

    一种语义分割方法、系统、设备和存储介质

    公开(公告)号:CN115222940B

    公开(公告)日:2023-06-09

    申请号:CN202210795660.8

    申请日:2022-07-07

    Abstract: 本申请实施例公开了一种语义分割方法和系统,所述方法包括:将源域图片转化为拟真域图片;将所述源域图片及其真实标注、所述拟真域图片输入第一中间级熵对齐网络,输出拟真域预测结果;将所述源域图片及其真实标注、所述目标域图片输入第二中间级熵对齐网络,输出目标域预测结果;利用所述拟真域预测结果和源域图片的真实标注训练输出级预测修正网络;将所述目标域预测结果输入所述输出级预测修正网络进行掩码修正,得到修正后的掩码结果。降低源域和目标域间的域隙,达到更好的域迁移目的。

    一种基于泛条件随机场的中文缺失代词补全方法

    公开(公告)号:CN112163431A

    公开(公告)日:2021-01-01

    申请号:CN202011118541.6

    申请日:2020-10-19

    Abstract: 本发明公开了一种中文缺失代词补全方法,属于信息处理领域,该方法的特征包括:顺序拼接输入文本前后句子构建输入文本上下文词向量矩阵;Transformer编码器自注意力机制建模形成输入文本上下文词语层面语义信息矩阵;构建输入文本词向量矩阵;Transformer解码器自注意力机制建模形成输入文本词语层面语义信息矩阵;Transformer解码器交互式注意力机制从输入文本上下文词语层面语义信息矩阵中推理总结出缺失代词所指语义信息向量矩阵;将缺失代词所指语义信息向量矩阵输入多层感知器得到缺失代词概率分布;根据已制定好的规则为已经预测出的标签序列构建泛条件随机场图模型;通过最大化整个对话片段标签序列得分优化补全整个对话片段的缺失代词;预测输入文本各词语前缺失代词类型。

    一种基于随机映射直方图模型的文本无关说话人鉴别装置

    公开(公告)号:CN103985384A

    公开(公告)日:2014-08-13

    申请号:CN201410232526.2

    申请日:2014-05-28

    Inventor: 于泓 马占宇 郭军

    Abstract: 本发明实施例公开了一种基于随机映射直方图模型的文本无关说话人鉴别方法。该方法包括如下步骤:特征提取步骤:将非归一化递增的线谱频率特征变换归一化的差分线谱频率特征并将相邻帧的差分线谱频率特征进行组合生成复合差分线谱频率特征以表达信号的动态特性。模型训练步骤:根据复合差分线谱频率特征的分布特点设计随机映射参数,对训练数据集进行随机映射并通过计算平均直方图来构建概率模型。鉴别步骤:对待鉴别人的语音信号按照步骤一提取特征后输入到步骤二训练得到的模型中,计算针对每个概率模型的似然值,获取最大似然值,确认说话人编号。利用本发明实施例,能够提高文本无关的说话人鉴别率,具有很大的实用价值。

    一种语音线性预测编码模型的缺失值非线性估算方法

    公开(公告)号:CN103824561A

    公开(公告)日:2014-05-28

    申请号:CN201410054042.3

    申请日:2014-02-18

    Abstract: 本发明实施例公开了一种语音线性预测编码模型的缺失值非线性估算方法。该方法包括如下步骤:线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值;训练模型步骤;传输过程中丢失部分和收到部分概率分布计算步骤;最小均方误差最优化估计步骤。利用本发明实施例,能够在分组传输丢包的情况下,可靠的实现线性预测模型的最优估计,降低传输损失,提高语音质量,具有很大的实用价值。

Patent Agency Ranking