一种语音线性预测编码模型的缺失值非线性估算方法

    公开(公告)号:CN103824561B

    公开(公告)日:2015-03-11

    申请号:CN201410054042.3

    申请日:2014-02-18

    Abstract: 本发明实施例公开了一种语音线性预测编码模型的缺失值非线性估算方法。该方法包括如下步骤:线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值;训练模型步骤;传输过程中丢失部分和收到部分概率分布计算步骤;最小均方误差最优化估计步骤。利用本发明实施例,能够在分组传输丢包的情况下,可靠的实现线性预测模型的最优估计,降低传输损失,提高语音质量,具有很大的实用价值。

    一种基于最小编辑距离的半结构化文本匹配方法

    公开(公告)号:CN104008187A

    公开(公告)日:2014-08-27

    申请号:CN201410257734.8

    申请日:2014-06-11

    Inventor: 赵宇 高升 郭军

    CPC classification number: G06F17/30908 G06F17/30654

    Abstract: 本发明属于自然语言处理领域,提出一种基于最小编辑距离的半结构化文本匹配方法。该方法包括如下步骤:一、对数据进行预处理;二、离线训练,确定对数似然率算法和左右熵算法阈值;三、结合这两种算法,在线为待评测的半结构化文本中非结构化文本抽取多词表达集合;四、利用抽取的多词表达集合,加上原评测文本中的结构化串,得到该文本的基于多词表达集合的文本表达;五、利用基于最小编辑距离的半结构化文本匹配方法,计算输入的半结构化文本和待匹配的半结构化文本的匹配度;六、以特征集合的相似度来衡量文本的匹配度,输出排序结果(Top-N)。利用本发明实施例,能够提高半结构化文本的匹配准确度,具有很大的实用价值。

    针对视频网站的广域网爬虫系统

    公开(公告)号:CN101446954B

    公开(公告)日:2010-09-08

    申请号:CN200810180826.5

    申请日:2008-11-25

    Inventor: 杨溥 郭军 陈光

    Abstract: 本发明公开了一种针对视频网站的广域网爬虫系统,包括以下部件:超链接扫描器,通用地址分析提取器,视频标识提取器,播放地址合成器,视频真实地址提取器,真实地址存储库,视频数据下载器,视频数据存储库,以及超链接喂食器。通过应用本发明所描述的系统,可以有效地解决爬虫系统无法采集广域网中视频网站数据的问题;可以为视频爬虫系统中的核心技术——转址功能提供通用的框架;可以为搭建针对广域网视频的搜索引擎系统的重要组成部分——视频数据采集系统提供通用的搭建架构;显著降低广域网视频爬虫系统的开发难度,进一步有效地降低系统开发成本。

    针对视频网站的广域网爬虫系统

    公开(公告)号:CN101446954A

    公开(公告)日:2009-06-03

    申请号:CN200810180826.5

    申请日:2008-11-25

    Inventor: 杨溥 郭军 陈光

    Abstract: 本发明公开了一种针对视频网站的广域网爬虫系统,包括以下部件:超链接扫描器,通用地址分析提取器,视频标识提取器,播放地址合成器,视频真实地址提取器,真实地址存储库,视频数据下载器,视频数据存储库,以及超链接喂食器。通过应用本发明所描述的系统,可以有效地解决爬虫系统无法采集广域网中视频网站数据的问题;可以为视频爬虫系统中的核心技术转址功能提供通用的框架;可以为搭建针对广域网视频的搜索引擎系统的重要组成部分视频数据采集系统提供通用的搭建架构;显著降低广域网视频爬虫系统的开发难度,进一步有效地降低系统开发成本。

    自动动态更新论坛爬虫系统的构建方法

    公开(公告)号:CN101436196A

    公开(公告)日:2009-05-20

    申请号:CN200810180823.1

    申请日:2008-11-25

    Inventor: 杨溥 郭军 徐蔚然

    Abstract: 本发明公开了一种自动动态更新论坛爬虫系统的构建方法,该方法包括下列步骤:(1)提取存储纯网页超链接;(2)判断话题网页位置;(3)检测话题网页新旧;(4)新话题网页处理;(5)旧话题网页处理;(6)纯网页超链接情况判断处理。通过应用本发明所描述的方法,可以有效地避免静态更新的弊端;可以自动实时地更新论坛网页;可以为搭建动态更新论坛爬虫系统提供通用的设计框架;更加迅速便利地实现系统开发,有效地降低系统开发成本。

    中文文本自动分词和判别文本抄袭的装置和方法

    公开(公告)号:CN1529263A

    公开(公告)日:2004-09-15

    申请号:CN03157183.2

    申请日:2003-09-18

    Abstract: 本发明公开了一种用于中文文本自动分词和判别文本抄袭的装置和方法,所述的装置包括:样本输入装置、样本数据库、自动分句分词装置、分词数据库、预处理装置、特征词数据库、相似判别装置、判别结果输出装置和控制处理装置。所述的方法是首先对中文文本进行自动分词,然后通过计算它们的相似度,达到判别文本是否存在抄袭的成分的目的。本发明的装置和方法思路简捷,能够实现中文文本抄袭的自动判别,判别结果准确,有效提高工作效率,减少人为的劳动量。

    一种基于频率学习的深度伪造人脸检测方法

    公开(公告)号:CN114898437B

    公开(公告)日:2024-12-31

    申请号:CN202210577016.3

    申请日:2022-05-25

    Abstract: 本发明公开了一种基于频率学习的深度伪造人脸检测方法,提出一种频率感知注意力模块来检测伪造的人脸图像,可以细化频域的表示,促进对频率伪影的学习,有效提取了频域的伪影信息,通过双流框架来提取图像的特征,同时捕捉空间域中的伪影信息以及在空间域中难以捕获但在频域较为明显的伪影信息,通过对空间域和频域的交融学习,充分利用已有数据获得最好的表征结果。同时通过引入深度伪造对比损失函数,可以在区别真假人脸的基础上保留了由不同篡改技术获得的伪造人脸的相对分布,减少真实人脸的类内方差,且放大特征空间中的类间多样性,大大提高了伪造人脸检测的泛化性以及面对真实场景中各种未知篡改方法的鲁棒性。

    一种图片浏览方法
    28.
    发明授权

    公开(公告)号:CN105631039B

    公开(公告)日:2019-02-15

    申请号:CN201610028471.2

    申请日:2016-01-15

    Abstract: 本发明公开了一种图片浏览方法,包括:基于人脸特征向量检测目标图片集中的人脸;从检测出人脸后的目标图片集中选择指定人脸,并获取指定人脸的人脸特征向量;基于人脸特征向量计算指定人脸与目标图片集中检测出的其他人脸的相似度;基于相似度排序显示目标图片集中的图片。本发明摆脱了人工标签标注的复杂性并避免盲目自动分组的高错误率,实现了基于人脸相似度的图片浏览。

    一种基于竞争神经网络的鲁棒说话人识别方法

    公开(公告)号:CN107993664A

    公开(公告)日:2018-05-04

    申请号:CN201810075745.2

    申请日:2018-01-26

    Abstract: 本发明实施例公开了一种基于竞争神经网络的鲁棒说话人识别方法。该方法利用竞争神经网络提取具有噪声不变性的声学特征,并利用该特征进行基于GMM-UBM模型的说话人识别系统的训练,包括如下步骤:构建包含两个级连的编码网络与区分网络的竞争神经网络,并利用其中的编码网络提取噪声不变特征,然后利用提取的特征实现基于GMM-UBM模型的说话人。在竞争网络训练时编码网络与区分网络分别训练,训练编码网络时所有输入采用相同的干净语音标签,训练区分网络时利用训练语音的噪声类型作为训练标签,利用本发明实施例,能够提高文本无关的说话人鉴别率,具有很大的实用价值。

    一种图片浏览方法
    30.
    发明公开

    公开(公告)号:CN105631039A

    公开(公告)日:2016-06-01

    申请号:CN201610028471.2

    申请日:2016-01-15

    CPC classification number: G06F17/30274 G06K9/00228

    Abstract: 本发明公开了一种图片浏览方法,包括:基于人脸特征向量检测目标图片集中的人脸;从检测出人脸后的目标图片集中选择指定人脸,并获取指定人脸的人脸特征向量;基于人脸特征向量计算指定人脸与目标图片集中检测出的其他人脸的相似度;基于相似度排序显示目标图片集中的图片。本发明摆脱了人工标签标注的复杂性并避免盲目自动分组的高错误率,实现了基于人脸相似度的图片浏览。

Patent Agency Ranking