-
公开(公告)号:CN104320649A
公开(公告)日:2015-01-28
申请号:CN201410612458.2
申请日:2014-11-04
Applicant: 北京邮电大学
IPC: H04N13/00
Abstract: 本发明实施例公开了一种基于全概率模型的多视点深度图增强系统。该系统包括如下步骤:图像预处理步骤:将像素矢量聚合为超像素矢量;颜色信息分类步骤:使用狄利克雷混合模型模拟超像素矢量分布,并运用变分法估测模型参数,得出超像素矢量的概率密度函数,根据概率进行分类;深度信息分类和增强步骤:基于颜色信息分类结果,使用高斯混合模型模拟深度图像素矢量分布,并运用变分法估计模型参数,根据所得概率密度函数对深度图像素进行细分,将各像素深度值更新为所在类内深度均值,完成深度图增强。利用本发明实施例,能够得到层次更加清晰,结构更加紧凑的深度图,从而提高基于深度绘制的多视点图像合成质量,具有很大的实用价值。
-
公开(公告)号:CN104198989A
公开(公告)日:2014-12-10
申请号:CN201410472019.6
申请日:2014-09-16
Applicant: 北京邮电大学
IPC: G01S5/02
CPC classification number: G01S5/0257
Abstract: 本发明实施例公开了一种基于照明光源和Wi-Fi信号的混合模式室内定位方法。该方法包括如下步骤:光信息发射步骤:房间号与LED灯的ID信息的广播发射;基准数据采集步骤:将LED灯的ID信息、Wi-Fi信号强度分布预先存到手机终端;Wi-Fi初步定位步骤:接收到的Wi-Fi信号强度数据与已采集的数据匹配,可确定使用者所处房间区域;可见光再次定位步骤:用光信息接收模块接收并处理光信息,预处理后的光信息再次处理后与初步定位得到的房间区域内所有ID信息比对,确定使用者所处的室内的具体位置并将该位置显示在手机屏幕上。利用本发明实施例,能够提高室内定位精准性,节约照明能耗,具有很大的实用价值。
-
公开(公告)号:CN103871411A
公开(公告)日:2014-06-18
申请号:CN201410134694.8
申请日:2014-04-03
Applicant: 北京邮电大学
Abstract: 本发明实施例公开了一种基于线谱频率差值的文本无关的说话人鉴别方法。该方法包括如下步骤:特征提取步骤:将线谱频率参数通过线性变换转化为线谱频率参数差值,结合当前帧和其前后相邻两帧形成一个生成线谱频率特征超向量;模型训练步骤:使用超狄利克雷混合模型模拟特征超向量的分布,并解出模型中的参数;鉴别步骤:对待鉴别人的语音序列按照步骤一提取特征,再输入步骤二所得到的模型,计算针对每个概率模型的似然值,获取最大似然值,确认说话人编号。利用本发明实施例,能够提高文本无关的说话人鉴别率,具有很大的实用价值。
-
公开(公告)号:CN116563607B
公开(公告)日:2024-09-17
申请号:CN202310382101.9
申请日:2023-04-11
Applicant: 北京邮电大学
IPC: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本申请涉及一种基于跨数据集信息挖掘的细粒度图像识别方法与装置。所述方法包括:获取目标细粒度图像;将目标细粒度图像输入训练好的细粒度图像识别神经网络,其中,细粒度图像识别神经网络包括特征提取模块、空间注意力模块、特征去相关模块、特征汇聚模块、识别模块,特征提取模块、空间注意力模块、特征去相关模块、特征汇聚模块、识别模块均为基于跨数据集信息预先训练的;训练好的细粒度图像识别神经网络输出与目标细粒度图像对应的识别结果。本申请通过基于跨数据集信息预先训练的细粒度图像识别神经网络对目标细粒度图像进行识别,因为训练过程学习到了不同数据集之间的正负迁移,也平衡了跨数据集的正负迁移,从而提升了识别精准度。
-
公开(公告)号:CN116363421B
公开(公告)日:2024-06-18
申请号:CN202310269093.7
申请日:2023-03-15
Applicant: 北京邮电大学
IPC: G06V10/764 , G06V10/30 , G06V10/40 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种图像的特征分类方法、装置、电子设备及介质。通过应用本申请的技术方案,可以预先利用噪音添加以及噪音去除的方式来衡量不同域图像之间的域间差异值,并以该域间差异值对特征提取器进行域泛化训练从而得到一个具有更强鲁棒性的特征提取器的图像分类模型。进而避免出现相关技术中存在的,传统的图像分类模型在遇到域偏移场景时存在的分类性能大幅下降的问题。
-
公开(公告)号:CN117237697B
公开(公告)日:2024-05-17
申请号:CN202310960507.0
申请日:2023-08-01
Applicant: 北京邮电大学
IPC: G06V10/764 , G06V10/774 , G06V10/25 , G06V10/42 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本公开涉及一种小样本图像检测方法、系统、介质及设备,方法包括:向图像检测模型中输入样本数据并对所述样本数据进行数据增强得到增强后的增强数据;从所述增强数据中利用卷积神经网络提取特征向量;生成用于分类器检测和定位目标的第一区域候选框,对所述第一区域候选框进行降采样得到第二区域候选框并根据所述第二区域候选框的坐标提取出所述特征向量中的特征;利用多层全连接网络对传入的特征进行分类和回归,以得到预测目标的位置和标签;计算图像检测模型的损失并更新图像检测模型的参数。不同于传统的基于候选框的预测方法:单个候选框预测单个实例。针对不同程度的遮挡问题进行算法的优化:在生成候选框之后,为每个候选框预测一组实例。
-
公开(公告)号:CN117994507A
公开(公告)日:2024-05-07
申请号:CN202211629088.4
申请日:2022-12-19
Applicant: 北京邮电大学
IPC: G06V10/26 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明涉及一种图像语义分割模型的训练方法方法、装置、计算机设备和存储介质,方法包括:获取训练图像训练集;将训练图像训练集中的训练图像分批次输入待训练图像语义分割模型的编码模块,编码模块输出各批次训练图像的高阶特征;根据当前批次的高阶与当前批次之前的第二预设数量的高阶特征的语义关系对当前批次的高阶进行增强处理;将增强后的当前批次的高阶特征输入待训练图像语义分割模型的解码模块,解码模块输出当前批次的训练图像的语义分割结果;根据语义分割结果,对待训练图像语义分割模型进行训练。上述方法可以提高对测试图像集的测试准确性。
-
公开(公告)号:CN117911755A
公开(公告)日:2024-04-19
申请号:CN202311836043.9
申请日:2023-12-28
Applicant: 北京邮电大学
IPC: G06V10/764 , G06V10/42 , G06V10/44 , G06V10/77 , G06V10/80
Abstract: 本申请涉及深度学习及计算机视觉识别技术领域,尤其涉及基于跨层特征挖掘的图像识别方法、装置及电子设备。所述方法包括:获取待识别图像,并提取所述待识别图像的全局特征图;对所述待识别图像的全局特征图进行降维映射,得到所述待识别图像不同层次的特征向量;根据所述待识别图像的不同层次特征图构建特征矩阵;基于所述特征矩阵和所述不同层次的特征向量进行多头注意力机制的加权融合操作,以得到跨层特征挖掘后的特征向量;基于所述跨层特征挖掘后的特征向量识别所述待识别图像。本申请通过跨层特征的挖掘实现了图像特征的增强,通过对多粒度的理解,使图像识别取得全面且足够精细的识别效果。
-
公开(公告)号:CN117609536A
公开(公告)日:2024-02-27
申请号:CN202311632626.X
申请日:2023-12-01
Applicant: 北京邮电大学
IPC: G06F16/58 , G06F16/583 , G06V10/44 , G06V10/764 , G06V10/82 , G06F16/55 , G06F16/33 , G06N3/0455 , G06N3/048 , G06N3/08 , G06N5/04
Abstract: 本发明提供一种基于语言引导的指称表达理解推理网络系统及推理方法,包括:文本特征提取器、图像特征提取器、文本特征扩展器(TFE)、跨模态对齐模块(TCA)和跨模态融合模块(TCF);通过语言引导推理网络模型(LGR‑NET),以充分利用指称表达式的指导;设置预测标记来捕捉跨模态特征,为了充分利用文本特征,通过文本特征扩展模块(TFE)从三个方面对其进行了扩展,文本生成的坐标嵌入有助于预测词元捕获关键的视觉特征;文本特征用于交替的跨模态推理;新颖的跨模态损失增强了跨模态对齐;如此文本特征从多个角度充分的引导了模型整体的跨模态推理流程,充分利用了文本中的线索,大大提高了模型性能。
-
公开(公告)号:CN117010366A
公开(公告)日:2023-11-07
申请号:CN202310820600.1
申请日:2023-07-06
Applicant: 北京邮电大学 , 北京东方通网信科技有限公司 , 北京东方通科技股份有限公司
IPC: G06F40/211 , G06F40/289 , G06F18/214
Abstract: 本发明公开了一种面向文本特定句子的内容识别和纠错方法,属于自然语言处理领域。该方法结合多项技术,包括正则匹配、hfl/rbt3模型上下句预测、位置敏感哈希技术以及Jaccard相似度计算等方法,针对领导重要讲话等特定句子识别和纠错这种特定语境,综合各种不同的方法,可以较为准确地识别新闻文章中领导重要讲话等金句部分;通过改进minhash算法,使其在处理特定文本上更有效,并且针对其中的短文本利用Jaccard相似度计算匹配,使得其在错误识别部分上也有较高的准确度。该方法能够有效地提取和校验领导重要讲话内容等特定句子,对于新闻发布等起到提高效率和准确性的重要作用。
-
-
-
-
-
-
-
-
-