一种基于全概率模型的多视点深度图增强系统

    公开(公告)号:CN104320649A

    公开(公告)日:2015-01-28

    申请号:CN201410612458.2

    申请日:2014-11-04

    Inventor: 马占宇 黄迪

    Abstract: 本发明实施例公开了一种基于全概率模型的多视点深度图增强系统。该系统包括如下步骤:图像预处理步骤:将像素矢量聚合为超像素矢量;颜色信息分类步骤:使用狄利克雷混合模型模拟超像素矢量分布,并运用变分法估测模型参数,得出超像素矢量的概率密度函数,根据概率进行分类;深度信息分类和增强步骤:基于颜色信息分类结果,使用高斯混合模型模拟深度图像素矢量分布,并运用变分法估计模型参数,根据所得概率密度函数对深度图像素进行细分,将各像素深度值更新为所在类内深度均值,完成深度图增强。利用本发明实施例,能够得到层次更加清晰,结构更加紧凑的深度图,从而提高基于深度绘制的多视点图像合成质量,具有很大的实用价值。

    一种基于照明光源和Wi-Fi信号的混合模式室内定位系统

    公开(公告)号:CN104198989A

    公开(公告)日:2014-12-10

    申请号:CN201410472019.6

    申请日:2014-09-16

    Inventor: 赵啸宇 马占宇

    CPC classification number: G01S5/0257

    Abstract: 本发明实施例公开了一种基于照明光源和Wi-Fi信号的混合模式室内定位方法。该方法包括如下步骤:光信息发射步骤:房间号与LED灯的ID信息的广播发射;基准数据采集步骤:将LED灯的ID信息、Wi-Fi信号强度分布预先存到手机终端;Wi-Fi初步定位步骤:接收到的Wi-Fi信号强度数据与已采集的数据匹配,可确定使用者所处房间区域;可见光再次定位步骤:用光信息接收模块接收并处理光信息,预处理后的光信息再次处理后与初步定位得到的房间区域内所有ID信息比对,确定使用者所处的室内的具体位置并将该位置显示在手机屏幕上。利用本发明实施例,能够提高室内定位精准性,节约照明能耗,具有很大的实用价值。

    一种基于线谱频率差值的文本无关的说话人鉴别装置

    公开(公告)号:CN103871411A

    公开(公告)日:2014-06-18

    申请号:CN201410134694.8

    申请日:2014-04-03

    Abstract: 本发明实施例公开了一种基于线谱频率差值的文本无关的说话人鉴别方法。该方法包括如下步骤:特征提取步骤:将线谱频率参数通过线性变换转化为线谱频率参数差值,结合当前帧和其前后相邻两帧形成一个生成线谱频率特征超向量;模型训练步骤:使用超狄利克雷混合模型模拟特征超向量的分布,并解出模型中的参数;鉴别步骤:对待鉴别人的语音序列按照步骤一提取特征,再输入步骤二所得到的模型,计算针对每个概率模型的似然值,获取最大似然值,确认说话人编号。利用本发明实施例,能够提高文本无关的说话人鉴别率,具有很大的实用价值。

    一种基于跨数据集信息挖掘的细粒度图像识别方法与装置

    公开(公告)号:CN116563607B

    公开(公告)日:2024-09-17

    申请号:CN202310382101.9

    申请日:2023-04-11

    Abstract: 本申请涉及一种基于跨数据集信息挖掘的细粒度图像识别方法与装置。所述方法包括:获取目标细粒度图像;将目标细粒度图像输入训练好的细粒度图像识别神经网络,其中,细粒度图像识别神经网络包括特征提取模块、空间注意力模块、特征去相关模块、特征汇聚模块、识别模块,特征提取模块、空间注意力模块、特征去相关模块、特征汇聚模块、识别模块均为基于跨数据集信息预先训练的;训练好的细粒度图像识别神经网络输出与目标细粒度图像对应的识别结果。本申请通过基于跨数据集信息预先训练的细粒度图像识别神经网络对目标细粒度图像进行识别,因为训练过程学习到了不同数据集之间的正负迁移,也平衡了跨数据集的正负迁移,从而提升了识别精准度。

    一种小样本图像检测方法、系统、介质及设备

    公开(公告)号:CN117237697B

    公开(公告)日:2024-05-17

    申请号:CN202310960507.0

    申请日:2023-08-01

    Abstract: 本公开涉及一种小样本图像检测方法、系统、介质及设备,方法包括:向图像检测模型中输入样本数据并对所述样本数据进行数据增强得到增强后的增强数据;从所述增强数据中利用卷积神经网络提取特征向量;生成用于分类器检测和定位目标的第一区域候选框,对所述第一区域候选框进行降采样得到第二区域候选框并根据所述第二区域候选框的坐标提取出所述特征向量中的特征;利用多层全连接网络对传入的特征进行分类和回归,以得到预测目标的位置和标签;计算图像检测模型的损失并更新图像检测模型的参数。不同于传统的基于候选框的预测方法:单个候选框预测单个实例。针对不同程度的遮挡问题进行算法的优化:在生成候选框之后,为每个候选框预测一组实例。

    图像语义分割模型的训练方法、装置、计算机设备和存储介质

    公开(公告)号:CN117994507A

    公开(公告)日:2024-05-07

    申请号:CN202211629088.4

    申请日:2022-12-19

    Abstract: 本发明涉及一种图像语义分割模型的训练方法方法、装置、计算机设备和存储介质,方法包括:获取训练图像训练集;将训练图像训练集中的训练图像分批次输入待训练图像语义分割模型的编码模块,编码模块输出各批次训练图像的高阶特征;根据当前批次的高阶与当前批次之前的第二预设数量的高阶特征的语义关系对当前批次的高阶进行增强处理;将增强后的当前批次的高阶特征输入待训练图像语义分割模型的解码模块,解码模块输出当前批次的训练图像的语义分割结果;根据语义分割结果,对待训练图像语义分割模型进行训练。上述方法可以提高对测试图像集的测试准确性。

    基于跨层特征挖掘的图像识别方法、装置及电子设备

    公开(公告)号:CN117911755A

    公开(公告)日:2024-04-19

    申请号:CN202311836043.9

    申请日:2023-12-28

    Abstract: 本申请涉及深度学习及计算机视觉识别技术领域,尤其涉及基于跨层特征挖掘的图像识别方法、装置及电子设备。所述方法包括:获取待识别图像,并提取所述待识别图像的全局特征图;对所述待识别图像的全局特征图进行降维映射,得到所述待识别图像不同层次的特征向量;根据所述待识别图像的不同层次特征图构建特征矩阵;基于所述特征矩阵和所述不同层次的特征向量进行多头注意力机制的加权融合操作,以得到跨层特征挖掘后的特征向量;基于所述跨层特征挖掘后的特征向量识别所述待识别图像。本申请通过跨层特征的挖掘实现了图像特征的增强,通过对多粒度的理解,使图像识别取得全面且足够精细的识别效果。

Patent Agency Ranking