-
公开(公告)号:CN112150484B
公开(公告)日:2024-04-19
申请号:CN202011038459.2
申请日:2020-09-28
Applicant: 华侨大学
IPC: G06T7/11 , G06T7/90 , G06V10/762
Abstract: 本发明公开了一种超像素的狄利克雷混合模型图像分割方法、装置及设备,方法包括:读取待分割的图像,利用超像素分割算法将所述图像分割为多个超像素块,并记录下每个像素点所属的超像素块、每个超像素块的位置中心以及颜色均值信息;提取每个超像素块的邻域信息;对所有超像素块的颜色做归一化处理,并初始化分割类别个数和聚类中心;将归一化处理后的超像素块作为输入,利用k‑means聚类对狄利克雷混合模型的聚类中心和后验概率做初始化;初始化狄利克雷混合模型的超参数,将以超像素块为基本处理单位的处理向量放入初始化后的狄利克雷混合模型中进行无监督迭代分割计算,直到达到预设的迭代终止条件后,输出分割结果图。本发明能提高图像分割的速度。
-
公开(公告)号:CN112699835B
公开(公告)日:2023-09-26
申请号:CN202110038614.9
申请日:2021-01-12
Applicant: 华侨大学
IPC: G06V20/10 , G06V20/13 , G06V10/82 , G06V10/774 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明提供一种基于重建偏重U‑Net的道路提取方法、装置、设备和存储介质,方法包括:获取训练集和验证集;构建U‑Net神经网络模型,其中U‑Net神经网络模型包括编码器和解码器,所述编码器包括五个卷积模块,所述解码器包括四个上采样重建层;将所述训练集输入U‑Net神经网络模型进行训练,并保存所述网络模型的参数,以获得初始U‑Net神经网络模型;将所述验证集输入初始U‑Net神经网络模型并结合损失函数训练,直至模型收敛,以获得训练好的U‑Net神经网络模型。将待检测图像输入训练好的U‑Net神经网络模型,获取道路提取结果。本发明的道路提取U‑Net神经网络模型,能有效增强网络的重建能力,使得网络对于遮挡等信息,具备更好的逻辑推理能力,能取得更好的分割精度和鲁棒性。
-
公开(公告)号:CN109192200B
公开(公告)日:2023-06-13
申请号:CN201810514662.9
申请日:2018-05-25
Applicant: 华侨大学
Abstract: 本发明涉及一种语音识别方法,其包括所述语音识别方法包括输入语音信号,使用梅尔频率倒谱系数MFCC提取语音信号的特征向量;将提取的MFCC特征向量输入到狄利克雷分布混合模型中计算观测概率,其中使用变分推断更新优化模型参数;将所述MFCC特征向量和所述观测概率输入隐马尔科夫模型HMM,使用隐马尔科夫模型对语音信号时间序列结构进行建模;根据所述语音信号中的隐马尔科夫模型HMM的观测序列概率,判断并提取词语。本发明在现有高斯混合隐马尔科夫模型的方法基础上,提出使用狄利克雷混合模型来对隐马尔科夫混合模型的观测概率来进行建模,同时使用变分推断实现模型参数的求解,谋求模型鲁棒性和提高准确率。
-
公开(公告)号:CN110717431B
公开(公告)日:2023-03-24
申请号:CN201910927585.4
申请日:2019-09-27
Applicant: 华侨大学
IPC: G06V20/10 , G06V10/25 , G06V10/82 , G06F16/332 , G06F16/58 , G06F16/583 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明涉及一种结合多视角注意力机制的细粒度视觉问答方法,充分考虑到问题具体语义的导向作用,提出一种多视角注意力模型,能够有效选择出与当前任务目标(问题)相关的多个显著目标区域,从多个视角学习获取图像和问题文本中与答案有关的区域信息,提取出问题语义引导下的图像中的区域显著性特征,具有更细粒度的特征表达,并对图像中存在多个重要语义表达区域的情况表现,具有较强的刻画能力,增加了多视角注意力模型的有效性和全面性,从而有效加强图像区域显著特征和问题特征的语义关联性,以提升视觉问答的语义理解的准确性和全面性。采用本发明所述的方法进行视觉问答任务,步骤简单、效率高、准确率高,完全可以用于商业,市场前景较佳。
-
公开(公告)号:CN111611389B
公开(公告)日:2022-05-27
申请号:CN202010499191.6
申请日:2020-06-04
Applicant: 华侨大学
IPC: G06F16/35 , G06F40/216 , G06K9/62
Abstract: 本发明公开了一种基于非参数VMF混合模型的文本数据聚类方法、装置及设备,方法包括:S101,获取待聚类的文本数据集;其中,所述文本数据集包括多个文本,每个文本用词频‑逆文本频率指数标准化方法表示为D维的文本向量特征;S102,使用基于Pitman‑Yor过程的非参数VMF混合模型对每个文本进行建模;S103,通过变分贝叶斯推断算法估算所述非参数VMF混合模型的模型参数;S104,根据推断的所述模型参数,判断所述非参数VMF混合模型是否收敛;若否,则返回步骤S103,若是,则执行步骤S105;S105,根据指示因子的后验概率判断每个文本的所属类别,从而根据所属类别对所述文本进行聚类。本发明能够确保算法收敛并且可以有效地检测收敛状态。
-
公开(公告)号:CN112733702A
公开(公告)日:2021-04-30
申请号:CN202110016501.9
申请日:2021-01-07
Applicant: 华侨大学
Abstract: 本发明提供基于遥感图像的人行道检测方法、装置、设备和存储介,方法包括质获取训练集样本,并对训练集样本的道路区域和人行道区域都进行标记;利用道路区域的标记信息训练道路分割提取模型,获得一个训练后的道路分割提取模型;利用训练后的道路分割提取模型进行道路提取,以获得潜在道路提取结果;利用人行道区域的标记信息训练深度卷积神经网络模型,获得一个训练后的深度卷积神经网络模型;利用训练后的深度卷积神经网络模型进行人行道的检测,以获得初次人行道检测结果;利用混合分类的算法,融合潜在道路提取结果和初次人行道检测结果,以获得最终的人行道检测结果。本发明考虑到人行道和道路之间的相互依存关系,提高人行道检测精度。
-
公开(公告)号:CN111860547A
公开(公告)日:2020-10-30
申请号:CN202010794337.X
申请日:2020-08-10
Applicant: 华侨大学
Abstract: 本发明提供一种基于稀疏表示的图像分割方法、装置、设备及存储介质,方法包括:收集一定数量的图像及其分割标记,然后用狄利克雷混合模型对其进行无监督分割,并调整其参数,获得每张图像最优参数,组成最优参数列表,然后将每张图像转换为灰度图,提取它们的灰度直方图特征,训练生成一个稀疏表示字典,提取待分割的图像的灰度直方图特征,计算它的稀疏系数,根据得到的稀疏系数,从稀疏表示字典获取与其最接近的图像,从最优参数列表中获取近似图像的最优参数,并用最优参数进行赋值,利用赋值好的参数对待分割图像进行无监督图像分割,得到分割结果。本发明狄利克雷混合模型的优化参数不需要人工调整,而是经过稀疏表示预测后自动生成。
-
公开(公告)号:CN111611389A
公开(公告)日:2020-09-01
申请号:CN202010499191.6
申请日:2020-06-04
Applicant: 华侨大学
IPC: G06F16/35 , G06F40/216 , G06K9/62
Abstract: 本发明公开了一种基于非参数VMF混合模型的文本数据聚类方法、装置及设备,方法包括:S101,获取待聚类的文本数据集;其中,所述文本数据集包括多个文本,每个文本用词频-逆文本频率指数标准化方法表示为D维的文本向量特征;S102,使用基于Pitman-Yor过程的非参数VMF混合模型对每个文本进行建模;S103,通过变分贝叶斯推断算法估算所述非参数VMF混合模型的模型参数;S104,根据推断的所述模型参数,判断所述非参数VMF混合模型是否收敛;若否,则返回步骤S103,若是,则执行步骤S105;S105,根据指示因子的后验概率判断每个文本的所属类别,从而根据所属类别对所述文本进行聚类。本发明能够确保算法收敛并且可以有效地检测收敛状态。
-
公开(公告)号:CN106504254A
公开(公告)日:2017-03-15
申请号:CN201610903015.8
申请日:2016-10-17
Applicant: 华侨大学
IPC: G06T7/11
Abstract: 本发明公开了一种基于空间混合模型的颅脑磁共振图像分割方法,包括:对输入的颅脑磁共振图像进行预处理,得到剔除非脑部组织后的图像;将预处理后的图像数据转换成行向量作为输入向量;对向量化后的图像数据利用基于空间关系的Inverted Dirichlet混合模型进行建模,并采用k-means方法进行模型的初始化;采用贝叶斯变分推导技术估算混合模型的相关参数;通过计算后验概率从而确定各个像素点的所属类别,并得到新的标签向量;将标签向量作为输出向量并转换成灰度矩阵,从而得到最终的分割结果。本发明的技术方案对颅脑磁共振图像的分割效果出色、鲁棒性强,能够提高医学影像诊断的准确性。
-
公开(公告)号:CN105956571A
公开(公告)日:2016-09-21
申请号:CN201610317460.6
申请日:2016-05-13
Applicant: 华侨大学
IPC: G06K9/00
CPC classification number: G06K9/00221 , G06K9/00268 , G06K2009/00322
Abstract: 本发明的一种人脸图像的年龄估计方法,该方法包括五个部分:(1)图像的分块;(2)用PCA算法学习分块处理后的矩阵得到卷积操作的卷积核;(3)然后用PCA算法学习得到的卷积核进行卷积操作;(4)用二值化的方式在第二个卷积层后面进行非线性处理;(5)用直方图统计的方法进行特征抽取。该方法提取特征后用非线性支持向量回归K‑SVR(Kernel function Support Vector Regression)来估计年龄值,经过实验表明可以大大提高年龄估计的准确率。
-
-
-
-
-
-
-
-
-