-
公开(公告)号:CN108509534A
公开(公告)日:2018-09-07
申请号:CN201810213304.4
申请日:2018-03-15
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度学习的个性化音乐推荐系统及其实现方法,该系统包括用户听歌记录系统、歌曲召回模型、以及深度神经网络(DNN)过滤模型;所述用户听歌记录系统给每位用户分配一个全局唯一的账号,用于记录用户信息以及用户操作记录;所述歌曲召回模型根据用户听歌记录从海量的歌曲库中筛选出用户可能感兴趣的歌曲组;所述深度神经网络(DNN)过滤模型的训练和测试依赖于用户听歌记录系统,训练完成的深度神经网络用于过滤所述歌曲召回模型推荐出来的歌曲组,经过深度神经网络过滤模型过滤排序之后最终生成推荐给用户的歌曲组合。本发明的系统及方法能够过滤用户不感兴趣的歌曲,减少计算量以及计算资源,做到实时的精准推荐。
-
公开(公告)号:CN108388900A
公开(公告)日:2018-08-10
申请号:CN201810110287.1
申请日:2018-02-05
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于多特征融合和时空注意力机制相结合的视频描述方法,首先对待描述视频提取多种基于卷积神经网络的特征,包括物体、场景、行为动作以及光流等特征,并将这些特征融合拼接成一个特征向量,然后基于时空注意力机制的双向长短时记忆网络确定视频的语义编码表达,最后输入到单向长短时记忆网络模型进行特征解码,从而获得与所述视频对应的自然语言描述句子。本发明对待描述视频分别提取了物体、场景以及运动特征,表征了视频的对象信息与对象之间的关系以及运动信息,同时考虑到视频在空间维度和时间维度上的变化,利用3D卷积特征进一步捕捉到视频流的运动信息。
-
公开(公告)号:CN107122701A
公开(公告)日:2017-09-01
申请号:CN201710122736.X
申请日:2017-03-03
Applicant: 华南理工大学
CPC classification number: G06K9/00818 , G06N3/061 , G06N3/08
Abstract: 本发明公开了一种基于图像显著性和深度学习的交通道路标志识别方法。所述方法首先由卷积神经网络(CNN)生成一个网络(Alexnet),然后通过从ImageNet数据集中获取交通道路标志图片,对训练图片进行归一化预处理之后输入网络,然后训练AlexNet网络。再将测试图片进行RC显著性提取之后输入训练好的Alexnet卷积神经网络,进行交通道路标志的测试分类。本发明结合了图像显著性高效提取显著区域和深度学习在图片识别中的优势,达到对交通道路标志图片进行精准分类的目的。
-
公开(公告)号:CN104574366B
公开(公告)日:2017-08-25
申请号:CN201410799464.3
申请日:2014-12-18
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于单目深度图的视觉显著性区域的提取方法,包含以下顺序的步骤:对原图像进行分割得到各个超像素;建立每个超像素的特征向量,即估算图像中场景的绝对深度的绝对深度特征;利用高斯‑马尔可夫随机场模型建立概率模型,通过概率模型计算超像素特征向量与相邻超像素特征向量之间的距离关系,在所述的绝对深度特征的基础上得到了相对深度特征,同时得到超像素的深度值及深度图;计算超像素的显著值;由所述深度值计算出增益系数,利用增益系数修正所述显著值。本发明的提取方法,在无任何先验知识的前提下,能快速准确地自动识别图像中的显著性物体,且普适性好,显著性区域检测准确。
-
公开(公告)号:CN106650813A
公开(公告)日:2017-05-10
申请号:CN201611226528.6
申请日:2016-12-27
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度残差网络和LSTM的图像理解方法。所述方法首先构建一个深度残差网络模型提取图像的抽象特征并保存为特征矩阵;然后LSTM模型中的动态注意机制根据特征矩阵动态地生成合适的特征向量,最后LSTM模型根据特征向量生成成自然语言(英语)。本发明利用了深度残差网络在图像特征提取和LSTM对时序序列建模方面的优势,深度残差网络和LSTM模型成了一个编码‑解码框架,将图像内容信息转化成自然语言,达到提取图像的深层次信息的目的。
-
公开(公告)号:CN110020710B
公开(公告)日:2023-10-27
申请号:CN201910177140.9
申请日:2019-03-08
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于人工蜂群算法的射束方向及权重多目标优化方法。该方法包括:下载三维CT图像数据集;通过图像处理和解剖结构的三维重建获得三维人体图像;三维人体图像建立之后进入数据输入模块,并把这些数据传输到射束方向及权重多目标优化模型模块中;基于人工蜂群算法对射束方向及权重多目标优化模型模块建立多目标函数;射束方向和权重朝着目标函数的方向同时优化;基于笔形束算法进行剂量计算,模拟剂量分布;输出优化结果,然后实施输出计划。人工蜂群算法是模拟蜜蜂群采蜜过程进行随机优化的一种新型群体智能算法,对于解决复杂的优化问题有良好的效果。
-
公开(公告)号:CN112966073B
公开(公告)日:2023-01-06
申请号:CN202110373418.7
申请日:2021-04-07
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于语义和浅层特征的短文本匹配方法,涉及文本匹配技术领域。本发明包括以下步骤:读取、预处理第一文本和第二文本,获取字信息;利用word2vec模型将所述字信息映射为字特征向量;提取句编码的特征,对所述特征进行归一化处理,获得统计特征向量;将所述字特征向量和所述统计特征向量分别输入到交互特征学习器和统计特征学习器,分别得到解码向量us和rs;将所述交互特征学习器的输出和所述统计特征学习器的输出进行拼接,将拼接结果输入到MLP层进行预测,若输出结果为1,则所述第一文本和第二文本匹配成功。本发明利用多层感知器进一步提炼表示向量信息,可获得优秀文本匹配表现。
-
公开(公告)号:CN108509534B
公开(公告)日:2022-03-25
申请号:CN201810213304.4
申请日:2018-03-15
Applicant: 华南理工大学
IPC: G06F16/635 , G06N3/04
Abstract: 本发明公开了一种基于深度学习的个性化音乐推荐系统及其实现方法,该系统包括用户听歌记录系统、歌曲召回模型、以及深度神经网络(DNN)过滤模型;所述用户听歌记录系统给每位用户分配一个全局唯一的账号,用于记录用户信息以及用户操作记录;所述歌曲召回模型根据用户听歌记录从海量的歌曲库中筛选出用户可能感兴趣的歌曲组;所述深度神经网络(DNN)过滤模型的训练和测试依赖于用户听歌记录系统,训练完成的深度神经网络用于过滤所述歌曲召回模型推荐出来的歌曲组,经过深度神经网络过滤模型过滤排序之后最终生成推荐给用户的歌曲组合。本发明的系统及方法能够过滤用户不感兴趣的歌曲,减少计算量以及计算资源,做到实时的精准推荐。
-
公开(公告)号:CN107610141B
公开(公告)日:2020-04-03
申请号:CN201710788814.X
申请日:2017-09-05
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度学习的遥感图像语义分割方法中,步骤为:为每种物类目标分配RGB值和灰度值,获取原始遥感图像,选取出物类目标并上色、灰度化以及赋予灰度值处理,得到标签图像,对原始遥感图像进行数据增强以及边缘提取,得到边缘提取后的图像;将原始遥感图像和边缘提取后的图像训练样本对完全卷积神经网络进行训练,得到最佳语义分割网络模型,将测试遥感图像输入最佳语义分割网络模型中,获取到语义分割结果图像;为语义分割结果图像进行上色处理,得到最终语义分割结果图像,根据最终语义分割结果图像中的RGB值获取物类目标。本发明方法具有遥感图像语义分割准确率高以及适用性广的优点。
-
公开(公告)号:CN106650829B
公开(公告)日:2019-07-16
申请号:CN201710003657.7
申请日:2017-01-04
Applicant: 华南理工大学
IPC: G06K9/62
Abstract: 本发明公开了一种图片相似度计算方法,包括:(1)用基于DCT的hash方法分别计算待比较的两个图片的hash值;(2)计算两个hash值之间的汉明距离dis_h;(3)若汉明距离不在设定范围内,直接通过公式计算两图片的相似度;(4)若汉明距离在设定范围内,再用基于径向投影的hash方法计算hash值;(5)计算上一步得到的hash值的皮尔逊相关系数,并结合第二步得到的汉明距离计算两图片的相似度。本发明对图像旋转有一定的鲁棒性、避免伽马校正或颜色直方图被调整带来的影响,提高了图片相似度结果的准确率。
-
-
-
-
-
-
-
-
-