-
公开(公告)号:CN112381017A
公开(公告)日:2021-02-19
申请号:CN202011302398.6
申请日:2020-11-19
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于感知级联上下文的车辆重识别方法,包括以下步骤:构造车辆图像的特征提取模型,基础网络使用预训练的ResNet‑50分类网络;将基于感知级联上下文的注意力增强模块嵌入到特征提取模型中;输入车辆图像数据集,对构建好的特征提取模型进行训练;采用已训练的特征提取模型进行车辆重识别任务。本发明通过在车辆图像的特征提取模型中嵌入基于感知级联上下文的注意力增强模块,能够提取出车辆图像中更丰富、更具区分度的特征信息,从而提高了重识别任务的准确率;并且仅仅需要车辆ID一项标签信息作为监督信号进行模型训练,不依赖于任何细粒度的标签信息(如车牌、车型、颜色等)。
-
公开(公告)号:CN108764269A
公开(公告)日:2018-11-06
申请号:CN201810286137.6
申请日:2018-04-03
Applicant: 华南理工大学
CPC classification number: G06K9/6268 , G06K9/6215 , G06N3/0454
Abstract: 本发明公开了一种基于时空约束增量学习的跨数据集行人再识别方法,包含步骤:S1、在小规模训练数据集上训练得到图像分类器Cs;S2、用图像分类器Cs在实际应用场景的测试数据集上对监控图像进行分类,统计测试数据集中属于同一行人的监控图像的拍摄时间和摄像头编号之间的关联,建立行人时空概率模型;S3、融合步骤S2的图像分类结果和步骤S3的时空概率模型,对测试数据集进行更准确分类;S4、对应用场景的测试数据打标签,用这种有标签的数据增量训练图像分类器Cs;S5、重复步骤S1~S4,直到迭代的次数超过预定的阈值常数;S6、用步骤S5的融合分类器,在目标数据集的测试集上进行行人再识别,得到最终分类结果。
-
-
公开(公告)号:CN105631051A
公开(公告)日:2016-06-01
申请号:CN201610111436.7
申请日:2016-02-29
Applicant: 华南理工大学
CPC classification number: G06F17/30864 , G06F17/2785 , G06K9/00 , G06K2209/01
Abstract: 本发明公开了一种基于文字识别的移动增强现实阅读方法,包括以下步骤:1、移动设备获取所拍摄到的包含文字的原始图像;2、移动设备对所获得到的原始图像进行预处理,并上传到服务器;3、服务器获得文字集合以及各个文字在图像中的位置信息;4、服务器获得关键字集合以及各个关键字的位置信息;5、对于每个关键字,服务器在知识库中检索与其相关的多媒体资源,并将相应的结果回传给移动设备;6、移动终端针对每组接受到的结果,将多媒体资源精确叠加在原始图像上。本发明还公开了一种实现基于文字识别的移动增强现实阅读方法的阅读系统,包括:手机端和服务器端;手机端和服务器端通过互联网进行通信。具有服务器的存储代价较小等优点。
-
公开(公告)号:CN103401894B
公开(公告)日:2016-05-04
申请号:CN201310292229.2
申请日:2013-07-11
Applicant: 华南理工大学
Abstract: 本发明公开了一种B/S架构的流媒体DRM云服务系统及实现方法。系统包括:客户端、资源服务接口、虚拟机和计算机集群;所述客户端,是媒体资源请求者请求资源的工具;所述资源服务接口,处于云服务端,处理来自媒体提供者、媒体文件请求者或后台管理者的操作请求;虚拟机,云服务端有服务请求,为资源服务接口提供了运行环境的支撑;本发明新的DRM体系结构不但简化了客户端使用户使用起来更方便,不必局限于某一特定的播放器客户端,而且有利于具备自主知识产权的DRM系统的应用;媒体文件的加解密的效率获得提升;由于将服务端放在了云服务器上,系统用户不必重复搭建基础设备、计算平台和运行环境,而且使系统更为健壮而安全。
-
公开(公告)号:CN112561474B
公开(公告)日:2024-04-30
申请号:CN202011468425.7
申请日:2020-12-14
Applicant: 华南理工大学
IPC: G06Q10/1053 , G10L15/22 , G06F40/284 , G06F18/25 , G06N3/0442 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种基于多源数据融合的智能人格特性评价方法,步骤包括:收集网络用户的演讲视频数据;将演讲视频数据转成演讲文本;进行用户人格特性标注;对获取到的演讲文本进行词频统计并排序;对于每种人格特性,心理专业人员将筛选出最能代表该特性的关键词,形成关键词表;对演讲文本进行处理并形成词嵌入向量特征;将词嵌入向量特征输入到多源数据融合模型中进行融合,最终输出人格特性预测结果。由于结合了专业人员的先验知识,本发明提出的智能人格特性评价方法有较好的可解释性,能在小样本上取得更加准确的预测结果,对演讲用户的人格特性进行自动预测。
-
公开(公告)号:CN117038055B
公开(公告)日:2024-04-02
申请号:CN202310822147.8
申请日:2023-07-05
Applicant: 广州市妇女儿童医疗中心 , 华南理工大学
IPC: G16H50/20 , G06V20/40 , G06V40/16 , G06V10/50 , G06V10/762 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/044 , G06N3/042 , G06N3/045 , G06N3/08 , G10L25/18 , G10L25/24 , G10L25/30
Abstract: 本发明公开了一种基于多专家模型的疼痛评估方法、系统、装置及介质,通过获取目标对象疼痛时期的视频数据;对视频数据进行抽帧提取,通过预处理得到多模态输入数据序列;将多模态输入数据序列输入预设神经网络,并进行初步预训练,得到各个模态的预训练模型;通过各模态预训练模型,对多模态输入数据序列中对应模态的数据进行分析,获得各模态的特征空间;在特征空间下对训练数据进行聚类,获得若干聚类结果;基于预训练模型设置专家模型,以聚类结果作为各专家的训练样本,进行多专家训练,获得目标评估模型;通过目标评估模型对待评估数据序列进行分析,并通过加权求和,得到目标疼痛分数。本发明能够提升疼痛识别的准确性,可广泛应用于数据处理技术领域。
-
公开(公告)号:CN112507901A
公开(公告)日:2021-03-16
申请号:CN202011472231.4
申请日:2020-12-14
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于伪标签自纠正的无监督行人重识别方法,该方法包括:构建源域数据集、目标域数据集和目标域测试集,构建算法模型M,使用源域数据集对算法模型M进行预训练,使用算法模型M对目标域数据集提取第一目标特征,融合第一目标特征得到第二目标特征,使用第二目标特征进行聚类得到伪标签,对伪标签的质量进行评估并对质量差的聚簇进行纠正,将得到的结果作为伪标签重复训练算法模型M,使用算法模型M对目标域测试集提取第二目标特征并进行图像匹配,得到行人重识别结果。
-
公开(公告)号:CN112380461A
公开(公告)日:2021-02-19
申请号:CN202011308869.4
申请日:2020-11-20
Applicant: 华南理工大学
IPC: G06F16/9537 , G06K9/00 , G06K9/46 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种基于GPS轨迹的行人检索方法,包括以下步骤:收集行人在行走过程中的多模态信息;将收集到的GPS信息在地图上描绘成轨迹并根据轨迹的时空信息搜索附近的候选行人图像;利用ResNet‑50模型对候选行人图像进行特征抽取,再利用聚类算法对候选行人特征进行行人聚类,聚成不同行人聚簇;将每个行人聚簇根据行人图像的时空信息在地图上进行轨迹描绘,计算行人轨迹与GPS轨迹的距离,筛选出最符合的一条轨迹,进而确定了GPS轨迹对应的目标行人,最终达到GPS轨迹检索行人的目的。
-
公开(公告)号:CN110570613A
公开(公告)日:2019-12-13
申请号:CN201910879764.5
申请日:2019-09-18
Applicant: 广州亓行智能科技有限公司 , 华南理工大学
Abstract: 本发明公开了基于分布式光纤系统的围栏振动入侵定位和模式识别方法,在围栏上布置分布式光纤,获取围栏的振动信号,并保存振动数据;将围栏上所有探测点的振动数据累加为时间-空间二维矩阵A(x,t),利用Sobel算子对二维时空矩阵进行滤波,统计滤波后每一探测点位置在该时段内超过设定阈值M的次数,若该探测点超过设定阈值M的次数大于设定阈值N,则将该探测点作为可疑入侵点,保存所有可以入侵点的原始振动信号;对所有可疑入侵点的原始振动信号分别获取其小波时频图;可疑入侵点缩放后的小波时频图输入事先利用已知事件数据预训练好的卷积神经网络,本发明能够准确地识别出入侵事件的位置坐标及事件类型,同时满足实时性较好的要求。
-
-
-
-
-
-
-
-
-