-
公开(公告)号:CN117611820A
公开(公告)日:2024-02-27
申请号:CN202311623913.4
申请日:2023-11-30
Applicant: 南昌大学
IPC: G06V10/26 , G06V10/774 , G06V10/764 , G06V10/77 , G06V10/82 , G06N3/045 , G06N3/0495 , G06N3/0895 , G06N3/096
Abstract: 本发明公开了一种基于局部特征对比学习的半监督医学图像分割方法,包括:1)将医学图像数据送入框架中的学生模型,得到相应的预测分割结果和预测SDM,将预测分割结果和预测符号距离图与真实标记分割结果和真实符号距离图进行损失计算;2)利用BC进行局部特征块的分类;3)通过对步骤2)中提取的最后一层特征进行投影得到投影特征,将该投影特征同样切割成n×n个特征块,将预测符号距离图中的n×n个图像块和投影特征中的n×n个特征块一一对应,得到特征块的分类,利用密集局部特征对比学习模块进行对比学习,得到最后的图像分割结果。本发明方法相较传统分割算法能较好的适应边界模糊、对比度低的情况,分割效果优于其他算法。
-
公开(公告)号:CN119903203A
公开(公告)日:2025-04-29
申请号:CN202411890626.4
申请日:2024-12-20
Applicant: 南昌大学
IPC: G06F16/583 , G06F16/532 , G06F16/383 , G06F16/332 , G06V20/68 , G06V10/44 , G06N3/045 , G06N3/0464
Abstract: 本发明涉及人工智能和机器学习的跨学科研究领域,尤其涉及。本发明提供了一种跨模态食品检索方法,重点是在图像编码器与食谱编码器的基础上增加多粒度交互编码器构建TE I框架,将给定的图像‑文本配对数据分别输入到图像编码器与食谱编码器进行训练学习,图像编码器提取全局视觉特征,食谱编码器提取层次化特征并使用线性层获得全局食谱特征,多粒度交互编码器提取多粒度特征,所述层次化特征与多粒度特征计算成对的自注意力并取平均值得多粒度交互特征,基于层次化语义对齐损失函数对齐两种模态之间的相关性。目的是探索图像和文本模态之间的多粒度互动相关性,以提高跨模态检索性能。
-
公开(公告)号:CN110502995A
公开(公告)日:2019-11-26
申请号:CN201910658690.2
申请日:2019-07-19
Applicant: 南昌大学
IPC: G06K9/00
Abstract: 本发明提供了基于细微面部动作识别的驾驶员打哈欠检测方法,包括以下步骤:步骤1,对车载摄像机捕捉到的驾驶员驾驶视频进行预处理,进行人脸检测和分割,图像大小归一化和去噪;步骤2,提出关键帧提取算法,通过图片直方图相似度阈值筛选以及离群相似度图片剔除相结合的方法,来提取细微动作序列中的关键帧;步骤3,根据选择的关键帧,建立具有低时间采样率的3D深度学习网络(3D-LTS)以检测各种打哈欠行为,本发明通过关键帧提取算法提取细微动作的关键帧,然后通过建立的3D-LTS网络,提取时空特征和检测各种面部细微动作;在识别率和整体性能方面优于现有方法,能有效区分打哈欠和其他面部细微动作,有效降低了驾驶员打哈欠行为的误检率。
-
公开(公告)号:CN119170259A
公开(公告)日:2024-12-20
申请号:CN202411667231.8
申请日:2024-11-21
Applicant: 南昌大学第一附属医院
Abstract: 本发明涉及数据处理领域,特别提出一种老年人智能化慢病风险动态评估方法及系统,通过预设风险评估规则,对目标老年人个体的基础理化指标数据进行风险评估,以即时动态化的计算老年人目标个体的基础风险评估分数,以评分导向的角度对多个慢病类型进行评估,以提高整体的评估效率,再通过预设键值对匹配规则,对目标老年人个体的综合风险指标数据进行风险评估,以从结果导向的角度进行综合评估,避免了单一导向评估的局限性,再对比不同导向进行加权精修,以进一步地提高整体评估的准确性,本发明极大地提高了慢病风险动态评估方法的效率和准确性。
-
公开(公告)号:CN119152091A
公开(公告)日:2024-12-17
申请号:CN202411259668.8
申请日:2024-09-10
Applicant: 江西果康信息科技有限公司 , 南昌大学第一附属医院
Abstract: 本申请涉及计算机技术领域,特别是虚拟数字人、增强现实、虚拟现实、混合现实、扩展现实等技术领域,提供了一种自动化处理数字人资产的方案。该方法包括数字人资产的结构识别、自动渲染Shader匹配和口型匹配。结构识别通过正则匹配识别数字人的结构文件,包括网格结构和面部BlendShape结构。自动渲染Shader匹配根据数字人资产的不同部位适配不同的Shader,例如皮肤结构适配SSS Shader,头发结构适配双面透明Shader等。口型匹配通过识别嘴唇的关键BlendShape键值,自动为数字人资产匹配驱动程序可识别的标准口型数据。
-
公开(公告)号:CN119446463A
公开(公告)日:2025-02-14
申请号:CN202411612850.7
申请日:2024-11-13
Applicant: 江西果康信息科技有限公司 , 南昌大学第一附属医院
Abstract: 本申请公开了一种针对老年人院内智能就诊辅助系统,该系统由用户管理平台和设备终端两部分组成。所述设备终端具备以下功能:就诊人员通过扫描就诊码快速绑定设备终端,之后根据显示屏上的文字和语音引导完成就诊。期间设备终端将采集到就诊人员的心率、血氧、站立姿势、位置信息数据上传至用户管理平台。在紧急情况下设备终端将自动向用户管理平台发送紧急求助提醒。所述用户管理平台具备以下功能:在网络环境下与设备终端连接,实时获取就诊人员的设备终端上传的数据。当收到异常数据,会自动提醒医护人员处理。同时,平台进行实时文字和语音引导,协助就诊人员完成就诊。
-
公开(公告)号:CN110502995B
公开(公告)日:2023-03-14
申请号:CN201910658690.2
申请日:2019-07-19
Applicant: 南昌大学
Abstract: 本发明提供了基于细微面部动作识别的驾驶员打哈欠检测方法,包括以下步骤:步骤1,对车载摄像机捕捉到的驾驶员驾驶视频进行预处理,进行人脸检测和分割,图像大小归一化和去噪;步骤2,提出关键帧提取算法,通过图片直方图相似度阈值筛选以及离群相似度图片剔除相结合的方法,来提取细微动作序列中的关键帧;步骤3,根据选择的关键帧,建立具有低时间采样率的3D深度学习网络(3D‑LTS)以检测各种打哈欠行为,本发明通过关键帧提取算法提取细微动作的关键帧,然后通过建立的3D‑LTS网络,提取时空特征和检测各种面部细微动作;在识别率和整体性能方面优于现有方法,能有效区分打哈欠和其他面部细微动作,有效降低了驾驶员打哈欠行为的误检率。
-
公开(公告)号:CN111445548B
公开(公告)日:2022-08-09
申请号:CN202010204022.5
申请日:2020-03-21
Applicant: 南昌大学
Abstract: 本发明提供了一种基于非配对图像的多视角人脸图像生成方法,包括以下步骤:步骤A:训练时,编码器E将输入的人脸图像映射为身份表示z和视角表示判别器Dz迫使z服从均匀分布,判别器Dv迫使服从范畴分布;步骤B:使用半监督学习,通过最小化真实视角标签v和对应预测的视角标签的交叉熵,使视角表示更加准确;步骤C:生成器G利用和z重建图像,重建图像与真实图像分别与连接后输入判别器Dimg进行相似性判断;步骤D:测试时,使用训练好的编码器解开身份表示和视角表示,将多个代表视角的one‑hot向量分别强加给身份表示,输入训练好的生成器生成多视角图像,本发明在使用极少量视角标签的情况下,生成了清晰真实的多视角人脸图像。
-
公开(公告)号:CN111445548A
公开(公告)日:2020-07-24
申请号:CN202010204022.5
申请日:2020-03-21
Applicant: 南昌大学
Abstract: 本发明提供了一种基于非配对图像的多视角人脸图像生成方法,包括以下步骤:步骤A:训练时,编码器E将输入的人脸图像映射为身份表示z和视角表示判别器Dz迫使z服从均匀分布,判别器Dv迫使服从范畴分布;步骤B:使用半监督学习,通过最小化真实视角标签v和对应预测的视角标签的交叉熵,使视角表示更加准确;步骤C:生成器G利用和z重建图像,重建图像与真实图像分别与连接后输入判别器Dimg进行相似性判断;步骤D:测试时,使用训练好的编码器解开身份表示和视角表示,将多个代表视角的one-hot向量分别强加给身份表示,输入训练好的生成器生成多视角图像,本发明在使用极少量视角标签的情况下,生成了清晰真实的多视角人脸图像。
-
公开(公告)号:CN110110602A
公开(公告)日:2019-08-09
申请号:CN201910282569.4
申请日:2019-04-09
Applicant: 南昌大学
Abstract: 本发明提供了一种基于三维残差神经网络和视频序列的动态手语识别方法,所述方法提出了基于三维残差神经网络的新模型B3D ResNet,包括以下步骤:步骤1,在视频帧中,采用Faster R-CNN模型检测手的位置,并从背景中分割出手;步骤2,利用B3D ResNet模型对输入的视频序列进行手势的时空特征提取和特征序列分析;步骤3,通过对输入的视频序列进行分类,可以识别手势,有效地实现动态手语识别。本发明通过分析视频序列的时空特征,可以提取有效的动态手势时空特征序列,从而达到识别不同手势的目的,并且在复杂或类似的手语识别上也获得了良好的性能。通过测试数据集的实验结果表明,本发明可以准确有效地区分不同的手语,以及相似的手势对。
-
-
-
-
-
-
-
-
-