-
公开(公告)号:CN114529516B
公开(公告)日:2024-09-24
申请号:CN202210050130.0
申请日:2022-01-17
Applicant: 重庆邮电大学
IPC: G06T7/00 , G06T7/11 , G16H30/20 , G16H50/30 , G06N3/0464 , G06V10/80 , G06V10/764 , G06V10/82 , G06V10/26
Abstract: 本发明请求保护一种基于多注意力与多任务特征融合的肺结节检测与分类方法,其包括以下步骤:原始CT图像进行预处理;在特征提取网络中引入可以融合空间语义特征和通道特征的空间注意力和通道注意力,在尾部加入带有自注意力的SPCS构建具有双路径连结的残差网络用于提取多尺度下的特征,并以特征金字塔网络融合特征;构建检测与分割任务多个分支;分割分支输出多尺度掩码并聚合结果,检测分支以路径聚合网络再次融合特征并输出检测结果;最后统一两任务分支结果作为总的检测输出——具有较高精度和灵敏度;根据检测结果,基于结节位置进行裁剪,通过良恶性和癌性风险等级分类网络完成肺结节的良恶性区分和患癌风险等级的预测,从而辅助医生进行疾病诊断。
-
公开(公告)号:CN117557697A
公开(公告)日:2024-02-13
申请号:CN202311554757.0
申请日:2023-11-21
Applicant: 重庆邮电大学
IPC: G06T13/40 , G06T13/20 , G06V20/40 , G06V40/16 , G06V10/74 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/094
Abstract: 本发明涉及一种基于情感调控对抗网络的虚拟教师人脸视频生成方法,属于人工智能领域。该方法包括:获取人物视频数据集并对该数据集预处理,分为训练数据集、验证数据集和测试数据集;采用音频编码器和噪声编码器从视频数据集中提取音频特征;采用面部编码器根据人脸图像提取面部特征;将音频特征和面部特征输入视频解码器,并以情感标签为调控条件,通过跳转连接生成音频与口型同步且表达指定情感的虚拟教师人脸视频;在视频解码器的输出部分加入校准网络,增强虚拟教师人脸的面部细节;视频解码器的输出通过鉴别器调整,得到虚拟教师人脸视频。本发明可提高生成视频的视听一致性,优化生成面部特征细节,且允许独立控制生成的视觉信号的情感。
-
公开(公告)号:CN110310281B
公开(公告)日:2023-03-03
申请号:CN201910621976.3
申请日:2019-07-10
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于Mask‑RCNN深度学习的虚拟医疗中肺结节检测与分割方法,属于图像处理领域。该方法具体包括:S1建立训练样本:首先对三维肺部CT图像样本进行预处理,然后将肺结节的横截面、矢状面和冠状面合成一张三通道图片,获得训练样本集,最后采用数据增强的方法扩展样本集;S2建立肺结节分割网络;包括建立骨干网络、特征金字塔网络、区域生成网络、ROI生成与对齐网络,以及三个功能分支;S3训练肺结节分割网络:利用训练样本对肺结节分割网络进行训练,获得肺结节分割装置;S4虚拟医疗环境中重建肺结节和肺部三维图,实现肺结节的检测。本发明能够在不花费更多资源的情况下提高模型的准确率,实现实时交互。
-
公开(公告)号:CN107491726B
公开(公告)日:2020-08-04
申请号:CN201710537921.5
申请日:2017-07-04
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于多通道并行卷积神经网络的实时表情识别方法,包括以下步骤:从面部表情数据集中提取包含RGB与Depth图像的表情数据;对彩色图像进行局部二值化及提取面部关键点预处理,对深度图像进行梯度化预处理,将预处理后的图像分为训练集与测试集两部分并构建多通道并行卷积神经网络;将训练集中预处理后的图像送入网络中训练,获得学习了面部表情轮廓、立体分布及关键点特征的深度通道、lbp通道及关键点通道识别模型;将三种识别模型的分类结果采用最大置信融合,得到最终表情识别模型并构建实时表情识别系统。本发明增强了识别网络的鲁棒性,有效提升了实时表情识别系统的性能。
-
公开(公告)号:CN105930770B
公开(公告)日:2019-04-09
申请号:CN201610226853.6
申请日:2016-04-13
Applicant: 重庆邮电大学
IPC: G06K9/00
Abstract: 本发明请求保护一种基于高斯过程隐变量模型和隐条件随机场的判别式人体动作识别方法,主要包括以下三个部分:在获取运动数据方面,通过动作捕捉技术或Kinect体感技术获取人体的骨骼结构和运动信息;在提取运动特征方面,采用加入动态过程和稀疏近似的高斯过程隐变量模型来得到高维运动信息在低维隐空间中的流行结构,以表示运动特征;在人体动作识别方面,利用判别式的隐条件随机场对时序运动数据的特征进行建模,并对动作进行分类。本发明不仅可以实现人体运动特征的可视化,还可以有效利用运动时序数据之间的信息,对人体运动进行高精度识别,适用于人体动作的实时识别领域。
-
公开(公告)号:CN107194425A
公开(公告)日:2017-09-22
申请号:CN201710364512.X
申请日:2017-05-22
Applicant: 重庆邮电大学
CPC classification number: G06K9/6221 , G06N3/006
Abstract: 本发明涉及一种基于多点张力模型的快速聚类方法,属于聚类分析技术领域。初始阶段,从UCI数据集库中选取某个数据集,判断当前蜜蜂是否是引领蜂;根据算子找到更好的解,使算法跳出局部最优;判断是否所有蜜蜂均完成搜索活动,所有蜜蜂均完成搜索活动后,评估当前所有蜜源的适应度,并记录当前最好的解;判断算法是否满足终止条件,当算法满足终止条件时,输出最优解,算法终止。本发明在局部搜索阶段,结合遗传算法中的交叉算子和变异算子提高了算法收敛速度和解的多样性,适用于不同规模、多种类型的数据集,具有较强的伸缩性和健壮性。
-
公开(公告)号:CN119761482A
公开(公告)日:2025-04-04
申请号:CN202411935809.3
申请日:2024-12-26
Applicant: 重庆邮电大学
IPC: G06N5/022 , G06N5/04 , G06Q50/20 , G06F16/353 , G06T13/40 , G06N3/045 , G06N3/047 , G06T13/20 , G10L13/027 , G10L15/26
Abstract: 本发明涉及一种教育大模型融合知识图谱驱动的虚拟教师交互方法及系统,属于人工智能、智慧教育领域。本发明通过数据集、问答模型的构建;功能交互的应用;虚拟教师及场景的驱动,实现了虚拟学习环境的自然交互。其中,问答模型不仅需要数据集为其提供语料数据支持,而且需将语音转化为文本并由学科知识框架进行意图分类及会话管理,再通过教育大模型、学科知识图谱等获得最优反馈,最终以语音形式输出;功能交互包括:通信连接、GUI控制中台及结果交互。负责接收问答模型的反馈信息,以驱动虚拟教师生成类人的姿态动作及教学场景的变换。本发明能够为用户提供沉浸式、个性化的教学体验和便捷的在线答疑服务,以此满足用户多样化的学习需求。
-
公开(公告)号:CN118394884A
公开(公告)日:2024-07-26
申请号:CN202410537241.3
申请日:2024-04-30
Applicant: 重庆邮电大学
IPC: G06F16/33 , G06F16/338 , G06F40/30 , G06Q50/20
Abstract: 本发明涉及一种考虑路径语义信息的可解释学习路径推荐方法,属于教育信息化领域。该方法包括:使用GRU网络通过在路径序列每个时间步更新内部状态,实现路径序列中的节点的依赖关系建模。通过扩展路径序列邻接学习单元构建学习路径子图,利用GCN网络汇聚学习路径中单元的邻域信息,更新节点的表征,再使用Transformer捕获节点的关系语义信息,提取学习路径子图的结构语义信息。通过路径匹配选择器来确定学习路径类型,然后使用熵编码器分析不同的路径类型对于学习者的信息增益,区分路径集合中不同路径类型的最终贡献。加权池化模块则通过联合路径表示、语义增强表征以及学习者表征确定最终的路径表征,通过熵编码器获得权重,得到最终的得分输出。
-
公开(公告)号:CN109614899B
公开(公告)日:2022-07-01
申请号:CN201811446456.5
申请日:2018-11-29
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于李群特征和卷积神经网络的人体动作识别方法,属于计算机模式识别领域。该方法包括:S1:数据获取,利用微软体感设备Kinect提取人体骨骼信息,获取实验者的运动信息;S2:提取李群特征,采取一种利用刚性肢体变换来模拟人体各肢体间的相对三维几何关系的李群骨骼表示方法,将人体动作建模为李群上一系列曲线,进而结合李群和李代数间的对应关系,利用对数映射将基于李群空间的曲线映射为基于李代数空间的曲线;S3:特征分类,融合李群特征和卷积神经网络,利用李群特征训练卷积神经网络,让卷积神经网络对李群特征进行学习、分类,从而实现人体动作识别。本发明能够取得很好的识别效果。
-
公开(公告)号:CN114529516A
公开(公告)日:2022-05-24
申请号:CN202210050130.0
申请日:2022-01-17
Applicant: 重庆邮电大学
IPC: G06T7/00 , G06T7/11 , G16H30/20 , G16H50/30 , G06N3/04 , G06K9/62 , G06V10/80 , G06V10/764 , G06V10/82 , G06V10/26
Abstract: 本发明请求保护一种基于多注意力与多任务特征融合的肺结节检测与分类方法,其包括以下步骤:原始CT图像进行预处理;在特征提取网络中引入可以融合空间语义特征和通道特征的空间注意力和通道注意力,在尾部加入带有自注意力的SPCS构建具有双路径连结的残差网络用于提取多尺度下的特征,并以特征金字塔网络融合特征;构建检测与分割任务多个分支;分割分支输出多尺度掩码并聚合结果,检测分支以路径聚合网络再次融合特征并输出检测结果;最后统一两任务分支结果作为总的检测输出——具有较高精度和灵敏度;根据检测结果,基于结节位置进行裁剪,通过良恶性和癌性风险等级分类网络完成肺结节的良恶性区分和患癌风险等级的预测,从而辅助医生进行疾病诊断。
-
-
-
-
-
-
-
-
-