基于人脸视频的心率估计方法及装置

    公开(公告)号:CN114495213A

    公开(公告)日:2022-05-13

    申请号:CN202210027249.6

    申请日:2022-01-11

    Inventor: 谢世朋 陈旺

    Abstract: 本发明公开了一种基于人脸视频的心率估计方法及装置,通过对人脸视频的分析以估计心率值,包括对人脸视频进行预处理得到视频数据集,并分为训练集、验证集和测试集;构建包括ResNet网络和ConvLSTM网络的融合网络,ResNet网络包括瓶颈残差模块,以提高ResNet网络的性能;将训练集输入融合网络并进行训练,得到网络训练模型;将验证集输入网络训练模型进行验证,并通过损失函数计算损失,得到最终网络训练模型;将测试集输入最终网络训练模型,得到心率估计值;跨数据集测试,提高模型的精度。本发明通过在ResNet网络增加瓶颈残差模块,提高了ResNet网络的计算效率,使其能更好的训练深度较大的神经网络;通过融入ConvLSTM网络,能够充分利用全局特征,提高心率估计值的准确度。

    基于语义损失的卫星云图反演雷达数据方法

    公开(公告)号:CN112101449A

    公开(公告)日:2020-12-18

    申请号:CN202010951615.8

    申请日:2020-09-11

    Abstract: 本发明公开了基于语义损失的卫星云图反演雷达数据方法,包括如下:S1、建立数据集;S2、建立网络结构,对数据集进行特征提取,然后根据相应卷积层的特征计算损失;S3、使用训练集对深度卷积神经网络进行迭代训练,训练好后,使用验证集对训练后的模型进行验证,然后保存在验证集上抗模糊损失函数最小的模型;S4、使用测试集对抗模糊损失函数最小的模型进行测试,判断是否符合要求,若不符合,继续进行步骤S3,进行迭代训练,直到测试结果符合要求,输出正式模型;S5、使用正式模型对卫星云图反演雷达数据,输出结果。本发明提出的抗模糊损失函数解决了传统使用像素级损失函数的网络训练图像时会出现模糊现象的问题。

    一种多分辨分析的全局图像分割方法

    公开(公告)号:CN106296668B

    公开(公告)日:2019-07-16

    申请号:CN201610622454.1

    申请日:2016-08-01

    Abstract: 本发明公开了一种多分辨分析的全局图像分割方法,首先,紧支撑小波变换对图像进行分解;然后,将分解后进行重构的系数矩阵作为滤波器;其次,将重构所得的滤波器施加于水平集函数的梯度项,构成新的正则项;接着,基于理想情况下,目标和背景的边界应充分契合,提出一种边界正则项用于保持全局最优的分割结果;最后,利用快速对偶算法将含有多分辨率信息的正则项和边界正则项的变分模型进行最小化,以实现水平集曲线的演化。经医学核磁共振图像分割实验表明,本发明对于狭长拓扑结构比一般活动轮廓模型具有更明显的扑捉能力以及更高效的计算时间。

    一种使用能量函数方法的锥束CT中杯状伪影的校正方法

    公开(公告)号:CN105528771B

    公开(公告)日:2018-09-18

    申请号:CN201610035576.0

    申请日:2016-01-19

    Abstract: 本发明公开了一种使用通过最优化能量函数对锥束CT中杯状伪影进行校正的方法,该方法针对重建后的切片图像,直接面向用户,不对原有锥束CT设备进行任何改动,就可以完成校正工作,能够高效地进行锥束CT的杯状伪影校正的同时还能够提高重建图像的同种物质的CT值均匀性,从而有助于重建图像中,完善的体可视化和基于阈值的可视化技术的发展。该方法应用于锥束CT重建图像(即图像域)校正技术领域。

    一种基于残差学习的CT稀疏重建伪影校正方法及系统

    公开(公告)号:CN107871332A

    公开(公告)日:2018-04-03

    申请号:CN201711097204.1

    申请日:2017-11-09

    Inventor: 谢世朋

    CPC classification number: G06T11/008 G06T5/006 G06T2207/10081

    Abstract: 本发明公开了一种基于残差学习的CT稀疏重建伪影校正方法及系统,首先通过FBP(滤波反投影)方法对CT产生的稀疏投影数据进行重建,重建后的图像带有严重的伪影;然后通过建立残差神经网络结构对伪影的特征进行学习,得到伪影图;最后通过稀疏重建的图与伪影图的做残差,恢复出清晰的CT图像。本发明在稀疏重建的基础上引入了残差学习的卷积神经网络结构框架;同时采用GPU加速,缩短了训练的时间,加速了实验的训练过程,可以在非常低的CT投影角度下实现非常高的CT重建图像质量;从而有效的降低了辐射对人体不必要的伤害。

    一种基于水平集的锥束CT中杯状伪影的校正方法

    公开(公告)号:CN104778667A

    公开(公告)日:2015-07-15

    申请号:CN201510176350.8

    申请日:2015-04-14

    Abstract: 本发明公开了一种基于水平集的锥束CT中杯状伪影的校正方法,该方法应用于锥束CT切片图像校正。该方法能够自适应的进行锥束CT的杯状伪影校正,无需人工干预就可以自动完成校正。该方法不需要重复扫描被测物体;不增加锥束CT系统的复杂度;针对重建后的切片图像,能够直接面向用户,不需要对原有锥束CT的原有设备进行任何改动,就可以完成校正工作,该方法能够高效地进行锥束CT的杯状伪影校正,同时还能够提高图像的对比度。

    一种CBCT图像去伪影方法
    17.
    发明授权

    公开(公告)号:CN114004912B

    公开(公告)日:2025-04-29

    申请号:CN202111313304.X

    申请日:2021-11-08

    Inventor: 谢世朋 严墨

    Abstract: 本发明公开了一种CBCT图像去伪影的方法,该方法基于contextual loss以及特征融合残差网络,首先对输入的带伪影的CBCT图像和CT图像进行特征提取,得到特征图谱;将得到的特征图经过改进的以contextual loss为损失函数的特征融合残差网络训练,学习CBCT与CT图像之间的结构相似性,以CT图像作为标签,使得CBCT图像能够去除掉伪影但保持其结构不发生变化;最后将CBCT图像作为输入,利用训练好的网络模型进行伪影去除。该方法利用了contextual loss可以允许输入图像间的不对齐,可以很好的适用于CBCT与CT医学图像无法严格对其这一特点,最终实现一个快速有效的去除伪影的作用。

    一种基于深度学习的河道抛物行为检测的方法

    公开(公告)号:CN117475352A

    公开(公告)日:2024-01-30

    申请号:CN202311428950.X

    申请日:2023-10-31

    Abstract: 本发明涉及城市水环境治理技术领域,公开了一种基于深度学习的河道抛物行为检测的方法,包括:获取监控视频流并进行截取设定图像尺寸大小的彩色图像若干张;将若干张图像分为两组,对第一组和第二组图像进行标注,并划分为训练集和测试集;构建网络模型,其结构包括检测结构和分割结构;采用两个网络分别训练,得到训练后的检测模型和分割模型;获取到所有路摄像头的待检测图像,并全部放入内存队列供模型预测;检测进程从队列取出图像,图像输入到检测结构对漂浮物和岸上的人进行预测;汇总结果展示在网页管理平台中,以供管理员及时查看和分析。本发明能够适应不同场景,可以抓拍到往河道里抛丢垃圾的人员并及时更新到管理平台供管理员查看。

    一种自定义核膨胀的非引导深度补全方法

    公开(公告)号:CN115131569A

    公开(公告)日:2022-09-30

    申请号:CN202210749638.X

    申请日:2022-06-29

    Abstract: 一种自定义核膨胀的非引导深度补全方法,来进行激光雷达深度图像处理。该算法不依赖于任何训练数据。本发明采用贪心算法,通过深度反演,由小到大顺序的像素空洞填充以及核膨胀等操作,将输入的稀疏深度图,补全为一个密集深度图。本发明可在3.8GHz的CPU上实时运行,且不需要任何额外的GPU硬件,这使得它可以作为预处理步骤部署在嵌入式系统中,用于更复杂的任务,如SLAM或3D目标检测。同时,考虑到引导深度补全的广泛应用,该方法可作为引导深度补全的预处理步骤。或直接应用于引导深度补全不适用的场合,如黑夜等采光不佳的环境。

    一种基于双流时空图卷积神经网络的手语识别方法及系统

    公开(公告)号:CN111325099B

    公开(公告)日:2022-08-26

    申请号:CN202010069598.5

    申请日:2020-01-21

    Abstract: 本发明公开一种基于双流时空图卷积神经网络的手语识别方法及系统,首先,将手语动作视频切分为视频帧,提取手语动作视频片段中人物上半身和手部骨架点,并构建全局和局部图数据;利用双流时空图卷网络分别提取全局和局部时空特征,经过特征拼接得到全局‑局部特征;同时,将视频对应文本通过分词处理之后编码为词向量,并采用特征变换将二者映射到同一隐空间,利用动态时间规整算法进行模型训练;对全局‑局部特征序列,采用自注意力机制编解码网络对其进行序列化建模,解码器的输出采用softmax分类器获得每个视频片段所对应的单词,并组成相应文本句子。本发明能提高生成文本句子的准确率,在字幕生成、人机交互等场景中具有重要的应用价值。

Patent Agency Ranking