基于感知损失的X射线头影测量图像特征点提取方法及装置

    公开(公告)号:CN113222910A

    公开(公告)日:2021-08-06

    申请号:CN202110449357.8

    申请日:2021-04-25

    Abstract: 本发明公开了一种基于感知损失的X射线头影测量图像特征点提取方法,涉及X射线头影测量图像技术领域,包括以下步骤:预先获取X射线头影测量图像,并作为数据输入;对X射线头影测量图像计算偏移距离图;将获取的偏移距离图输入至生成对抗网络模型,训练该模型预测得到每个特征点的偏移距离图,基于预测的偏移距离图,得到每个特征点的坐标,并以此作为该待测试X射线头影测量图像的特征点坐标。本发明网络模型耗时较短,节省硬件成本,而且无需对原始X射线头影测量图像进行裁剪,保证了数据的完整性,提高了特征点定位的准确性。

    一种融合时空双重网络流和attention机制的人体行为识别方法

    公开(公告)号:CN107609460B

    公开(公告)日:2021-02-02

    申请号:CN201710372110.4

    申请日:2017-05-24

    Abstract: 本发明公开了一种融合时空双重网络流和attention机制的人体行为识别方法,提取运动光流特征,生成光流特征图像;构建独立的时间流和空间流网络,生成两段具有显著结构性的高层语义特征序列;解码时间流高层语义特征序列,输出时间流视觉特征描述子,并输出attention显著性特征图序列,同时输出空间流视觉特征描述子以及视频窗口每一帧的标签概率分布;计算每一帧时间维attention置信度得分系数,加权空间流视频窗口每一帧的标签概率分布,选择视频窗口关键帧;利用softmax分类器决策识别出视频窗口的人体行为动作类别。相比现有技术,本发明能有效关注原始视频中外观图像的关键帧,同时又能选择即得关键帧空间显著性区域特征,其识别准确度较高。

    一种基于双流时空图卷积神经网络的手语识别方法及系统

    公开(公告)号:CN111325099A

    公开(公告)日:2020-06-23

    申请号:CN202010069598.5

    申请日:2020-01-21

    Abstract: 本发明公开一种基于双流时空图卷积神经网络的手语识别方法及系统,首先,将手语动作视频切分为视频帧,提取手语动作视频片段中人物上半身和手部骨架点,并构建全局和局部图数据;利用双流时空图卷网络分别提取全局和局部时空特征,经过特征拼接得到全局-局部特征;同时,将视频对应文本通过分词处理之后编码为词向量,并采用特征变换将二者映射到同一隐空间,利用动态时间规整算法进行模型训练;对全局-局部特征序列,采用自注意力机制编解码网络对其进行序列化建模,解码器的输出采用softmax分类器获得每个视频片段所对应的单词,并组成相应文本句子。本发明能提高生成文本句子的准确率,在字幕生成、人机交互等场景中具有重要的应用价值。

    基于多判别器的多重解析网络缺失CT投影数据估计方法

    公开(公告)号:CN111260583A

    公开(公告)日:2020-06-09

    申请号:CN202010056809.1

    申请日:2020-01-17

    Abstract: 本发明公开了一种基于多判别器的多重解析网络缺失CT投影数据估计方法,所述方法包括:获取不完整CT投影数据图像;将所述不完整CT投影数据图像输入至多重解析网络模型,获取完整CT投影数据图像;通过卷积滤波反投影方法对所述完整CT投影数据图像进行重建处理得到CT图像。本发明能显著提高预测的CT投影数据图像清晰度以及缺失区域边界的连贯性,进而提升CT图像的质量,峰值信噪比值和结构相似性值均体现了本发明方法的优越性。

    基于三维对抗性生成网络的低剂量CBCT图像重建方法

    公开(公告)号:CN110288671A

    公开(公告)日:2019-09-27

    申请号:CN201910559108.7

    申请日:2019-06-25

    Abstract: 本发明公开了一种基于三维对抗性生成网络的低剂量CBCT图像重建方法,属于医学图像处理技术领域。所述方法包括如下步骤:构建三维对抗性生成网络模型;通过正弦图像及其对应的投影数据训练三维对抗性生成网络模型;将测试图像输入至已训练好的对抗性生成网络模型,对不完全投影数据的正弦图像缺失部分进行预测,获取完整投影的正弦图像;根据所述完整投影数据的正弦图像重建CT图像。本发明有效缩短锥形束投影数据的获取时间,提高临床诊断效率。

    基于三维随机森林模型的头影测量图像中特征点定位方法

    公开(公告)号:CN109920002A

    公开(公告)日:2019-06-21

    申请号:CN201910400713.X

    申请日:2019-05-15

    Abstract: 本发明公开了一种基于三维随机森林模型的头影测量图像中特征点定位方法,属于图像处理技术领域。方法包括:为每个目标特征点构建一个双层回归森林模型,并利用每个训练图像训练每个目标特征点的双层回归森林模型,得到预测的各特征点对应的位移场;对待测头影测量图像,利用已训练的各特征点对应的双层回归森林模型进行预测,获得每个特征点的位移场;根据各特征点的位移场计算得到对应的偏移距离图,根据偏移距离图计算获得每个特征点的坐标位置。本发明中每个目标特征点都有一个双层回归森林模型作为特征点检测器,第二层回归森林可以显著提升每一个预测位移场的质量,因此该方法可以比传统方法更加精确地检测到解剖特征点。

    基于VAEGAN的非完全投影CT图像重建方法

    公开(公告)号:CN109146988A

    公开(公告)日:2019-01-04

    申请号:CN201810674145.8

    申请日:2018-06-27

    CPC classification number: G06T11/003 G06T2210/41

    Abstract: 本发明公开了一种基于VAEGAN的非完全投影CT图像重建方法,包括:首先,完全投影数据的正弦图像来训练VAEGAN模型,获得可以生成高质量正弦图像的VAEGAN模型;其次,利用已训练的模型对不完全投影数据正弦图缺失部分进行预测,进而可以获取到补全的投影数据;最后,使用卷积滤波反投影(Filtered Back‑Projection,FBP)方法从补全的投影数据图像中重建出CT图像。本发明能够预测缺失投影数据并进一步重建出符合临床诊断、高质量的CT图像。

    一种基于深度递归分层条件随机场的人体行为识别方法

    公开(公告)号:CN105740815B

    公开(公告)日:2018-12-18

    申请号:CN201610064349.0

    申请日:2016-01-29

    Abstract: 本发明公开了一种基于深度递归分层条件随机场的人体行为识别方法,首先,分别提取由RGB‑D摄像机拍摄行为动作场景的RGB‑D视频中行为动作主体的人体姿态和可能与其相互交互的物体信息,将这两种信息作为深度递归分层条件随机场的中间层状态,建模预测输出目标状态层中当前状态和当前所有已发生的预测输出状态集合的相关性,构建深度递归分层条件随机场模型;其次,采用BCFW优化方法驱动的结构化支持向量机分类器学习关于人体行为序列的判别分类模型;最后,根据学习得到的模型参数和即得判别模型预测待测试的人体行为序列的类别。本发明对行为动作具有显著的鲁棒性,在一定程度上提高了人体行为动作的识别准确度。

    面向捕获静止场景的二维视频的准三维重建方法

    公开(公告)号:CN103236082B

    公开(公告)日:2015-12-02

    申请号:CN201310154164.5

    申请日:2013-04-27

    Abstract: 本发明公开了一种面向捕获静止场景的二维视频的准三维重建方法,属于计算机视觉的三维视频重建领域。本发明方法包括以下步骤:步骤A、对二维视频中的每一帧,提取双视点图像对;步骤B、分别对各双视点图像对进行极线校正;步骤C、采用基于全局优化的双目立体匹配方法对极线校正后的各双视点图像对分别求解全局最优视差图;步骤D、对全局最优视差图进行反校正,得到二维视频中各帧相应的视差图;步骤E、将步骤D得到的视差图依所对应的视频帧次序拼接为视差图序列,并对视差图序列进行优化;步骤F、结合所提取的各视频帧及其对应视差图,采用DIBR方法恢复虚拟视点图像,并将虚拟视点图像拼接为虚拟视点视频。本发明计算复杂度低,简单易行。

    磨牙牙根与神经管位置关系的检测方法与装置

    公开(公告)号:CN119228764A

    公开(公告)日:2024-12-31

    申请号:CN202411352028.1

    申请日:2024-09-26

    Abstract: 本申请公开了磨牙牙根与神经管位置关系的检测方法与装置。该方法包括:获取曲面体层图像;将曲面体层图像输入到训练好的检测模型中,得到检测结果;其中,检测模型包括特征提取网络、特征融合网络和预测网络,特征提取网络包括轻量化跨阶段模块和空间‑通道混合注意力模块;得到检测结果的步骤包括:将曲面体层图像输入到特征提取网络中,通过轻量化跨阶段模块和空间‑通道混合注意力模块处理后得到多个子特征图,将多个子特征图输入到特征融合网络中进行处理,得到多个输出特征图,将多个输出特征图输入到预测网络中,得到预测的边界框和目标置信度。本申请能够提升曲面体层图像的识别精度,并减少网络计算复杂度和参数量。

Patent Agency Ranking