基于端到端回归卷积神经网络的多生牙自动检测方法

    公开(公告)号:CN117218052A

    公开(公告)日:2023-12-12

    申请号:CN202310471345.4

    申请日:2023-04-27

    Abstract: 本发明公开了一种基于端到端回归卷积神经网络的多生牙自动检测方法,包括以下步骤:S1、对训练数据库和验证数据库中的医学影像标注存在多生牙的病灶区位置信息和类别信息;S2、建一个能同时实现定位和分类功能、进行端到端优化的回归卷积神经网络;S3、训练端到端回归卷积神经网络学习从医学影像中自动提取的特征与多生牙之间的非线性映射关系;S4、获得存在多生牙的病灶区位置以及出现多生牙概率的预测结果。本发明通过一个回归卷积神经网络模型即可同时实现端到端的多生牙病灶区位置和出现多生牙概率的实时全自动快速预测,避免了临床医生精力和个人经验等主观因素对多生牙检测精度的影响,提高了口腔临床对多生牙的检测效率。

    一种基于引导图滤波的CBCT图像金属伪影校正方法

    公开(公告)号:CN113643393B

    公开(公告)日:2023-06-16

    申请号:CN202110718003.9

    申请日:2021-06-28

    Abstract: 本发明公开了一种基于引导图滤波的CBCT图像金属伪影校正方法,包括以下步骤:将原始投影数据FDK重建为原始CBCT图像;在原始CBCT图像中分割出金属CBCT图像区域;对金属CBCT图像区域进行正投影得到金属投影数据区域;根据投影数据区域对原始投影数据进行插值;将插值后的投影数据进行引导图滤波并与原始数据进行拼接;将拼接后的投影数据进行FDK重建得到无金属的CBCT图像;将原始CBCT图像的金属区域与无金属的CBCT图像进行拼接,得到最终的CBCT图像金属伪影校正结果;本发明提出的金属伪影校正方法可以得到很好的校正结果,同时减少次生伪影的引入,保证了处理速度。

    一种基于双流时空图卷积神经网络的手语识别方法及系统

    公开(公告)号:CN111325099B

    公开(公告)日:2022-08-26

    申请号:CN202010069598.5

    申请日:2020-01-21

    Abstract: 本发明公开一种基于双流时空图卷积神经网络的手语识别方法及系统,首先,将手语动作视频切分为视频帧,提取手语动作视频片段中人物上半身和手部骨架点,并构建全局和局部图数据;利用双流时空图卷网络分别提取全局和局部时空特征,经过特征拼接得到全局‑局部特征;同时,将视频对应文本通过分词处理之后编码为词向量,并采用特征变换将二者映射到同一隐空间,利用动态时间规整算法进行模型训练;对全局‑局部特征序列,采用自注意力机制编解码网络对其进行序列化建模,解码器的输出采用softmax分类器获得每个视频片段所对应的单词,并组成相应文本句子。本发明能提高生成文本句子的准确率,在字幕生成、人机交互等场景中具有重要的应用价值。

    X射线头影测量图像结构特征点自动定位方法及系统

    公开(公告)号:CN109544530B

    公开(公告)日:2022-08-16

    申请号:CN201811375758.8

    申请日:2018-11-19

    Abstract: 本发明公开了一种X射线头影测量图像结构特征点自动定位方法,包括双层回归森林模型训练:将从训练图像中提取的外观特征作为输入,训练第一层回归森林模型;将第一层回归森林模型作用于训练图像,获得训练图像对应的第一层偏移距离图;将从第一层偏移距离图中提取的外观特征和训练图像的外观特征作为输入,训练第二层回归森林模型;利用训练好的双层回归森林模型,对待检测图像结构特征点定位。本发明构建双层回归森林模型,通过双层回归森林模型对X射线头影测量图像结构特征点进行自动定位,相较于传统的人工定位,提高了效率,解决了时间,同时大大提高了准确性。

    基于视觉和语言的标注关联型短视频情感识别方法及系统

    公开(公告)号:CN114882412A

    公开(公告)日:2022-08-09

    申请号:CN202210511572.0

    申请日:2022-05-11

    Abstract: 本发明公开了一种基于视觉和语言的标注关联型短视频情感识别方法及系统。首先分别提取出视频流在空间维和时间维上的低层视觉特征,将其输入多头自注意力网络,与视觉信息的高层情感特征在特征层予以融合,计算出短视频视觉模态的情感分值矩阵;接着使用词向量工具将短视频的文本内容转化为词向量并利用情感词典增强其情感极性;再从其中提取语言信息所包含的高层语义特征,并计算出短视频文本模态的情感分值矩阵;最后将情感分值矩阵与加权系数矩阵相乘,得到短视频的情感分类结果。本发明可以有效融合短视频视觉和语言的情感信息,兼顾视频流的空时变化和文本内容的前后语义关系,突破单模态情感分类的局限性,提高短视频情感分类的准确率。

    基于感知损失的X射线头影测量图像特征点提取方法及装置

    公开(公告)号:CN113222910A

    公开(公告)日:2021-08-06

    申请号:CN202110449357.8

    申请日:2021-04-25

    Abstract: 本发明公开了一种基于感知损失的X射线头影测量图像特征点提取方法,涉及X射线头影测量图像技术领域,包括以下步骤:预先获取X射线头影测量图像,并作为数据输入;对X射线头影测量图像计算偏移距离图;将获取的偏移距离图输入至生成对抗网络模型,训练该模型预测得到每个特征点的偏移距离图,基于预测的偏移距离图,得到每个特征点的坐标,并以此作为该待测试X射线头影测量图像的特征点坐标。本发明网络模型耗时较短,节省硬件成本,而且无需对原始X射线头影测量图像进行裁剪,保证了数据的完整性,提高了特征点定位的准确性。

    一种融合时空双重网络流和attention机制的人体行为识别方法

    公开(公告)号:CN107609460B

    公开(公告)日:2021-02-02

    申请号:CN201710372110.4

    申请日:2017-05-24

    Abstract: 本发明公开了一种融合时空双重网络流和attention机制的人体行为识别方法,提取运动光流特征,生成光流特征图像;构建独立的时间流和空间流网络,生成两段具有显著结构性的高层语义特征序列;解码时间流高层语义特征序列,输出时间流视觉特征描述子,并输出attention显著性特征图序列,同时输出空间流视觉特征描述子以及视频窗口每一帧的标签概率分布;计算每一帧时间维attention置信度得分系数,加权空间流视频窗口每一帧的标签概率分布,选择视频窗口关键帧;利用softmax分类器决策识别出视频窗口的人体行为动作类别。相比现有技术,本发明能有效关注原始视频中外观图像的关键帧,同时又能选择即得关键帧空间显著性区域特征,其识别准确度较高。

    一种基于双流时空图卷积神经网络的手语识别方法及系统

    公开(公告)号:CN111325099A

    公开(公告)日:2020-06-23

    申请号:CN202010069598.5

    申请日:2020-01-21

    Abstract: 本发明公开一种基于双流时空图卷积神经网络的手语识别方法及系统,首先,将手语动作视频切分为视频帧,提取手语动作视频片段中人物上半身和手部骨架点,并构建全局和局部图数据;利用双流时空图卷网络分别提取全局和局部时空特征,经过特征拼接得到全局-局部特征;同时,将视频对应文本通过分词处理之后编码为词向量,并采用特征变换将二者映射到同一隐空间,利用动态时间规整算法进行模型训练;对全局-局部特征序列,采用自注意力机制编解码网络对其进行序列化建模,解码器的输出采用softmax分类器获得每个视频片段所对应的单词,并组成相应文本句子。本发明能提高生成文本句子的准确率,在字幕生成、人机交互等场景中具有重要的应用价值。

    基于多判别器的多重解析网络缺失CT投影数据估计方法

    公开(公告)号:CN111260583A

    公开(公告)日:2020-06-09

    申请号:CN202010056809.1

    申请日:2020-01-17

    Abstract: 本发明公开了一种基于多判别器的多重解析网络缺失CT投影数据估计方法,所述方法包括:获取不完整CT投影数据图像;将所述不完整CT投影数据图像输入至多重解析网络模型,获取完整CT投影数据图像;通过卷积滤波反投影方法对所述完整CT投影数据图像进行重建处理得到CT图像。本发明能显著提高预测的CT投影数据图像清晰度以及缺失区域边界的连贯性,进而提升CT图像的质量,峰值信噪比值和结构相似性值均体现了本发明方法的优越性。

    基于三维对抗性生成网络的低剂量CBCT图像重建方法

    公开(公告)号:CN110288671A

    公开(公告)日:2019-09-27

    申请号:CN201910559108.7

    申请日:2019-06-25

    Abstract: 本发明公开了一种基于三维对抗性生成网络的低剂量CBCT图像重建方法,属于医学图像处理技术领域。所述方法包括如下步骤:构建三维对抗性生成网络模型;通过正弦图像及其对应的投影数据训练三维对抗性生成网络模型;将测试图像输入至已训练好的对抗性生成网络模型,对不完全投影数据的正弦图像缺失部分进行预测,获取完整投影的正弦图像;根据所述完整投影数据的正弦图像重建CT图像。本发明有效缩短锥形束投影数据的获取时间,提高临床诊断效率。

Patent Agency Ranking