片上集成编码孔径锥形束计算机断层成像方法及系统

    公开(公告)号:CN118986378A

    公开(公告)日:2024-11-22

    申请号:CN202410950944.9

    申请日:2024-07-16

    Abstract: 本发明公开了片上集成编码孔径锥形束计算机断层成像方法及系统,涉及锥形束计算机断层成像领域,包括:根据X射线图像传感器规模和期望的放大倍率,设计编码掩膜板并片上集成到X射线图像传感器上;构建片上集成编码孔径X射线图像传感器成像模型。通过SCI算法对采集的二维编码图像重建得到二维高分辨率图像,再通过FDK算法重建获得三维高分辨率体素图像。本发明通过对锥形束计算机断层成像设备改造,构建将二维图像映射到三维空间中的X射线成像模型;可用自然图像或X射线图像训练,对二维编码图像重建得到二维高分辨率图像,再通过FDK算法最终得到三维高分辨率体素图像;具备结构紧凑、重建质量高、泛化性好、鲁棒性高等特点。

    基于视觉和语言的标注关联型短视频情感识别方法及系统

    公开(公告)号:CN114882412B

    公开(公告)日:2024-06-25

    申请号:CN202210511572.0

    申请日:2022-05-11

    Abstract: 本发明公开了一种基于视觉和语言的标注关联型短视频情感识别方法及系统。首先分别提取出视频流在空间维和时间维上的低层视觉特征,将其输入多头自注意力网络,与视觉信息的高层情感特征在特征层予以融合,计算出短视频视觉模态的情感分值矩阵;接着使用词向量工具将短视频的文本内容转化为词向量并利用情感词典增强其情感极性;再从其中提取语言信息所包含的高层语义特征,并计算出短视频文本模态的情感分值矩阵;最后将情感分值矩阵与加权系数矩阵相乘,得到短视频的情感分类结果。本发明可以有效融合短视频视觉和语言的情感信息,兼顾视频流的空时变化和文本内容的前后语义关系,突破单模态情感分类的局限性,提高短视频情感分类的准确率。

    基于单步深度网络的曲面体层图正中多生牙自动检测方法

    公开(公告)号:CN114549523A

    公开(公告)日:2022-05-27

    申请号:CN202210436787.0

    申请日:2022-04-25

    Abstract: 本发明公开了基于单步深度网络的曲面体层图正中多生牙自动检测方法,其特征在于,包括:采集新曲面体层图像;将新曲面体层图像输入训练获得的单步深度网络模型,获得多个候选边界框位置及包含目标类别属于正中多生牙的目标置信度;利用非极大值抑制方法从多个候选边界框中筛选出最终的边界框,获得正中多生牙的最终定位。本发明只需对曲面体层图像进行一次扫描,即可快速自动识别该图像中是否含有正中多生牙并同时给出其位置,以避免医生经验差异对精度的影响,辅助医生快速正确诊断正中多生牙。

    协方差度量驱动小样本GIF短视频情感识别方法及系统

    公开(公告)号:CN110532911B

    公开(公告)日:2021-11-26

    申请号:CN201910763722.5

    申请日:2019-08-19

    Abstract: 本发明公开了一种协方差度量驱动小样本GIF短视频情感识别方法及系统。该方法首先从数据集中抽取样本构成支撑集和查询集,并将抽取的样本按照设定帧率分割为若干候选帧图像;然后利用C3D提取样本中的序列特征,同时利用CNN提取帧图像的视觉特征,然后逐帧进行哈达玛内积运算,得到最终的图像视觉特征,再采用ConvLSTM技术提取二者融合后的高层语义特征;再将支撑集样本提取的特征和查询集样本提取的特征进行拼接后通过协方差度量模块度量查询集样本和支撑集样本每类情感之间的相似性,最后利用softmax分类器预测最终的结果。本发明能有效关注GIF中图像的情感信息,同时兼顾视频流的时序特征,适用于小样本情况下的多分类视频情感分析,提高了分类准确率。

    一种基于引导图滤波的CBCT图像金属伪影校正方法

    公开(公告)号:CN113643393A

    公开(公告)日:2021-11-12

    申请号:CN202110718003.9

    申请日:2021-06-28

    Abstract: 本发明公开了一种基于引导图滤波的CBCT图像金属伪影校正方法,包括以下步骤:将原始投影数据FDK重建为原始CBCT图像;在原始CBCT图像中分割出金属CBCT图像区域;对金属CBCT图像区域进行正投影得到金属投影数据区域;根据投影数据区域对原始投影数据进行插值;将插值后的投影数据进行引导图滤波并与原始数据进行拼接;将拼接后的投影数据进行FDK重建得到无金属的CBCT图像;将原始CBCT图像的金属区域与无金属的CBCT图像进行拼接,得到最终的CBCT图像金属伪影校正结果;本发明提出的金属伪影校正方法可以得到很好的校正结果,同时减少次生伪影的引入,保证了处理速度。

    一种基于改进YOLOv3的行人和车辆检测方法及系统

    公开(公告)号:CN109815886B

    公开(公告)日:2020-12-18

    申请号:CN201910052953.5

    申请日:2019-01-21

    Abstract: 本发明公开了一种基于改进YOLOv3的行人和车辆检测方法及系统。本发明采用基于Darknet‑33改进型YOLOv3网络作为主干网络提取特征;采用可传递的特征图尺度缩减方法,跨层融合并重用主干网络中的多尺度特征;然后采用尺度放大方法构建特征金字塔网络。训练阶段,对训练集使用K‑means聚类方法以预测框和真实框的交并比作为相似度标准进行聚类选取先验框;然后依据损失函数做BBox回归和多标签分类。检测阶段,对所有检测框,根据置信度打分和IOU值采用非极大值抑制法去除冗余检测框,预测出最优的目标对象。本发明采用特征图尺度缩减融合的特征提取网络Darknet‑33、特征图尺度放大迁移融合构造特征金字塔和聚类选取先验框,能提高行人和车辆检测的速度和精度。

    一种融合文本信息的GIF短视频情感识别方法及系统

    公开(公告)号:CN109145712B

    公开(公告)日:2020-10-16

    申请号:CN201810686822.8

    申请日:2018-06-28

    Abstract: 本发明公开了一种融合文本信息的GIF短视频情感识别方法及系统,该方法首先利用3D卷积神经网络提取出GIF短视频中序列特征,同时利用卷积神经网络提取出序列中图像视觉特征;再采用卷积长短时记忆递归神经网络技术解码二者融合后的高层语义特征,计算出情感分类概率分布矩阵,将进行区间映射得到视频部分的情感得分。接着,从注释文本中的单词筛选出蕴含情感信息的词汇,采用情感打分工具计算出文本情感得分。最后,将视频情感得分与文本情感得分赋予不同的权重相加并做有效性判别,对GIF短视频进行情感分类。本发明能有效关注GIF视频中图像的情感信息,同时兼顾视频流的时序特征,并且文本信息与视频信息融合,提高了GIF视频情感分类的准确度和鲁棒性。

    基于多尺度特征图重构和知识蒸馏的目标检测方法与系统

    公开(公告)号:CN111626330A

    公开(公告)日:2020-09-04

    申请号:CN202010324557.6

    申请日:2020-04-23

    Abstract: 本发明公开了一种基于多尺度特征图重构和知识蒸馏的目标检测方法与系统,该方法首先利用骨干网络Darknet-53提取特征,深层特征通过上采样和浅层特征张量拼接生成多尺度特征图;然后采用特征重标定策略来自动获取特征图中每个通道的权重,依照权重提升有用的特征并抑制无用特征,再用残差模块融合顶层特征的语义信息和底层特征的细节信息;再将骨干网络中批量归一化层的γ系数引入到剪枝目标函数中进行训练,根据修剪阈值将低于阈值的γ系数所在通道从模型中去除;最后将训练好的YOLOv3基准模型作为教师网络,剪枝后的模型作为学生网络进行知识蒸馏。本发明改善了在大范围内不同大小物体检测的精度问题,同时降低了模型的计算量,提高了模型检测速度。

    一种基于信息边缘和多模态特征的室内场景布局估计方法

    公开(公告)号:CN107292234B

    公开(公告)日:2020-06-30

    申请号:CN201710347401.8

    申请日:2017-05-17

    Abstract: 本发明公开了一种基于信息边缘和多模态特征的室内场景布局估计方法,针对图像用边缘检测提取直线段由此估计出图像消失点,从消失点出发做采样射线粗划分图像区域;用全卷积神经网络(FCNs)获取信息边缘图,选取图中能量较高区域并细采样产生布局候选项;基于积分几何提取图像的线段、几何上下文、深度、法向量特征;考虑布局候选项与区域级特征一元和二元的映射关系,设计布局估计的结构化回归模型,引入结构化学习算法,能量函数最小的即为室内场景布局估计。本发明逐步缩小候选项生成区域,并结合多种模态特征对布局候选项进行约束,提高了室内估计布局精度。

Patent Agency Ranking