一种基于人脑fMRI重建视觉刺激图像的方法及系统

    公开(公告)号:CN118135052B

    公开(公告)日:2024-08-06

    申请号:CN202410559435.3

    申请日:2024-05-08

    Abstract: 本发明涉及视觉重建技术领域,公开了基于人脑fMRI重建视觉刺激图像的方法及系统,方法包括获取fMRI数据集,从fMRI数据集中提取fMRI体素数据进行patch遮罩,对fMRI体素数据的空间冗余进行稀疏编码处理,得到体素小块;体素小块通过一维卷积层转化成嵌入token,并随机遮罩至编码器中,在编码器的末端添加掩码符号、位置嵌入、patch编码,线性投影转化为解码器的嵌入空间,得到fMRI的潜在特征;获取fMRI对应的图像和文本数据集,在fMRI图像和文本数据集中利用训练好的CLIP模型提取CLIP的视觉和文本特征,对CLIP的视觉特征进行解码,得到初步图像;通过自编码器进行编码,利用fMRI的潜在特征和CLIP的文本特征通过线性插值混合,得到像素重建,实现了结构清晰的初步重建图像的快速生成。

    一种基于人脑fMRI重建视觉刺激图像的方法及系统

    公开(公告)号:CN118135052A

    公开(公告)日:2024-06-04

    申请号:CN202410559435.3

    申请日:2024-05-08

    Abstract: 本发明涉及视觉重建技术领域,公开了基于人脑fMRI重建视觉刺激图像的方法及系统,方法包括获取fMRI数据集,从fMRI数据集中提取fMRI体素数据进行patch遮罩,对fMRI体素数据的空间冗余进行稀疏编码处理,得到体素小块;体素小块通过一维卷积层转化成嵌入token,并随机遮罩至编码器中,在编码器的末端添加掩码符号、位置嵌入、patch编码,线性投影转化为解码器的嵌入空间,得到fMRI的潜在特征;获取fMRI对应的图像和文本数据集,在fMRI图像和文本数据集中利用训练好的CLIP模型提取CLIP的视觉和文本特征,对CLIP的视觉特征进行解码,得到初步图像;通过自编码器进行编码,利用fMRI的潜在特征和CLIP的文本特征通过线性插值混合,得到像素重建,实现了结构清晰的初步重建图像的快速生成。

Patent Agency Ranking