基于Transformer的交互式图像分割方法

    公开(公告)号:CN117372701A

    公开(公告)日:2024-01-09

    申请号:CN202311667809.5

    申请日:2023-12-07

    Abstract: 本发明公开基于Transformer的交互式图像分割方法,选取想要标注的图像,载入到交互式图像分割标注软件中;选择分割目标,根据用户点击行为生成点击记录,在对应位置生成点击标记;确认交互完成后,根据点击记录将其转换为圆盘图,作为相对应的正负点击指导再和原始掩码拼接,在与原图相加后作为分割模型输入;利用预训练分割模型对图像中的指定目标进行分割,返回初始的分割掩码;根据初始的分割掩码结果,选择添加合适的正负点击对错误区域进行再次标记;将新的标记再次送入分割模型,并返回修正后的结果。如此往复,对分割结果进行细化,以得到满意的结果。本发明能提高交互式图像分割标注性能,以更少的交互次数得到更好的分割结果。

    一种新型时钟、其同步控制方法及其分步控制方法

    公开(公告)号:CN107688289A

    公开(公告)日:2018-02-13

    申请号:CN201710871582.4

    申请日:2017-09-25

    CPC classification number: G04G9/00 G04G21/06 G04G21/08

    Abstract: 本发明一种新型时钟,包括表盘、灯带、遮光板、交互按钮、控制芯片,所述表盘包括刻度板和侧壁,所述交互按钮设置在所述刻度板中心位置,所述灯带与所述刻度板平行,所述遮光板为圆环形;当用户手指按压所述交互按钮时,所述控制芯片用于根据当前时间控制所述彩色LED灯照射所述手指,从而使所述手指的影子在所述刻度板上模拟出时针和分针显示当前时间,所述遮光板上设有光敏传感器,所述光敏传感器与所述控制芯片电连接,所述光敏传感器用于检测实时外界光强并将其传送给所述控制芯片,所述控制芯片根据公式:P=1.1(P1-P0)+P0控制实际输出光强,本发明不设有指针,可直接通过手指的影子显示当前时间。

    一种基于网格点的医疗文档图像矫正识别方法及系统

    公开(公告)号:CN118918589B

    公开(公告)日:2025-01-21

    申请号:CN202411399134.5

    申请日:2024-10-09

    Abstract: 本发明涉及一种基于网格点的医疗文档图像矫正识别方法及系统,该方法包括以下步骤:步骤A:获取医疗文档的待矫正图像及其对应的真实图像,构建测试数据集;步骤B:构建基于网格点的医疗文档图像矫正模型并通过训练数据集对其进行训练,得到训练好的医疗文档图像矫正模型;步骤C:利用测试数据集对训练好的医疗文档图像矫正模型进行测试,评估合格的即为最终得到的医疗文档图像矫正模型;步骤D:将最终得到的医疗文档图像矫正模型应用于医疗文档图像矫正,获取矫正后的医疗文档图像;然后对矫正后的医疗文档图像进行文字识别,得到识别后的医疗文本。该方法及系统有利于快速、准确地校正医疗文档图像并对其进行文字识别。

    一种基于网格点的医疗文档图像矫正识别方法及系统

    公开(公告)号:CN118918589A

    公开(公告)日:2024-11-08

    申请号:CN202411399134.5

    申请日:2024-10-09

    Abstract: 本发明涉及一种基于网格点的医疗文档图像矫正识别方法及系统,该方法包括以下步骤:步骤A:获取医疗文档的待矫正图像及其对应的真实图像,构建测试数据集;步骤B:构建基于网格点的医疗文档图像矫正模型并通过训练数据集对其进行训练,得到训练好的医疗文档图像矫正模型;步骤C:利用测试数据集对训练好的医疗文档图像矫正模型进行测试,评估合格的即为最终得到的医疗文档图像矫正模型;步骤D:将最终得到的医疗文档图像矫正模型应用于医疗文档图像矫正,获取矫正后的医疗文档图像;然后对矫正后的医疗文档图像进行文字识别,得到识别后的医疗文本。该方法及系统有利于快速、准确地校正医疗文档图像并对其进行文字识别。

    一种应用于歪曲试卷的文档矫正系统

    公开(公告)号:CN118898846A

    公开(公告)日:2024-11-05

    申请号:CN202411396493.5

    申请日:2024-10-09

    Abstract: 本发明提出一种应用于歪曲试卷的文档矫正系统,包括试卷图像的分割模块和基于多头注意力机制的试卷图像矫正模块;所述试卷图像的分割模块基于UNet构建的分割模型以实现对于试卷文档的左缘信息和右缘信息分割,通过卷积层、残差连接以及转置卷积层提取和融合图像特征,以获得图像分割图,随后进行后处理以获得实际的掩码图;再将分割后的信息输入到基于多头注意力机制的试卷图像矫正模块中以对分割后的图形进行矫正;所述基于多头注意力机制的试卷图像矫正模块采用Transformer结构,包括Encoder‑Decoder结构,采用多头注意力结构网络生成图像的光流图,通过一系列的Encoder编码器块进行逐步降采样和Decoder解码器块进行逐步上采样,得到矫正后的试卷文档图像。

Patent Agency Ranking