-
公开(公告)号:CN107346580A
公开(公告)日:2017-11-14
申请号:CN201610293318.2
申请日:2016-05-05
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学
Inventor: 苏统华
IPC: G07D7/20
Abstract: 本发明公开了一种票据信息识别方法及装置,属于图像处理技术领域。本发明通过获取票据图像,该票据图像为待识别的票据图像,基于该票据图像中每个像素点的像素值,确定该票据图像的背景颜色,该像素值由多种颜色分量组成,确定该票据图像中的噪点区域,基于该背景颜色,对该噪点区域的颜色进行处理,得到第一预处理图像,基于该第一预处理图像,对该票据图像中的信息进行识别,如此,在对该票据图像进行识别之前,通过消除票据图像中的噪点区域,来增加票据信息的可识别性,提高了票据信息识别的效率。
-
公开(公告)号:CN105654072A
公开(公告)日:2016-06-08
申请号:CN201610172317.2
申请日:2016-03-24
Applicant: 哈尔滨工业大学
CPC classification number: G06K9/00449 , G06K9/2054 , G06K9/40
Abstract: 本发明公开了一种低分辨率医疗票据图像的文字自动提取和识别系统与方法,所述系统包括图像预处理模块、字段切分模块、单字符切分模块、字符识别模块四大模块,所述方法包括据图像的预处理、字段区域识别、字符串分割和字符识别与验证四大步骤。本发明能够更好的适用于低分辨率医疗票据图像的文字自动提取和识别。通过对票据进行版面分析,能够充分利用这些信息。对于图像质量较低,噪声和图像分辨率影响非常大的图像,利用每个字段区域的语义,有助于将字符串切分成单个字符,从而转化为对单字符的识别。比如,将由纯数字组成的发票号,可以使用专门用于处理只有数字的图像的方法;识别的时候,将识别范围再限制在0~9这十个数字中,识别率即可大大提高。
-
公开(公告)号:CN119046599A
公开(公告)日:2024-11-29
申请号:CN202411248878.7
申请日:2024-09-06
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了基于NPU的Strassen矩阵乘法加速方法,属于混合编程技术领域。解决了现有技术中不存在用于昇腾芯片的采用开源混合编程算子实现快速矩阵乘法方法的问题;本发明设计了Ascend_Strassen算子数据通路,对输入矩阵进行数据搬运并切分,得到分块矩阵;根据分块矩阵,进行第一次矩阵间加减运算,得到矩阵乘法阶段的输入数据,对部分分块矩阵进行加零操作,得到转换后的矩阵;进行矩阵乘法运算,得到矩阵乘法结果;根据矩阵乘法结果,进行第二次矩阵间加减运算,得到子矩阵;对子矩阵进行数据搬运并合并,得到输出矩阵。本发明有效缩短了矩阵运算时间,提高了计算精度,可以应用于昇腾芯片混合编程。
-
公开(公告)号:CN118261874B
公开(公告)日:2024-08-23
申请号:CN202410359722.X
申请日:2024-03-27
Applicant: 哈尔滨工业大学
IPC: G06T7/00 , G06T7/11 , G06V10/764 , G06T7/194 , G06T7/13
Abstract: 本发明公开了一种基于图像分割大模型和多元高阶回归拟合的鱼竿钓性分析方法,所述方法包括如下步骤:步骤一、图像裁切;步骤二、鱼竿预识别;步骤三、图像识别;步骤四、鱼竿曲线拟合。该方法能够将图像中的鱼竿自动识别出来并生成鱼竿图像在原图中的坐标从而衡量鱼竿的钓性,支持在光线昏暗下分割图像,并且在处理大尺寸图像时仍有较高的效率和分割效果。
-
公开(公告)号:CN116402067A
公开(公告)日:2023-07-07
申请号:CN202310359660.8
申请日:2023-04-06
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种面向多语种的自监督跨语言文字风格保持生成方法,所述方法包括如下步骤:一、建立用于实现跨语言生成任务的条件生成对抗网络模型;二、条件生成对抗网络模型在多语言真实数据中进行自监督训练,且在自监督训练过程使用识别器和条件生成对抗网络模型联合训练,提升最终的风格文本图像可辨读性。本发明综合利用风格迁移、生成对抗网络、图像修复、场景文字擦除和图像文字识别等技术,面向多语种实施跨语言文字风格保持生成,将图像的文本内容修改为另一种语言的新文本,同时保留图像中文字风格和背景纹理,能够解决图像翻译后的结果面临替换前后文本风格不一致、背景纹理不协调等问题,给用户带来更好的图像翻译体验。
-
公开(公告)号:CN116303237A
公开(公告)日:2023-06-23
申请号:CN202310112412.3
申请日:2023-02-14
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种错误可回溯的图像数据结构与标注方法,所述方法包括如下步骤:步骤一、读入图像数据,步骤二、图像内容预处理,步骤三、图像数据转化为HPC文件格式,步骤四、HPC文件的标注与修改,步骤五、HPC文件格式转化为TPC文件格式,步骤六、TPC文件格式转化为目标格式文件。本发明能将错误的样本个例溯源至原始样本批次内容上,有助于对成批出现的错误样本进行处理;能将大数据量的样本信息的修改与删除一体化处理,减少中间步骤,大幅度减少对处理采集到的数据所用的时间,减少人力的浪费,提升效率;能将相同标签的样本存储一体化,有利于在存储、使用、样本分类。
-
公开(公告)号:CN115617425A
公开(公告)日:2023-01-17
申请号:CN202211383369.6
申请日:2022-11-07
Applicant: 哈尔滨工业大学
IPC: G06F9/448
Abstract: 本发明提供了一种基于服务计算的智能数据处理系统,包括输入模块、输出模块、服务模块、调用模块和存储模块,所述输入模块用于接收用户提交的原始数据,所述输出模块用于发送经过服务计算后的结果数据,所述服务模块用于对原始数据进行计算处理,所述存储模块用于保存原始数据以及在服务计算过程中产生的中间数据,所述调用模块用于管理所述服务模块对所述存储模块中数据的调用;本系统通过调用模块来合理安排用户数据发送给服务模块进行计算处理的顺序,能够降低存储模块中的数据存储量,提高系统的同时处理能力。
-
公开(公告)号:CN110210413B
公开(公告)日:2022-12-16
申请号:CN201910483395.8
申请日:2019-06-04
Applicant: 哈尔滨工业大学
IPC: G06V30/40 , G06V30/14 , G06V30/146 , G06V30/148 , G06V30/19 , G06V10/82
Abstract: 本发明公开了一种基于深度学习的多学科试卷内容检测与识别系统及方法,所述系统包括数据预处理模块、数据粗粒度分类模块、小题细粒度分类模块、字符识别模块,其中:数据预处理模块对由纸质的试卷扫描成的数字图像进行处理;数据粗粒度分类模块使用Faster RCNN算法对输入图像进行试卷的整体结构分析,将图像分为不同类别的小题;小题细粒度分类模块采用Mask RCNN算法对数据粗粒度分类模块分完类的各小题进行内部字符的细粒度分类;字符识别模块将小题细粒度分类模块中的字符根据其类型调用相应的识别API来识别。本发明对于多学科试卷的复杂版面都有通用性;试卷中印刷体中文的识别率为99%,达到实用程度。
-
公开(公告)号:CN110765966B
公开(公告)日:2022-03-25
申请号:CN201911046777.0
申请日:2019-10-30
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种面向手写文字的一阶段自动识别与翻译方法,所述方法主要包含文本识别方法和端到端识别与翻译方法。该方法使用注意力机制代替CRNN中的RNN结构,使计算可以并行化,降低计算成本;在Transformer模型的训练过程中对解码器的输入做随机替换,模拟预测过程中预测出错的情况,缓解了过拟合问题;提出了一种端到端的识别与翻译模型,使用基于迁移学习的方式训练端到端模型,不需要显式给出识别结果,直接对图片内容做翻译。本发明具有如下优点:1、文本识别模型的训练速度大幅提高。2、训练阶段随机替换解码器输入,使得识别模型的泛化能力大幅提高。3、端到端识别与翻译模型的翻译准确率高于两阶段模型。
-
公开(公告)号:CN113553797A
公开(公告)日:2021-10-26
申请号:CN202110892232.2
申请日:2021-08-04
Applicant: 哈尔滨工业大学
IPC: G06F40/103 , G06T11/60 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种端到端的风格一致的文字图像生成方法,所述方法包括如下步骤:步骤一、对源风格图像中的文字进行擦除,补充背景纹理,得到无文字的背景图像;步骤二、将目标文本渲染为图像并嵌入背景重建模块输出的无文字的背景图像中,在相同背景下将源图像的文本风格迁移到目标文本中。本发明采用端到端的方法,将文本风格迁移、文字擦除等工作整合为一个网络,减少中间步骤可能带来的效果和性能的损失。本发明通过使用GAN算法,能够生成更加真实、风格更一致、语义更连贯的结果。
-
-
-
-
-
-
-
-
-