一种矩阵式字符关键点检测方法和装置

    公开(公告)号:CN118918594A

    公开(公告)日:2024-11-08

    申请号:CN202410905664.6

    申请日:2024-07-08

    Applicant: 浙江大学

    Abstract: 本发明公开了一种矩阵式字符关键点检测方法和装置,该方法基于监督学习训练若干关键点簇,再通过无监督聚类得到字符各关键点的中心坐标,包括:(1)将OCR字符图映射至固定规格的像素矩阵;(2)设定阈值参数二值化该像素矩阵得到字符像素图;(3)标注该字符像素图中的笔画起点、笔画终点、笔画交叉点处的若干像素,并记录簇数量;(4)用深度学习神经网络学习该像素矩阵的若干簇关键点;(5)再用无监督聚类算法得到各簇关键点中心。本发明具有高准度,低延迟,鲁棒性强特点,可用于常规字符型盲文板、辅助盲人跳过学习盲文直接学习理解常规字符等产品功能应用,具有较好的商业化前景。

    一种基于深度学习的电商表格图像识别方法和装置

    公开(公告)号:CN117710999A

    公开(公告)日:2024-03-15

    申请号:CN202410028111.7

    申请日:2024-01-08

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于深度学习的电商表格图像识别方法和装置,其方法包括:对输入的电商商品详情页图像进行表格区域检测,得到其中表格区域的矩形框坐标;根据表格区域的矩形框坐标裁剪出表格内容图像;对表格内容图像进行表格结构识别,得到各个单元格区域的矩形框坐标和行列位置信息;采用文本OCR模型获取表格内容图像内文本行区域的矩形框坐标和对应的文字信息;根据文本行区域矩形框和单元格区域矩形框之间的交并比匹配各单元格所包含的文字信息,得到电商表格图像的识别结果。本发明具备较好的表格识别准确性,且普适性强,可以用于复杂电商表格图像识别场景。

    基于目标检测的二阶段盲文检测识别方法

    公开(公告)号:CN114565926A

    公开(公告)日:2022-05-31

    申请号:CN202210209206.X

    申请日:2022-03-04

    Applicant: 浙江大学

    Abstract: 一种基于目标检测的二阶段盲文检测识别方法,其中盲文检测识别特指将纸质盲文扫描图片中的每个盲文字符检测并识别出来,通过计算机视觉领域的目标检测技术,首先使用盲文行检测模型检测出图片中的所有盲文行,然后使用盲文单字检测模型从盲文行的基础上做进一步检测识别,直接获得盲文行中所有盲文字符的位置和类别。该发明使用少量数据即可训练得到良好的检测识别模型,有助于盲文机器翻译后续工作的进行,同时可减轻训练数据标注的难度和成本。

    基于特征融合的商品详情图版式分类方法

    公开(公告)号:CN114494763A

    公开(公告)日:2022-05-13

    申请号:CN202111550515.5

    申请日:2021-12-17

    Applicant: 浙江大学

    Abstract: 本发明涉及一种基于特征融合的商品详情图版式分类方法,其中商品详情图版式特指图片上的元素如图片、文字的排列和设计方式。所述方法通过计算机视觉技术定位商品详情图中各文字块的位置;利用各文本块的坐标位置提取商品详情图的版式空间特征;通过自然语言处理技术提取各文字块内部的版式语义特征;将版式空间特征和版式语义特征融合,利用机器学习方法对版式进行分类。该发明有助于探究商品详情图版式对于用户的影响,可用于为在线选购商品的用户推荐其感兴趣的商品,同时为设计商品详情图的人员提供设计建议。

    一种基于Ant Design Vue和Flask的盲文识别系统

    公开(公告)号:CN114677688B

    公开(公告)日:2025-03-21

    申请号:CN202210270078.X

    申请日:2022-03-18

    Applicant: 浙江大学

    Abstract: 本发明涉及一种基于Ant Design Vue和Flask的盲文识别系统,其中Ant Design Vue是一种前端技术,Flask是一种基于Python的服务器架构,盲文识别功能是指将盲文图片上的盲文方标识出来并翻译为汉字。所述系统包括登录,注册等账户管理功能,新建盲文识别任务,查看识别任务,检索任务等任务管理功能以及高精度,高效率盲文图片识别的功能。在查看任务详情界面,系统展示本任务所有图片的缩略图,以及所有图片的翻译结果。该发明提供了一个对盲文翻译任务统一管理的盲文翻译平台,注册后就可以使用上述所有功能,该系统可以给盲文学习者以及盲校老师阅读盲文带来极大的便利。

    一种基于实时关键点检测的非站立式量体方法及装置

    公开(公告)号:CN119498819A

    公开(公告)日:2025-02-25

    申请号:CN202411316862.5

    申请日:2024-09-20

    Applicant: 浙江大学

    Abstract: 一种基于实时关键点检测的非站立式量体方法及装置,该方法包括(1)采集非站立式数据集图像;(2)标注关节关键点:左耳、右耳、左肩、右肩、左肘、右肘、左手腕、右手腕、左髋、右髋、左膝、右膝、左踝、右踝;标注检测框:大臂、小臂、大腿、小腿、身体躯体、头部;标注局部横截面最长边缘关键点:大臂、小臂、大腿、小腿;(3)设计复合网络,将所有关键点及检测框合并送入网络训练;(4)复合网络支持视频实时检测、上传视频、上传图片三种方式得出身体数据结果。本发明具有高精度,低延迟,鲁棒性强特点,可用于肢体残疾人身体测量、辅助健全人快速测量身体数据、衣物商家智能量体等产品功能应用,具有较好的商业化前景。

Patent Agency Ranking