-
公开(公告)号:CN108874883B
公开(公告)日:2021-08-17
申请号:CN201810425398.1
申请日:2018-05-07
Applicant: 浙江大学
Abstract: 一种基于用户经验偏序关系的网页信息无障碍检测方法,获取步骤如下:第一步,获得检测点通过率矩阵P与用户经验偏序关系矩阵L;第二步,运用机器学习的方式,根据Pn*m与L获取每种检测点的权值w;第三步,根据用户经验偏序关系矩阵P和权值w获取不同网站的无障碍检测得分q。
-
公开(公告)号:CN114925868B
公开(公告)日:2025-03-11
申请号:CN202210519531.6
申请日:2022-05-12
Applicant: 浙江大学
IPC: G06Q10/02 , G06Q50/47 , G06T7/10 , G06T7/246 , G06T7/277 , G06T7/62 , G06T7/50 , G06T7/80 , G06V10/82 , G06V20/62 , H04L51/046 , H04L67/02 , H04L67/12 , H04L69/16
Abstract: 本发明公开了一种基于计算机视觉技术的助盲打车方法,通过websocket协议和微信小程序获取当前用户路况;利用计算机视觉技术得到车辆坐标进行车辆跟踪并为每辆车标定唯一ID;利用计算机视觉技术获取一定帧数车牌坐标计算车辆高度;通过车辆跟踪框和单目相机相似三角形原理得出人与车辆的距离、车辆的行驶速度;根据车辆的行驶速度筛选出需要进行车牌检测、车牌识别的车辆跟踪框;通过OCR技术得到车牌的坐标以及车牌号找到目标车辆;通过websocket协议将目标车辆ID对应的车辆信息反馈给用户。本发明解决了现有技术实时性不足、车牌会被遮挡、新能源车牌识别不准以及助盲打车软件空缺的问题。
-
公开(公告)号:CN118918594A
公开(公告)日:2024-11-08
申请号:CN202410905664.6
申请日:2024-07-08
Applicant: 浙江大学
Abstract: 本发明公开了一种矩阵式字符关键点检测方法和装置,该方法基于监督学习训练若干关键点簇,再通过无监督聚类得到字符各关键点的中心坐标,包括:(1)将OCR字符图映射至固定规格的像素矩阵;(2)设定阈值参数二值化该像素矩阵得到字符像素图;(3)标注该字符像素图中的笔画起点、笔画终点、笔画交叉点处的若干像素,并记录簇数量;(4)用深度学习神经网络学习该像素矩阵的若干簇关键点;(5)再用无监督聚类算法得到各簇关键点中心。本发明具有高准度,低延迟,鲁棒性强特点,可用于常规字符型盲文板、辅助盲人跳过学习盲文直接学习理解常规字符等产品功能应用,具有较好的商业化前景。
-
公开(公告)号:CN117710999A
公开(公告)日:2024-03-15
申请号:CN202410028111.7
申请日:2024-01-08
Applicant: 浙江大学
IPC: G06V30/412 , G06V30/414 , G06V30/14 , G06V30/148 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于深度学习的电商表格图像识别方法和装置,其方法包括:对输入的电商商品详情页图像进行表格区域检测,得到其中表格区域的矩形框坐标;根据表格区域的矩形框坐标裁剪出表格内容图像;对表格内容图像进行表格结构识别,得到各个单元格区域的矩形框坐标和行列位置信息;采用文本OCR模型获取表格内容图像内文本行区域的矩形框坐标和对应的文字信息;根据文本行区域矩形框和单元格区域矩形框之间的交并比匹配各单元格所包含的文字信息,得到电商表格图像的识别结果。本发明具备较好的表格识别准确性,且普适性强,可以用于复杂电商表格图像识别场景。
-
公开(公告)号:CN117708397A
公开(公告)日:2024-03-15
申请号:CN202410025494.2
申请日:2024-01-08
Applicant: 浙江大学
IPC: G06F16/951 , G06F16/958 , G06V20/40 , G06V10/774 , G06V10/776 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于YOLO的网页中视频组件的非侵入式检测方法,首先通过爬虫和人工标注的方式获取真实视频组件检测数据集,并通过人工合成检测数据解决训练数据不足的问题;最后,利用YOLO构建视频组件检测模型,使用人工合成数据进行模型训练并利用真实数据进行测试,依据测试中的错检样本迭代更新合成数据集和模型。本发明能够高效准确地检测网页中的视频组件,而无需侵入式操作,同时,通过人工合成数据的方式解决了数据量不足和数据获取困难的问题。
-
公开(公告)号:CN114565926A
公开(公告)日:2022-05-31
申请号:CN202210209206.X
申请日:2022-03-04
Applicant: 浙江大学
IPC: G06V30/40 , G06V30/148
Abstract: 一种基于目标检测的二阶段盲文检测识别方法,其中盲文检测识别特指将纸质盲文扫描图片中的每个盲文字符检测并识别出来,通过计算机视觉领域的目标检测技术,首先使用盲文行检测模型检测出图片中的所有盲文行,然后使用盲文单字检测模型从盲文行的基础上做进一步检测识别,直接获得盲文行中所有盲文字符的位置和类别。该发明使用少量数据即可训练得到良好的检测识别模型,有助于盲文机器翻译后续工作的进行,同时可减轻训练数据标注的难度和成本。
-
公开(公告)号:CN114494763A
公开(公告)日:2022-05-13
申请号:CN202111550515.5
申请日:2021-12-17
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/80 , G06V30/148 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于特征融合的商品详情图版式分类方法,其中商品详情图版式特指图片上的元素如图片、文字的排列和设计方式。所述方法通过计算机视觉技术定位商品详情图中各文字块的位置;利用各文本块的坐标位置提取商品详情图的版式空间特征;通过自然语言处理技术提取各文字块内部的版式语义特征;将版式空间特征和版式语义特征融合,利用机器学习方法对版式进行分类。该发明有助于探究商品详情图版式对于用户的影响,可用于为在线选购商品的用户推荐其感兴趣的商品,同时为设计商品详情图的人员提供设计建议。
-
-
公开(公告)号:CN114677688B
公开(公告)日:2025-03-21
申请号:CN202210270078.X
申请日:2022-03-18
Applicant: 浙江大学
IPC: G06V30/40 , G06F40/58 , G06F40/126
Abstract: 本发明涉及一种基于Ant Design Vue和Flask的盲文识别系统,其中Ant Design Vue是一种前端技术,Flask是一种基于Python的服务器架构,盲文识别功能是指将盲文图片上的盲文方标识出来并翻译为汉字。所述系统包括登录,注册等账户管理功能,新建盲文识别任务,查看识别任务,检索任务等任务管理功能以及高精度,高效率盲文图片识别的功能。在查看任务详情界面,系统展示本任务所有图片的缩略图,以及所有图片的翻译结果。该发明提供了一个对盲文翻译任务统一管理的盲文翻译平台,注册后就可以使用上述所有功能,该系统可以给盲文学习者以及盲校老师阅读盲文带来极大的便利。
-
公开(公告)号:CN119498819A
公开(公告)日:2025-02-25
申请号:CN202411316862.5
申请日:2024-09-20
Applicant: 浙江大学
Abstract: 一种基于实时关键点检测的非站立式量体方法及装置,该方法包括(1)采集非站立式数据集图像;(2)标注关节关键点:左耳、右耳、左肩、右肩、左肘、右肘、左手腕、右手腕、左髋、右髋、左膝、右膝、左踝、右踝;标注检测框:大臂、小臂、大腿、小腿、身体躯体、头部;标注局部横截面最长边缘关键点:大臂、小臂、大腿、小腿;(3)设计复合网络,将所有关键点及检测框合并送入网络训练;(4)复合网络支持视频实时检测、上传视频、上传图片三种方式得出身体数据结果。本发明具有高精度,低延迟,鲁棒性强特点,可用于肢体残疾人身体测量、辅助健全人快速测量身体数据、衣物商家智能量体等产品功能应用,具有较好的商业化前景。
-
-
-
-
-
-
-
-
-