-
公开(公告)号:CN114707467B
公开(公告)日:2024-06-14
申请号:CN202210269579.6
申请日:2022-03-18
Applicant: 浙江大学
IPC: G06F40/126 , G06F40/242 , G06F40/284
Abstract: 一种基于自注意力机制的自动化拼音转汉字方法,包括:预处理拼音序列;利用嵌入层获得输入拼音序列的嵌入表示矩阵;在嵌入表示添加位置编码,获得拼音序列的输入表示矩阵;利用拼音序列的输入表示矩阵和自注意力机制获得拼音序列的自注意力输出矩阵;利用全连接层将自注意力输出矩阵变换为输出矩阵;解析输出矩阵,获得汉字序列结果。该发明可在无人工干预的前提下,自动化的将拼音序列转成汉字序列。
-
公开(公告)号:CN113017609A
公开(公告)日:2021-06-25
申请号:CN202110361463.0
申请日:2021-04-02
Applicant: 浙江大学 , 中国兵器装备集团兵器装备研究所
Abstract: 本发明公开了一种用于可穿戴式设备的人体摆动期膝关节力矩测量方法,属于可穿戴传感器领域。该方法可以测量并输出用户在行走时的膝关节摆动期力矩,用于评价用户步态。本发明利用惯性传感器单元采集的角速度、加速度数据,计算并输出用户的摆动期膝关节力矩。本发明使用方便,不受场地限制,成本低廉,可以高精度对用户的摆动期膝关节力矩进行测量,拥有较高的可靠性以及较好的推广前景。
-
公开(公告)号:CN114677688B
公开(公告)日:2025-03-21
申请号:CN202210270078.X
申请日:2022-03-18
Applicant: 浙江大学
IPC: G06V30/40 , G06F40/58 , G06F40/126
Abstract: 本发明涉及一种基于Ant Design Vue和Flask的盲文识别系统,其中Ant Design Vue是一种前端技术,Flask是一种基于Python的服务器架构,盲文识别功能是指将盲文图片上的盲文方标识出来并翻译为汉字。所述系统包括登录,注册等账户管理功能,新建盲文识别任务,查看识别任务,检索任务等任务管理功能以及高精度,高效率盲文图片识别的功能。在查看任务详情界面,系统展示本任务所有图片的缩略图,以及所有图片的翻译结果。该发明提供了一个对盲文翻译任务统一管理的盲文翻译平台,注册后就可以使用上述所有功能,该系统可以给盲文学习者以及盲校老师阅读盲文带来极大的便利。
-
公开(公告)号:CN114707467A
公开(公告)日:2022-07-05
申请号:CN202210269579.6
申请日:2022-03-18
Applicant: 浙江大学
IPC: G06F40/126 , G06F40/242 , G06F40/284
Abstract: 一种基于自注意力机制的自动化拼音转汉字方法,包括:预处理拼音序列;利用嵌入层获得输入拼音序列的嵌入表示矩阵;在嵌入表示添加位置编码,获得拼音序列的输入表示矩阵;利用拼音序列的输入表示矩阵和自注意力机制获得拼音序列的自注意力输出矩阵;利用全连接层将自注意力输出矩阵变换为输出矩阵;解析输出矩阵,获得汉字序列结果。该发明可在无人工干预的前提下,自动化的将拼音序列转成汉字序列。
-
公开(公告)号:CN114677688A
公开(公告)日:2022-06-28
申请号:CN202210270078.X
申请日:2022-03-18
Applicant: 浙江大学
IPC: G06V30/40 , G06F40/58 , G06F40/126
Abstract: 本发明涉及一种基于Ant Design Vue和Flask的盲文识别系统,其中Ant Design Vue是一种前端技术,Flask是一种基于Python的服务器架构,盲文识别功能是指将盲文图片上的盲文方标识出来并翻译为汉字。所述系统包括登录,注册等账户管理功能,新建盲文识别任务,查看识别任务,检索任务等任务管理功能以及高精度,高效率盲文图片识别的功能。在查看任务详情界面,系统展示本任务所有图片的缩略图,以及所有图片的翻译结果。该发明提供了一个对盲文翻译任务统一管理的盲文翻译平台,注册后就可以使用上述所有功能,该系统可以给盲文学习者以及盲校老师阅读盲文带来极大的便利。
-
公开(公告)号:CN114925868B
公开(公告)日:2025-03-11
申请号:CN202210519531.6
申请日:2022-05-12
Applicant: 浙江大学
IPC: G06Q10/02 , G06Q50/47 , G06T7/10 , G06T7/246 , G06T7/277 , G06T7/62 , G06T7/50 , G06T7/80 , G06V10/82 , G06V20/62 , H04L51/046 , H04L67/02 , H04L67/12 , H04L69/16
Abstract: 本发明公开了一种基于计算机视觉技术的助盲打车方法,通过websocket协议和微信小程序获取当前用户路况;利用计算机视觉技术得到车辆坐标进行车辆跟踪并为每辆车标定唯一ID;利用计算机视觉技术获取一定帧数车牌坐标计算车辆高度;通过车辆跟踪框和单目相机相似三角形原理得出人与车辆的距离、车辆的行驶速度;根据车辆的行驶速度筛选出需要进行车牌检测、车牌识别的车辆跟踪框;通过OCR技术得到车牌的坐标以及车牌号找到目标车辆;通过websocket协议将目标车辆ID对应的车辆信息反馈给用户。本发明解决了现有技术实时性不足、车牌会被遮挡、新能源车牌识别不准以及助盲打车软件空缺的问题。
-
公开(公告)号:CN117132986A
公开(公告)日:2023-11-28
申请号:CN202310969067.5
申请日:2023-08-03
Applicant: 浙江大学
IPC: G06V30/148 , G06V30/41 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 一种基于盲文点级语义增强的盲文字符检测识别方法和系统,其方法包括:通过计算机视觉技术获取图片中盲文字符的位置和类别置信度;通过计算机视觉技术获取图片像素的凸点置信度;通过盲文字符的类别置信度与区域内的凸点置信度筛选盲文字符。本发明改进了现有技术中利用目标检测模型对盲文字符进行检测和识别时,对模糊盲文点无法准确判断的问题,从而提高了检测识别的准确度。
-
公开(公告)号:CN114565926A
公开(公告)日:2022-05-31
申请号:CN202210209206.X
申请日:2022-03-04
Applicant: 浙江大学
IPC: G06V30/40 , G06V30/148
Abstract: 一种基于目标检测的二阶段盲文检测识别方法,其中盲文检测识别特指将纸质盲文扫描图片中的每个盲文字符检测并识别出来,通过计算机视觉领域的目标检测技术,首先使用盲文行检测模型检测出图片中的所有盲文行,然后使用盲文单字检测模型从盲文行的基础上做进一步检测识别,直接获得盲文行中所有盲文字符的位置和类别。该发明使用少量数据即可训练得到良好的检测识别模型,有助于盲文机器翻译后续工作的进行,同时可减轻训练数据标注的难度和成本。
-
公开(公告)号:CN114925868A
公开(公告)日:2022-08-19
申请号:CN202210519531.6
申请日:2022-05-12
Applicant: 浙江大学
IPC: G06Q10/02 , G06Q50/30 , G06T7/10 , G06T7/246 , G06T7/277 , G06T7/62 , G06T7/50 , G06T7/80 , G06V10/82 , G06V20/62 , H04L51/046 , H04L67/02 , H04L67/12 , H04L69/16
Abstract: 本发明公开了一种基于计算机视觉技术的助盲打车方法,通过websocket协议和微信小程序获取当前用户路况;利用计算机视觉技术得到车辆坐标进行车辆跟踪并为每辆车标定唯一ID;利用计算机视觉技术获取一定帧数车牌坐标计算车辆高度;通过车辆跟踪框和单目相机相似三角形原理得出人与车辆的距离、车辆的行驶速度;根据车辆的行驶速度筛选出需要进行车牌检测、车牌识别的车辆跟踪框;通过OCR技术得到车牌的坐标以及车牌号找到目标车辆;通过websocket协议将目标车辆ID对应的车辆信息反馈给用户。本发明解决了现有技术实时性不足、车牌会被遮挡、新能源车牌识别不准以及助盲打车软件空缺的问题。
-
公开(公告)号:CN114821565A
公开(公告)日:2022-07-29
申请号:CN202210519524.6
申请日:2022-05-12
Applicant: 浙江大学
Abstract: 本发明公开了一种基于目标检测和OCR技术的地铁标识识别方法,通过计算机视觉技术与目标检测技术,定位地铁场景图中的地铁导引标识的坐标;利用各标识的坐标,使用目标检测与分类技术,提取地铁标识中的图像信息;使用文本检测和文本识别技术,提取地铁标识中的文本信息;计算两种信息的联合置信度,筛选有效信息并输出。本发明为地铁标识识别领域提供了相关技术,可用于为视障人群提供导航信息,帮助其安全、高效地完成地铁行程,同时也为设计地铁导航系统的人员提供更科学的设计建议。
-
-
-
-
-
-
-
-
-