-
公开(公告)号:CN113779377B
公开(公告)日:2024-03-22
申请号:CN202110849849.6
申请日:2021-07-27
Applicant: 浙江大学
IPC: G06F16/9535 , G06F16/951 , G06F16/955 , G06F18/2321
Abstract: 一种基于无障碍检测结果去重的爬虫搜索方法,预先设置好需要爬取的页面总数,循环地从URL队列中获取链接,访问链接获取网页源代码;再对网页源代码中选取的规则子集进行检测,将检测结果合并成特征矩阵;当从一个网页中提取的所有链接都被访问完毕后,对所有链接到的页面获取的矩阵运用DBSCAN算法进行聚类;对聚类后每一簇的结果进行随机抽样作为这一簇的代表页面,从中抽取链接加入URL队列,一簇中其他的网页由于无障碍检测结果和代表页面相似,因此其中的子链接都被标记为“跳过”,并不实际爬取页面而是直接增加爬取页面的计数;本发明用于网站页面用户友好程度自动化检测中的网页链接爬取阶段,通过控制爬取页面数量加快爬取进度,加快检测效率。
-
公开(公告)号:CN117710999A
公开(公告)日:2024-03-15
申请号:CN202410028111.7
申请日:2024-01-08
Applicant: 浙江大学
IPC: G06V30/412 , G06V30/414 , G06V30/14 , G06V30/148 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于深度学习的电商表格图像识别方法和装置,其方法包括:对输入的电商商品详情页图像进行表格区域检测,得到其中表格区域的矩形框坐标;根据表格区域的矩形框坐标裁剪出表格内容图像;对表格内容图像进行表格结构识别,得到各个单元格区域的矩形框坐标和行列位置信息;采用文本OCR模型获取表格内容图像内文本行区域的矩形框坐标和对应的文字信息;根据文本行区域矩形框和单元格区域矩形框之间的交并比匹配各单元格所包含的文字信息,得到电商表格图像的识别结果。本发明具备较好的表格识别准确性,且普适性强,可以用于复杂电商表格图像识别场景。
-
公开(公告)号:CN117708397A
公开(公告)日:2024-03-15
申请号:CN202410025494.2
申请日:2024-01-08
Applicant: 浙江大学
IPC: G06F16/951 , G06F16/958 , G06V20/40 , G06V10/774 , G06V10/776 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于YOLO的网页中视频组件的非侵入式检测方法,首先通过爬虫和人工标注的方式获取真实视频组件检测数据集,并通过人工合成检测数据解决训练数据不足的问题;最后,利用YOLO构建视频组件检测模型,使用人工合成数据进行模型训练并利用真实数据进行测试,依据测试中的错检样本迭代更新合成数据集和模型。本发明能够高效准确地检测网页中的视频组件,而无需侵入式操作,同时,通过人工合成数据的方式解决了数据量不足和数据获取困难的问题。
-
公开(公告)号:CN113807543B
公开(公告)日:2023-12-08
申请号:CN202110983059.7
申请日:2021-08-25
Applicant: 浙江大学
IPC: G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/084 , G06F18/2411
Abstract: 一种基于方向感知的有向网络嵌入算法,包括:S1,计算非对称临近性,具体包括:为有向网络中的随机游走策略定义单步概率,将随机游走中的单步方向与临近性信息保存在权重中,计算节点之间分数;S2,建立有向网络嵌入,具体包括:计算得到节点之间的非对称临近性后,建立定性有向网络嵌入DNE‑L将节点之间离散的非对称临近性保留在嵌入网络中,计算得到节点之间的非对称临近性后,建立定量有向网络嵌入DNE‑T将节点之间离散的非对称临近性保留在嵌入网络中,优化模型。本发明还包括实施一种基于方向感知的有向网络嵌入算法的系统。本发明对真实网络中的实际问题有更好的解释性,将离散的和连续的有向网络嵌入都有效地保留在了嵌入空间中。
-
公开(公告)号:CN116109967A
公开(公告)日:2023-05-12
申请号:CN202211650735.X
申请日:2022-12-21
Applicant: 浙江大学
IPC: G06V20/40 , G06V30/182 , G06V30/41 , G06V30/19
Abstract: 一种基于计算机视觉的电影旁白区间检测方法,包括:首先,打开电影获取连续帧的图像;其次,对获得的图像进行采样,并通过文字识别来获取字幕所在的位置坐标;然后,对所有图像帧检测在坐标内是否有字幕出现,计算字幕出现的时间区间,其余时间区间填充为旁白的时间,最后,再对检测结果进行微调,并根据旁白区间和常规语速给出推荐插入的旁白字数。根据以上步骤,即可判断得出电影的所有旁白区间以及每个旁白的推荐插入字数。本发明可应用于对电影进行旁白推荐,帮助更好的表达电影内容,为电影编辑提供更多选择和可能。
-
公开(公告)号:CN113419621B
公开(公告)日:2023-05-02
申请号:CN202011271295.8
申请日:2020-11-13
Applicant: 浙江大学
IPC: G06F3/01 , G06V40/10 , G06V10/762 , G06V10/774 , G06N20/00
Abstract: 本发明实施例提供了异常行为检测、页面、手势处理方法、装置及电子设备,其中,方法包括获取用户在指定页面上的手势轨迹数据;根据手势轨迹数据,绘制对应于指定页面的手势图像;对手势图像进行特征分析,生成对用户的异常行为的检测结果。本发明实施例通过将采集的用户在指定页面上的手势轨迹数据转换为与该页面对应的手势图像,然后基于图像特征分析来发现用户的异常行为,从而能够更加快速和准确地发现用户的异常行为,此外,由于这种检测方式将手势轨迹数据与具体页面进行了关联分析,因此,能够快速定位到出现问题所在的页面。
-
公开(公告)号:CN115904948A
公开(公告)日:2023-04-04
申请号:CN202211375694.8
申请日:2022-11-04
Applicant: 浙江大学
Abstract: 本发明公开的一种基于多设备协同的边端集群调度方法,使用侵入式的方式进行APP的启动与更新操作,同时使用侵入式方式在执行任务之前验证APP是否正常启动,保证做的检测任务一定是有意义的,并且该发明使用非侵入式的机械臂操作的方式完成侵入式方式无法完成的一些隐私操作,提升了边端执行任务的容错性。
-
公开(公告)号:CN115687731A
公开(公告)日:2023-02-03
申请号:CN202211425087.8
申请日:2022-11-14
Applicant: 浙江大学
IPC: G06F16/951 , G06F16/954 , G06F9/451 , H04W4/80 , B25J9/16 , B25J18/00
Abstract: 一种基于蓝牙的移动应用无障碍模式遍历方法,包括:在Across软件中配置连接手机蓝牙,连接机械臂,自动化启动APP后进入首页,通过蓝牙移动到首页第一个聚焦框并控制聚焦框向后移动,每移动一次,都通过计算机视觉算法检测聚焦框信息并生成聚焦框对象;若页面遍历的聚焦框个数达到设定值,则页面为瀑布流,需进行导航栏遍历;首页遍历结束后将其所有聚焦框加入广度优先队列中,从队头取聚焦框出队,通过蓝牙控制目标页面跳转,对新页面进行单页面遍历,直到队列为空或页面数到达设定的值结束遍历。本发明普适性强,效率与准确度高,可作为无障碍合规检测的上游服务,爬取移动应用页面信息,供后续检测任务使用。
-
公开(公告)号:CN113807543A
公开(公告)日:2021-12-17
申请号:CN202110983059.7
申请日:2021-08-25
Applicant: 浙江大学
Abstract: 一种基于方向感知的有向网络嵌入算法,包括:S1,计算非对称临近性,具体包括:为有向网络中的随机游走策略定义单步概率,将随机游走中的单步方向与临近性信息保存在权重中,计算节点之间分数;S2,建立有向网络嵌入,具体包括:计算得到节点之间的非对称临近性后,建立定性有向网络嵌入DNE‑L将节点之间离散的非对称临近性保留在嵌入网络中,计算得到节点之间的非对称临近性后,建立定量有向网络嵌入DNE‑T将节点之间离散的非对称临近性保留在嵌入网络中,优化模型。本发明还包括实施一种基于方向感知的有向网络嵌入算法的系统。本发明对真实网络中的实际问题有更好的解释性,将离散的和连续的有向网络嵌入都有效地保留在了嵌入空间中。
-
公开(公告)号:CN113780260A
公开(公告)日:2021-12-10
申请号:CN202110849867.4
申请日:2021-07-27
Applicant: 浙江大学
Abstract: 一种基于计算机视觉的无障碍文字智能检测方法,首先,打开网页或App,对其进行截图;将所获图像进行基本处理并传入OCR模型中,自动预测出可能存在的文本框位置及其置信度;接着,进行相似对对比,融合相似文本框,并根据置信度过滤;然后进行形状规整和边缘检测,确定文本框的最小范围;最后,对最终确定的文本框进行无障碍规则检测,包括字号大小检测和颜色对比度检测,并给出不符合无障碍规范的文本框,供开发人员参考修正。该方法适用于任一网页和App,提供了一套统一的无障碍文字智能化检测方案,具有准确度高、应用性强、普适度广等特点,有利于辅助我国互联网应用适老化及无障碍事业的进一步推广。
-
-
-
-
-
-
-
-
-