-
公开(公告)号:CN115866147B
公开(公告)日:2025-05-20
申请号:CN202211398986.3
申请日:2022-11-09
Applicant: 科大讯飞股份有限公司
IPC: H04N1/00
Abstract: 本申请提供了一种图像处理方法、系统、存储介质和电子设备,用于根据图像确定实际页面摆放位置以判断其是否超出摄影设备的视野范围,解决了在判断页面是否超出摄影设备的视野范围时精度不够,易受页面边缘空白区域干扰的问题。该图像处理方法包括:获取利用摄像设备采集的、目标书籍的当前页的页面图像;在基于页面图像确定当前页疑似超出摄像设备的视野范围的情况下,对页面图像进行文字识别,得到页面图像包含的第一文本内容;获取目标书籍的当前页的第二文本内容;基于第一文本内容和第二文本内容,确定当前页是否超出摄像设备的视野范围。通过本申请的方案,排除了页面边缘空白区域在确定页面摆放位置时造成的干扰,提高了精度。
-
公开(公告)号:CN115866147A
公开(公告)日:2023-03-28
申请号:CN202211398986.3
申请日:2022-11-09
Applicant: 科大讯飞股份有限公司
IPC: H04N1/00
Abstract: 本申请提供了一种图像处理方法、系统、存储介质和电子设备,用于根据图像确定实际页面摆放位置以判断其是否超出摄影设备的视野范围,解决了在判断页面是否超出摄影设备的视野范围时精度不够,易受页面边缘空白区域干扰的问题。该图像处理方法包括:获取利用摄像设备采集的、目标书籍的当前页的页面图像;在基于页面图像确定当前页疑似超出摄像设备的视野范围的情况下,对页面图像进行文字识别,得到页面图像包含的第一文本内容;获取目标书籍的当前页的第二文本内容;基于第一文本内容和第二文本内容,确定当前页是否超出摄像设备的视野范围。通过本申请的方案,排除了页面边缘空白区域在确定页面摆放位置时造成的干扰,提高了精度。
-
公开(公告)号:CN119832571A
公开(公告)日:2025-04-15
申请号:CN202411801181.8
申请日:2024-12-09
Applicant: 科大讯飞股份有限公司
IPC: G06V30/226 , G06V30/414
Abstract: 本发明提供一种试题批改方法、装置、设备和存储介质,涉及图像处理技术,该方法包括:获取待批改试题的文本图像;针对所有所述待批改试题中的各手写文本行,遍历所述文本图像中的各作答区,确定所述手写文本行与当前遍历的第一作答区之间的第一重叠度;基于各所述第一重叠度确定所述手写文本行对应的至少一个目标作答区;基于各所述目标作答区对应的标准答案对所述手写文本行进行批改。本发明可以提高试题批改的准确性。
-
公开(公告)号:CN116055804A
公开(公告)日:2023-05-02
申请号:CN202211726605.X
申请日:2022-12-29
Applicant: 科大讯飞股份有限公司
IPC: H04N21/4402 , H04N21/44
Abstract: 本申请提供了一种视频处理方法,涉及信息技术领域,该方法包括:获取针对目标作业的批改视频,目标作业中包括目标批改页面;确定批改视频中目标批改页面对应的关键视频帧,关键视频帧包括具有最多批改信息的视频帧;在确定关键视频帧中存在遮挡区域的情况下,确定批改视频中关键视频帧对应的至少一幅关联视频帧;若基于至少一幅关联视频帧确定遮挡区域中包括被遮挡的批改信息,则基于至少一幅关联视频帧补偿关键视频帧。该方法通过在确定存在被遮挡的批改信息时,基于至少一幅关联视频帧对关键视频帧进行补偿的方式,实现准确且完整地获得属于目标批改页面的全部批改信息的目的,从而实现获得准确的学情信息的目的。
-
公开(公告)号:CN118411733A
公开(公告)日:2024-07-30
申请号:CN202410132276.9
申请日:2024-01-30
Applicant: 科大讯飞股份有限公司
IPC: G06V30/413 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/09 , G06N3/088 , G06N3/084
Abstract: 本申请实施例公开了一种文本识别方法、装置、设备及存储介质,先对图片进行特征提取,得到视觉特征,然后对视觉特征进行处理,得到文本识别结果,该文本识别结果以标记语言表述图片中的文本内容及其版面信息,也就是说,基于本申请生成了更加丰富的文本识别结果,提高了文本识别的智能性。
-
公开(公告)号:CN117789239A
公开(公告)日:2024-03-29
申请号:CN202311564044.2
申请日:2023-11-20
Applicant: 科大讯飞股份有限公司
IPC: G06V30/42 , G06V30/414 , G06V30/413 , G06V30/226 , G06V30/19 , G06V30/146
Abstract: 本申请公开了一种二维图形速算题作答批改方法、装置、设备及存储介质,获取对纸质作答试卷拍摄的图片,从图片中识别出包含二维图形速算题的二维速算块区域;识别二维速算块区域包含的基础结构,及每一基础结构中包含的字符,基础结构为预先定义的组成二维图形速算题的最小结构单元,字符包括印刷体字符和/或手写体字符;针对识别出的每一基础结构,按照预配置的与基础结构对应的批改规则,结合基础结构包含的字符进行作答批改,得到基础结构的批改结果,由各基础结构的批改结果组成二维图形速算题的第一作答批改结果。本申请无需提前录入试题的答案,通过对二维图形速算题对应图像进行分析,即可实现自动批改,成本更低、泛化性更强。
-
公开(公告)号:CN109242869A
公开(公告)日:2019-01-18
申请号:CN201811106187.8
申请日:2018-09-21
Applicant: 科大讯飞股份有限公司 , 科大讯飞华南人工智能研究院(广州)有限公司
Abstract: 本申请提供了一种图像实例分割方法、装置、设备及存储介质,方法包括:获取待分割图像;将待分割图像输入预先建立的分类预测模型,获得分类预测结果,分类预测结果至少包括边缘概率图;将边缘概率图与待分割图像进行融合,融合后的图像作为第一目标图像;将第一目标图像输入预先建立的实例分割模型,获得实例分割图,作为待分割图像的实例分割结果。本申请可对待分割图像中的目标进行准确地检测与分割,分割效果较好。
-
-
-
-
-
-