-
公开(公告)号:CN116152839A
公开(公告)日:2023-05-23
申请号:CN202310156082.8
申请日:2023-02-20
Applicant: 科大讯飞股份有限公司
IPC: G06V30/413 , G06V30/18 , G06V10/82 , G06N3/08 , G06N3/04
Abstract: 本发明提供了一种表格识别方法、装置、设备及存储介质,方法包括:获取用户在屏幕上书写时收集的轨迹点序列,并对轨迹点序列进行预处理;从预处理后的轨迹点序列中确定出表格轨迹点以及文本轨迹点;将表格轨迹点渲染成图像,得到纯表格图像,并将文本轨迹点渲染成图像,得到文本图像;对纯表格图像进行表格识别,得到表格识别结果,并对文本图像进行文本识别,得到文本识别结果;将表格识别结果与文本识别结果匹配,得到匹配结果;基于包含表格识别结果、文本识别结果以及匹配结果的识别信息,生成包含文本内容的表格。本发明提供的表格识别方法可还原出用户书写的包含文本内容的表格。
-
公开(公告)号:CN112949653A
公开(公告)日:2021-06-11
申请号:CN202110204628.3
申请日:2021-02-23
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种文本识别方法以及电子设备、存储装置,其中,文本识别方法包括:获取待识别图像;其中,待识别图像内含有至少一个目标文本;对待识别图像进行特征提取,得到待识别图像的特征图;利用特征图进行目标检测,得到分别与至少一个目标文本对应的目标区域;识别目标区域中的目标文本和目标文本的文本类型。上述方案,能够提高文本识别的准确性。
-
公开(公告)号:CN119785366A
公开(公告)日:2025-04-08
申请号:CN202510278028.X
申请日:2025-03-10
Applicant: 科大讯飞股份有限公司
IPC: G06V30/19 , G06V30/148
Abstract: 本申请公开了一种答题内容批改方法、系统和相关装置,该方法包括:获取当前答卷对应的目标图像,利用图像识别大模型确定所述目标图像对应的至少一个目标分区;基于所述目标分区在所述目标图像中的位置信息,生成确定所述目标分区匹配的识别提示信息,将所述识别提示信息输入至所述识别大模型,利用所述提示信息生成得到所述目标图像匹配的识别结果;基于所述识别结果,生成获取与所述识别结果中的答题内容匹配的目标批改结果。通过上述方式,本申请能够提高对答题内容进行批改的效率和准确性。
-
公开(公告)号:CN117079170A
公开(公告)日:2023-11-17
申请号:CN202210493408.1
申请日:2022-05-07
Applicant: 科大讯飞股份有限公司
IPC: G06V20/40 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/0442 , G06N3/08
Abstract: 本发明提供了一种多目标跟踪方法、装置、设备及存储介质,方法包括:获取第一视频帧对应的目标跟踪信息和当前视频帧的目标检测集,第一视频帧为当前视频帧的前向相邻帧,目标跟踪信息包括多个级别分别对应的跟踪集,其通过对截至第一视频帧跟踪的若干第一目标分别对应的跟踪子集进行分级得到,目标检测集包括从当前视频帧检测出的若干第二目标分别对应的检测子集;按级别由高到低的顺序对多个级别分别对应的跟踪集包含的跟踪子集与目标检测集包含的检测子集进行匹配,基于匹配结果对多个级别分别对应的跟踪集进行更新,多个级别分别对应的更新后跟踪集作为当前视频帧对应的目标跟踪信息。本发明提供的多目标跟踪方法具有较好的跟踪效果。
-
公开(公告)号:CN119226459A
公开(公告)日:2024-12-31
申请号:CN202411243765.8
申请日:2024-09-05
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F40/126 , G06F40/35 , G06F18/213 , G06F18/214 , G06N3/0455
Abstract: 本申请公开了一种智能对话方法及相关装置、设备和存储介质,其中,智能对话方法包括:基于以自然语言表示的第一语句,转换得到以机器语言表示的第一特征序列;基于智能对话模型处理第一特征序列,得到以机器语言表示的第二特征序列;其中,第二特征序列包含用于回复第一语句的特征信息;基于第二特征序列,转换得到以自然语言表示且用于回复第一语句的第二语句。上述方案,能够提升智能对话的准确性和效率。
-
公开(公告)号:CN114356201B
公开(公告)日:2024-02-20
申请号:CN202111592814.5
申请日:2021-12-23
Applicant: 科大讯飞股份有限公司
IPC: G06F3/0488 , G06F3/0354 , G06T5/70
Abstract: 本申请公开了一种书写美化方法、装置、设备和可读存储介质,该方法包括:采集多个书写轨迹点的信息,进行笔宽估计得到笔宽,并依次利用改进的三阶贝塞尔算法进行轨迹平滑得到多个插值轨迹点的信息,其中改进的三阶贝塞尔算法使用的控制点包括当前处理的书写轨迹点及其前三个书写轨迹点,多个插值轨迹点在当前处理的书写轨迹点之前的第一个书写轨迹点与第二个书写轨迹点之间,计算每个笔段的外轮廓,通过上述方式,每获取到一个书写轨迹点,就利用它更新改进的三阶贝塞尔算法的控制点,并对它之前的第一个书写轨迹点和第二个书写轨迹点之间进行平滑,能够降低电子屏书写平滑的延迟,也就能够降低电子屏书写美化的延迟。
-
公开(公告)号:CN112949653B
公开(公告)日:2024-04-16
申请号:CN202110204628.3
申请日:2021-02-23
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种文本识别方法以及电子设备、存储装置,其中,文本识别方法包括:获取待识别图像;其中,待识别图像内含有至少一个目标文本;对待识别图像进行特征提取,得到待识别图像的特征图;利用特征图进行目标检测,得到分别与至少一个目标文本对应的目标区域;识别目标区域中的目标文本和目标文本的文本类型。上述方案,能够提高文本识别的准确性。
-
公开(公告)号:CN114356201A
公开(公告)日:2022-04-15
申请号:CN202111592814.5
申请日:2021-12-23
Applicant: 科大讯飞股份有限公司
IPC: G06F3/0488 , G06F3/0354 , G06T5/00
Abstract: 本申请公开了一种书写美化方法、装置、设备和可读存储介质,该方法包括:采集多个书写轨迹点的信息,进行笔宽估计得到笔宽,并依次利用改进的三阶贝塞尔算法进行轨迹平滑得到多个插值轨迹点的信息,其中改进的三阶贝塞尔算法使用的控制点包括当前处理的书写轨迹点及其前三个书写轨迹点,多个插值轨迹点在当前处理的书写轨迹点之前的第一个书写轨迹点与第二个书写轨迹点之间,计算每个笔段的外轮廓,通过上述方式,每获取到一个书写轨迹点,就利用它更新改进的三阶贝塞尔算法的控制点,并对它之前的第一个书写轨迹点和第二个书写轨迹点之间进行平滑,能够降低电子屏书写平滑的延迟,也就能够降低电子屏书写美化的延迟。
-
-
-
-
-
-
-