-
公开(公告)号:CN111985462B
公开(公告)日:2024-08-06
申请号:CN202010739865.5
申请日:2020-07-28
Applicant: 天津恒达文博科技股份有限公司 , 西安文数保科技有限公司
IPC: G06V30/14 , G06V30/148 , G06V30/18 , G06V30/19 , G06V10/82 , G06F16/53 , G06F16/583 , G06F16/538 , G06N3/0464 , G06N3/0985
Abstract: 本发明提供了一种基于深度神经网络的古文字检测、识别和检索系统,最终能够在多个应用场景下实现较为精准地对古文字信息的检测、识别和方便地检索。从总体结构上划分,整个系统可分为开发者模块群、使用者模块群和演示控制模块,前者包括基于预检测的框标注模块、基于预识别的识别标注模块、数据库存储模块、检测器和识别器训练模块;中者分为基于机器码的古文字检索模块、基于手写的古文字检索模块、基于图像内容的字形检索模块、整图检测和识别模块;演示控制模块则通过用户的演示需要,对当前已经进行过的一部分功能的缓存数据进行屏蔽或开启。
-
公开(公告)号:CN115409914B
公开(公告)日:2023-01-06
申请号:CN202211359285.9
申请日:2022-11-02
Applicant: 天津恒达文博科技股份有限公司 , 西安文数保科技有限公司 , 河南文数保智能科技研究院有限公司
Abstract: 本发明公开了一种文物线描图的生成方法、装置、存储介质及电子设备。其中,该方法包括:获取目标文物的文物图像和文物图像所对应的纹理图像;将文物图像和纹理图像输入第一卷积神经网络,输出第一线稿,其中,第一卷积神经网络用于对文物图像和纹理图像进行背景分割处理,第一线稿至少包括目标文物的轮廓信息;将文物图像、纹理图像以及第一线稿输入第二卷积神经网络,输出第二线稿,其中,第二卷积神经网络用于对文物图像、纹理图像以及第一线稿进行线条信息纠正处理,第二线稿至少包括目标文物的细节信息;对第二线稿进行矢量化处理,得到目标文物的线描图。本发明解决了现有技术中人工绘制文物的线描图导致绘制成本高、效率低的技术问题。
-
公开(公告)号:CN111860487A
公开(公告)日:2020-10-30
申请号:CN202010738047.3
申请日:2020-07-28
Applicant: 天津恒达文博科技股份有限公司 , 西安文数保科技有限公司
Abstract: 本发明提供了一种基于深度神经网络的碑文标注、检测、识别系统,最终能够实现较为精准地对碑文位置、字义和字形等信息地有效自动提取,为后续的碑文检索工作的基础。从总体结构上划分,整个系统可分为标注模块群、训练模块群和测试模块群,前者包括基于预定位的字符位置标注模块、基于预识别的字标注模块、基于连通分量的分割标注模块;中者包括检测器训练模块和分类器训练模块;后者为对输入图像进行检测识别分割的测试部分,以及建立在此基础上的检索功能。
-
公开(公告)号:CN115410216B
公开(公告)日:2023-02-10
申请号:CN202211341307.9
申请日:2022-10-31
Applicant: 天津恒达文博科技股份有限公司 , 西安文数保科技有限公司 , 河南文数保智能科技研究院有限公司
IPC: G06V30/414 , G06V30/148 , G06V30/19 , G06V10/82 , G06N3/08
Abstract: 本发明公开了一种古籍文本信息化处理方法、系统、电子设备及存储介质,该方法包括:利用古籍文本信息化模型对古籍文本图像训练样本进行预标注处理,得到预标注结果;对预标注结果进行专家校验,得到人工标注结果;利用深度神经网络对古籍文本信息化模型进行训练,得到经过训练的古籍文本信息化模型;将古籍文本图像验证样本输入到经过训练的古籍文本信息化模型中,对经过训练的古籍文本信息化模型进行测试,得到古籍文本处理结果;重复进行预标注操作、人工标注操作、模型训练操作以及模型测试操作,得到训练完成的古籍文本信息化模型;利用训练完成的古籍文本信息化模型对待处理的古籍文本图像进行信息化处理,得到信息化处理结果。
-
公开(公告)号:CN115409914A
公开(公告)日:2022-11-29
申请号:CN202211359285.9
申请日:2022-11-02
Applicant: 天津恒达文博科技股份有限公司 , 西安文数保科技有限公司 , 河南文数保智能科技研究院有限公司
Abstract: 本发明公开了一种文物线描图的生成方法、装置、存储介质及电子设备。其中,该方法包括:获取目标文物的文物图像和文物图像所对应的纹理图像;将文物图像和纹理图像输入第一卷积神经网络,输出第一线稿,其中,第一卷积神经网络用于对文物图像和纹理图像进行背景分割处理,第一线稿至少包括目标文物的轮廓信息;将文物图像、纹理图像以及第一线稿输入第二卷积神经网络,输出第二线稿,其中,第二卷积神经网络用于对文物图像、纹理图像以及第一线稿进行线条信息纠正处理,第二线稿至少包括目标文物的细节信息;对第二线稿进行矢量化处理,得到目标文物的线描图。本发明解决了现有技术中人工绘制文物的线描图导致绘制成本高、效率低的技术问题。
-
公开(公告)号:CN111860487B
公开(公告)日:2022-08-19
申请号:CN202010738047.3
申请日:2020-07-28
Applicant: 天津恒达文博科技股份有限公司 , 西安文数保科技有限公司
Abstract: 本发明提供了一种基于深度神经网络的碑文标注、检测、识别系统,最终能够实现较为精准地对碑文位置、字义和字形等信息地有效自动提取,为后续的碑文检索工作的基础。从总体结构上划分,整个系统可分为标注模块群、训练模块群和测试模块群,前者包括基于预定位的字符位置标注模块、基于预识别的字标注模块、基于连通分量的分割标注模块;中者包括检测器训练模块和分类器训练模块;后者为对输入图像进行检测识别分割的测试部分,以及建立在此基础上的检索功能。
-
公开(公告)号:CN115410216A
公开(公告)日:2022-11-29
申请号:CN202211341307.9
申请日:2022-10-31
Applicant: 天津恒达文博科技股份有限公司 , 西安文数保科技有限公司 , 河南文数保智能科技研究院有限公司
IPC: G06V30/414 , G06V30/148 , G06V30/19 , G06V10/82 , G06N3/08
Abstract: 本发明公开了一种古籍文本信息化处理方法、系统、电子设备及存储介质,该方法包括:利用古籍文本信息化模型对古籍文本图像训练样本进行预标注处理,得到预标注结果;对预标注结果进行专家校验,得到人工标注结果;利用深度神经网络对古籍文本信息化模型进行训练,得到经过训练的古籍文本信息化模型;将古籍文本图像验证样本输入到经过训练的古籍文本信息化模型中,对经过训练的古籍文本信息化模型进行测试,得到古籍文本处理结果;重复进行预标注操作、人工标注操作、模型训练操作以及模型测试操作,得到训练完成的古籍文本信息化模型;利用训练完成的古籍文本信息化模型对待处理的古籍文本图像进行信息化处理,得到信息化处理结果。
-
公开(公告)号:CN111985462A
公开(公告)日:2020-11-24
申请号:CN202010739865.5
申请日:2020-07-28
Applicant: 天津恒达文博科技股份有限公司 , 西安文数保科技有限公司
IPC: G06K9/20 , G06K9/34 , G06K9/46 , G06K9/62 , G06F16/53 , G06F16/583 , G06F16/538 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种基于深度神经网络的古文字检测、识别和检索系统,最终能够在多个应用场景下实现较为精准地对古文字信息的检测、识别和方便地检索。从总体结构上划分,整个系统可分为开发者模块群、使用者模块群和演示控制模块,前者包括基于预检测的框标注模块、基于预识别的识别标注模块、数据库存储模块、检测器和识别器训练模块;中者分为基于机器码的古文字检索模块、基于手写的古文字检索模块、基于图像内容的字形检索模块、整图检测和识别模块;演示控制模块则通过用户的演示需要,对当前已经进行过的一部分功能的缓存数据进行屏蔽或开启。
-
公开(公告)号:CN115577680B
公开(公告)日:2023-03-10
申请号:CN202211567901.X
申请日:2022-12-08
Applicant: 天津恒达文博科技股份有限公司 , 河南文数保智能科技研究院有限公司
IPC: G06F40/126 , G06F40/30
Abstract: 本发明公开了一种古籍文本断句方法与装置、古籍文本断句模型训练方法,上述古籍文本断句方法包括:将预处理古籍文本输入语言模型,以便语言模型对预处理古籍文本进行初编码后输出初编码字向量;基于初编码字向量、原始古籍文本中汉字的字型结构特征对应的字符表征向量,获得融合特征向量;将融合特征向量输入风格化编码网络,以便通过风格化编码网络对融合特征向量进行古文风格化的特征转换后输出风格化特征向量;对风格化特征向量进行头尾语义特征提取和双仿射注意力机制处理后得到特征结果矩阵;基于对特征结果矩阵进行解码处理后得到的解码结果,对预处理古籍文本或原始古籍文本进行断句处理并添加标点符号,以输出目标古籍文本。
-
公开(公告)号:CN115577680A
公开(公告)日:2023-01-06
申请号:CN202211567901.X
申请日:2022-12-08
Applicant: 天津恒达文博科技股份有限公司 , 河南文数保智能科技研究院有限公司
IPC: G06F40/126 , G06F40/30
Abstract: 本发明公开了一种古籍文本断句方法与装置、古籍文本断句模型训练方法,上述古籍文本断句方法包括:将预处理古籍文本输入语言模型,以便语言模型对预处理古籍文本进行初编码后输出初编码字向量;基于初编码字向量、原始古籍文本中汉字的字型结构特征对应的字符表征向量,获得融合特征向量;将融合特征向量输入风格化编码网络,以便通过风格化编码网络对融合特征向量进行古文风格化的特征转换后输出风格化特征向量;对风格化特征向量进行头尾语义特征提取和双仿射注意力机制处理后得到特征结果矩阵;基于对特征结果矩阵进行解码处理后得到的解码结果,对预处理古籍文本或原始古籍文本进行断句处理并添加标点符号,以输出目标古籍文本。
-
-
-
-
-
-
-
-
-