-
公开(公告)号:CN112837334A
公开(公告)日:2021-05-25
申请号:CN202110361268.8
申请日:2021-04-02
Applicant: 河南大学
Abstract: 本发明公开了一种汉简图像的自动缀合方法,包括以下步骤:A:依据缺失部位信息对汉简图像进行分组;B:提取汉简图像的边缘线;C:获取边缘线骨架;D:测量边缘线骨架图像的宽度及高度;E:计算出每边缘线骨架图像的宽度值和高度值恢复到真实物理尺寸的缩放比例;F:得到每幅汉简图像对应的边缘线骨架标注图像;G:得到二维数值型的时间序列化数据;H:得到二维时间序列化数据;I:得到归一化后的时间序列化边缘曲线数据;J:利用归一化后的时间序列化边缘曲线数据计算两幅汉简图像的相似度;K:返回与汉简图像a相似度最高的前N幅图像。本发明能够极大地提高了汉简图像缀合的效率和准确性。
-
公开(公告)号:CN115587215B
公开(公告)日:2023-10-20
申请号:CN202211277112.2
申请日:2022-10-18
Applicant: 河南大学
Abstract: 本发明公开了一种基于语句通顺性的残断汉简图像缀合方法,包括以下步骤:A:对待缀合的汉简图像进行图像特征标注;B:构建训练集并训练得到调优训练后的BERT语言模型;C:针对指定的残断汉简图像A,通过对图像特征对比得到汉简图像A的待缀合比对组;D:利用调优训练后的BERT语言模型,将汉简图像A与汉简图像A的待缀合比对组内的汉简图像逐一进行语句通顺性检测,得到与汉简图像A语言通顺性最高的N个待选汉简图像,作为与汉简图像A缀合度最高的N个待选汉简图像。本发明能够基于汉简图像中文字的语句通顺性和汉简图像特征实现残断汉简图像的缀合,显著提高缀合效率及准确性。
-
公开(公告)号:CN115620057A
公开(公告)日:2023-01-17
申请号:CN202211276002.4
申请日:2022-10-18
Applicant: 河南大学
IPC: G06V10/764 , G06V10/74 , G06V10/82 , G06T7/73 , G06T7/13 , G06T3/40 , G06F16/583
Abstract: 本发明公开了一种基于语句通顺性的敦煌遗书残片图像缀合方法,包括以下步骤:A:将残片图像按缺失类型进行分类;B:获取残片图像的列宽、列高和间隙;C:根据缺失类型是否对应对残片图像A与B进行判断;D:对残片图像A和B的列宽列高比的比值和列宽间隙比的比值进行判断;E:对等比放大后残片图像B与A的列高比值、间隙比值和列宽比值进行判断;F:利用笔迹判断神经网络模型判断残片图像A与B的笔迹相似度;G:对残片图像A和B进行边缘相似度计算和语句通顺性检测;H:所有待缀合残片图像比较完毕后,得到敦煌遗书残片图像A的所有备选缀合图像。本发明综合考虑待缀合残片图像文字内容的语句通顺性和边缘相似度,提高敦煌遗书残片图像缀合的效率和准确性。
-
公开(公告)号:CN116246280A
公开(公告)日:2023-06-09
申请号:CN202310178161.9
申请日:2023-02-28
Applicant: 河南大学
IPC: G06V30/19 , G06V30/18 , G06V10/42 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/0895
Abstract: 本发明公开了一种多特征挖掘与协同约束的敦煌遗书残片缀合方法,包括以下步骤:A:对待缀合的敦煌遗书残片的图像进行预处理;B:构建多特征提取网络,包含异构特征挖掘模块、特征聚合模块和特征编码模块;C:利用对比学习模块优化多特征提取网络;D:将预处理后的待缀合敦煌遗书残片的图像,输入优化后的多特征提取网络进行关键特征的提取,并利用编码后的聚合特征判断得到多幅待缀合敦煌遗书残片的缀合匹配度。本发明利用多特征提取网络充分挖掘敦煌遗书残片的书写风格特征、文本布局特征、残边边缘特征和语句通顺性特征并进行聚合得到聚合特征,最终得到敦煌遗书残片的缀合匹配度,从而实现敦煌遗书残片的精准缀合。
-
公开(公告)号:CN115587215A
公开(公告)日:2023-01-10
申请号:CN202211277112.2
申请日:2022-10-18
Applicant: 河南大学
Abstract: 本发明公开了一种基于语句通顺性的残断汉简图像缀合方法,包括以下步骤:A:对待缀合的汉简图像进行图像特征标注;B:构建训练集并训练得到调优训练后的BERT语言模型;C:针对指定的残断汉简图像A,通过对图像特征对比得到汉简图像A的待缀合比对组;D:利用调优训练后的BERT语言模型,将汉简图像A与汉简图像A的待缀合比对组内的汉简图像逐一进行语句通顺性检测,得到与汉简图像A语言通顺性最高的N个待选汉简图像,作为与汉简图像A缀合度最高的N个待选汉简图像。本发明能够基于汉简图像中文字的语句通顺性和汉简图像特征实现残断汉简图像的缀合,显著提高缀合效率及准确性。
-
公开(公告)号:CN112837334B
公开(公告)日:2022-07-05
申请号:CN202110361268.8
申请日:2021-04-02
Applicant: 河南大学
Abstract: 本发明公开了一种汉简图像的自动缀合方法,包括以下步骤:A:依据缺失部位信息对汉简图像进行分组;B:提取汉简图像的边缘线;C:获取边缘线骨架;D:测量边缘线骨架图像的宽度及高度;E:计算出每边缘线骨架图像的宽度值和高度值恢复到真实物理尺寸的缩放比例;F:得到每幅汉简图像对应的边缘线骨架标注图像;G:得到二维数值型的时间序列化数据;H:得到二维时间序列化数据;I:得到归一化后的时间序列化边缘曲线数据;J:利用归一化后的时间序列化边缘曲线数据计算两幅汉简图像的相似度;K:返回与汉简图像a相似度最高的前N幅图像。本发明能够极大地提高了汉简图像缀合的效率和准确性。
-
-
-
-
-