-
公开(公告)号:CN113657404A
公开(公告)日:2021-11-16
申请号:CN202111212848.7
申请日:2021-10-19
Applicant: 中央民族大学
Abstract: 本发明实施例公开了一种东巴象形文字的图像处理方法,该方法包括:获取待处理东巴象形文字数据集,其中,待处理东巴象形文字数据集包括至少一个待处理文字图像;针对每个待处理文字图像,根据待处理文字图像的分辨率结合预确定的目标分辨率对待处理文字图像进行分块划分,得到至少一个分块图像以及各分块图像对应的像素系数矩阵;根据各分块图像和对应的像素系数矩阵确定目标文字图像,并根据各目标文字图像形成目标东巴象形文字数据集。本发明能有效建立大规模、高质量的东巴象形文字数据集,可用于实现东巴文字的高精度识别,也是实现东巴经典机器翻译的基础,有助于东巴文化的传承和保护。
-
公开(公告)号:CN116884211A
公开(公告)日:2023-10-13
申请号:CN202310820208.7
申请日:2023-07-05
Applicant: 中央民族大学
IPC: G08G1/01 , G06Q50/26 , G06F18/22 , G06F18/214 , G06F16/29
Abstract: 本发明公开了一种交通序列预测方法、装置、电子设备及存储介质。该方法包括:根据源城市以及目标城市的交通数据,从源城市中确定目标区域,进而构建虚拟城市;比较虚拟城市与目标城市的地理数据得到网络权重;基于网络权重、虚拟城市以及目标城市的时序数据训练预测模型;最后预测目标城市的交通序列。上述技术方案根据目标区域构建虚拟城市,以在虚拟城市中保持源城市中更多有利于对目标城市预测的交通数据,使得交通数据迁移更稳定合理;通过基于网络权重、虚拟城市以及目标城市的时序数据训练预测模型,缓解了负迁移的现象,提高了交通序列预测的准确性和效率;最后通过预测模型实现了准确且高效的交通序列预测。
-
公开(公告)号:CN120068854A
公开(公告)日:2025-05-30
申请号:CN202510536901.0
申请日:2025-04-27
Applicant: 中央民族大学
IPC: G06F40/279 , G06F40/216 , G06F40/30
Abstract: 本申请公开了一种象形文字词组释义的挖掘方法、装置、设备、介质及产品。该象形文字词组释义的挖掘方法包括:通过Transformer模型确定语料库中象形文字的字间概率分布,并根据字间概率分布确定候选词组;对于每个所述候选词组,确定所述候选词组对应的图像片段以及所述候选词组对应的单句释义文本;通过图文对齐模型,确定所述候选词组在所述单句释义文本中所对应的分词,得到所述候选词组对应的释义。上述技术方案根据字间概率分布确定候选词组,并利用图文对齐模型从相应的单句释义文本中匹配候选词组对应的分词,得到候选词组的释义,实现了对于象形文字词组释义有效和准确的挖掘。
-
公开(公告)号:CN118097683A
公开(公告)日:2024-05-28
申请号:CN202410219359.1
申请日:2024-02-28
Applicant: 中央民族大学
Abstract: 本公开实施例公开了一种数据集构建、文字识别方法、装置、设备及介质,该方法包括扫描设定语言的书籍图像并进行切分得到多个单字图像;通过神经网络模型提取多个单字图像的特征,神经网络模型基于训练样本和设定损失函数训练得到,训练样本包括各单字图像以及各单字图像的扩增图像,设定损失函数包括对比学习损失函数和聚类损失函数;根据各单字图像的特征分布对多个单字图像进行聚类;根据聚类结果构建单字数据集。通过神经网络模型提取单字图像的特征并通过聚类构建设定语言的单字数据集,节省了人力物力,且由于神经网络模型基于对比学习损失函数和聚类损失函数进行训练,具备准确确定单字类别和提取单字特征的能力,从而构建高质量数据集。
-
公开(公告)号:CN113837186A
公开(公告)日:2021-12-24
申请号:CN202111427357.4
申请日:2021-11-29
Applicant: 中央民族大学
Abstract: 本公开是关于一种基于卷积神经网络的东巴象形文字识别方法及装置。基于卷积神经网络的东巴象形文字识别方法包括:获取待识别图像,待识别图像中包括东巴象形文字;基于深度残差网络模型对待识别图像进行特征识别,得到东巴象形文字对应的文字释义,深度残差网络模型包括至少一个残差跳跃连接结构,残差跳跃连接结构包括多个相邻堆叠的卷积层。通过本公开实施例,能够提高东巴象形文字识别的准确率。
-
公开(公告)号:CN116682128A
公开(公告)日:2023-09-01
申请号:CN202310653537.7
申请日:2023-06-02
Applicant: 中央民族大学
Abstract: 本发明公开了一种水书单字的数据集构建、识别方法、装置、设备及介质。水书单字的数据集构建方法,包括:扫描水书图像并将其二值化;对水书图像进行垂直投影得到正弦拟合曲线,根据正弦拟合曲线对水书图像进行列切分得到水书文字列图像;对单个水书文字列图像进行水平投影以及行切分,得到水书单字;对水书单字进行聚类并为每个类别添加标签,得到水书单字的数据集。上述技术方案根据垂直投影的正弦拟合曲线对水书图像进行列切分、通过水平投影进行行切分,保证了水书单字的切分精度,然后利用聚类算法为水书单字添加标签,保证了聚类结果的准确性,在此基础上构建高质量的水书单字数据集。
-
公开(公告)号:CN114332888A
公开(公告)日:2022-04-12
申请号:CN202210255545.1
申请日:2022-03-16
Applicant: 中央民族大学
IPC: G06V30/41 , G06V30/146 , G06V30/148
Abstract: 本申请实施例公开了一种东巴文的文字切分方法、装置、存储介质及电子设备。该方法包括:按照东巴文图像中的横线位置和竖线位置对东巴文图像进行切分,得到东巴文单句图像;其中,所述横线位置用于区分东巴文图像中的段落;所述竖线位置用于区分东巴文图像的段落中的每句文字;对所述东巴文单句图像进行膨胀处理,得到待切分单句图像;对所述待切分单句图像中的连通区域进行分析处理,得到东巴文的单个文字。本技术方案,可以对东巴文的单个文字进行切分,为东巴文化的研究提供了便利性。
-
公开(公告)号:CN113657404B
公开(公告)日:2022-02-22
申请号:CN202111212848.7
申请日:2021-10-19
Applicant: 中央民族大学
IPC: G06V30/148 , G06V10/28
Abstract: 本发明实施例公开了一种东巴象形文字的图像处理方法,该方法包括:获取待处理东巴象形文字数据集,其中,待处理东巴象形文字数据集包括至少一个待处理文字图像;针对每个待处理文字图像,根据待处理文字图像的分辨率结合预确定的目标分辨率对待处理文字图像进行分块划分,得到至少一个分块图像以及各分块图像对应的像素系数矩阵;根据各分块图像和对应的像素系数矩阵确定目标文字图像,并根据各目标文字图像形成目标东巴象形文字数据集。本发明能有效建立大规模、高质量的东巴象形文字数据集,可用于实现东巴文字的高精度识别,也是实现东巴经典机器翻译的基础,有助于东巴文化的传承和保护。
-
公开(公告)号:CN117197820A
公开(公告)日:2023-12-08
申请号:CN202311122407.7
申请日:2023-09-01
Applicant: 中央民族大学
IPC: G06V30/244 , G06V30/19 , G06V30/14 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种用于残缺东巴文字的识别方法、系统、电子设备及介质,识别方法包括:网络构建步骤:构建东巴文补全识别网络并对东巴文补全识别网络进行训练,东巴文补全识别网络包括级联补全模块和识别模块;东巴文字补全步骤:通过级联补全模块提取出残缺东巴文字后,对残缺东巴文字进行像素补全获得完整的东巴文字;东巴文字识别步骤:通过识别模块将完整的东巴文字及残缺东巴文字进行拼接后,对拼接后的完整的东巴文字及残缺东巴文字进行识别获得中文释义。
-
公开(公告)号:CN115171128A
公开(公告)日:2022-10-11
申请号:CN202210986564.1
申请日:2022-08-17
Applicant: 中央民族大学
Abstract: 本发明公开了一种象形文字识别方法、装置、设备和介质。该方法包括:将文字图片输入至识别模型中;通过所述识别模型的串接的至少两个特征提取单元对文字图片进行特征提取,得到目标特征;其中,所述特征提取单元包括混合感知映射单元和/或空间感知聚合单元;混合感知映射单元用于获取全局有效特征和全局关键位置特征;空间感知聚合单元用于获取局部关键细节特征;不同特征提取单元用于提取不同尺寸的特征;通过所述识别模型的分类层,对所述目标特征进行分类,确定所述文字图片对应的文字识别结果。通过本发明实施例能够在对文字图片进行特征提取后,提高特征提取结果的丰富性,从而提高识别模型对文字图片进行识别的准确率。
-
-
-
-
-
-
-
-
-