藏文文本的数据集生成方法及系统

    公开(公告)号:CN118096940A

    公开(公告)日:2024-05-28

    申请号:CN202410010777.X

    申请日:2024-01-04

    Abstract: 本申请涉及一种藏文文本的数据集生成方法及系统,应用于数据生成技术领域,其包括基于预设的藏文数据统计藏文字符的出现频率,获取高频藏文主体字符和藏文辅助字符;对所述藏文数据进行预处理,获取藏文处理信息,所述藏文处理信息至少包括:藏文背景图、文本颜色以及文本字号;根据预设的藏文分布模式、所述藏文辅助字符、所述高频藏文主体字符以及所述藏文处理信息,生成藏文文本图片。本申请保证在不需要外部藏文语言数据的情况下生成高质量、变体多样化且数据量充足的藏文文本数据,从而建立高可用性的通用藏文文本数据集,进而提高藏文目标检测模型的训练效果,以满足各种藏文应用领域的需求并促进藏文语言的发展和推广。

    一种用于文档信息隐藏的矢量字体生成方法

    公开(公告)号:CN115879416A

    公开(公告)日:2023-03-31

    申请号:CN202310058099.X

    申请日:2023-01-15

    Abstract: 本发明公开了一种用于文档信息隐藏的矢量字体生成方法,通过训练基于图像载体的编码器‑解码器,对原始字体图像进行隐形编码,使其携带不同的比特信息;在训练过程中引入噪声层,与编码器和解码器一起工作,用于模拟日常文档使用场景中的失真;在训练完成后,使用可微渲染器来建立编码后字体图像和原始矢量字体之间的联系;通过优化算法将编码后字体图像中的信息传递到相应的矢量字体上,得到经过编码的矢量字体;利用经过编码的矢量字体来替换文档中的原始字体,在文档中嵌入不可见信息,该信息在文档经过各种失真后仍然能够被正确提取。该方法能极大程度减少字体设计的人工代价,并在真实场景中保证更高的溯源成功率和取证成功率。

    字体变形方法及其构成的水印嵌入和提取方法

    公开(公告)号:CN114201944A

    公开(公告)日:2022-03-18

    申请号:CN202111373924.2

    申请日:2021-11-19

    Abstract: 本发明特别涉及一种字体变形方法,包括如下步骤:S110、对标准字体进行处理得到方形图片;S120、沿任意一条平行于方形图片任一边缘的直线将方形图片分割成两个子图;S130、沿与所述直线垂直的方向对两个子图进行缩放和/或形态学处理使得方形图片的质心发生改变;S140、将质心改变后的方形图片转化为字体即得到标准字体的变形字;还公开了基于该变形字的水印嵌入和提取方法。图片质心的改变,对应了一种信息的变化,后期可以通过该变化来嵌入信息和提取信息;这种处理方式能适用于各种语言、各种类型的字体,且生成变形字的过程是全自动的,无需消耗人力成本,使用起来非常方便。

Patent Agency Ranking