-
公开(公告)号:CN114429127B
公开(公告)日:2025-04-08
申请号:CN202111566326.7
申请日:2021-12-20
Applicant: 中国科学院计算技术研究所
IPC: G06F40/289 , G06N3/045 , G06N3/084
Abstract: 本发明提出一种汉字到通用盲文的转换方法和系统,包括:构建深度学习模型,且该深度学习模型具有两个共享特征编码的子任务分支,其中一条子任务分支用于根据盲文规则将汉语文本分词,另一条子任务分支用于为每个汉字标注拼音及对应声调;使用已标记盲文分词的汉字语料和汉字拼音的对照语料,交替训练该深度学习模型的两个子任务分支,直到两子任务分支的损失函数均收敛或达到预设迭代次数,保存当前深度学习模型作为识别模型;将待通用盲文转换的汉字数据输入该识别模型,得到该汉字数据的分词信息和带调拼音信息,并基于该分词信息和该带调拼音信息,以将该汉字数据转换为对应的通用盲文文本。本发明可以实现汉字到盲文的实时准确转换。
-
公开(公告)号:CN114429128A
公开(公告)日:2022-05-03
申请号:CN202111566342.6
申请日:2021-12-20
Applicant: 中国科学院计算技术研究所
IPC: G06F40/289 , G06F40/242 , G06F16/903 , G06F16/2455 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种汉字‑通用盲文对照语料库的构建方法和系统,本发明一方面充分利用了现有汉字‑现行盲文对照语料库中的分词信息,另一方面采用一种半自动的方式得到现行盲文所对应的带声调的拼音,进而得到通用盲文。本发明先由计算机自动给没有标注声调的拼音添加声调,然后自动判断哪些拼音的声调可能存在错误,将这些可能存在错误的拼音及其对应的汉字显示在屏幕上,供人工校对修改。通过这种方式,把需要人工校对修改的拼音的比率控制在很小的范围内,可以实现快速的语料库构建。
-
公开(公告)号:CN114429127A
公开(公告)日:2022-05-03
申请号:CN202111566326.7
申请日:2021-12-20
Applicant: 中国科学院计算技术研究所
IPC: G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种汉字到通用盲文的转换方法和系统,包括:构建深度学习模型,且该深度学习模型具有两个共享特征编码的子任务分支,其中一条子任务分支用于根据盲文规则将汉语文本分词,另一条子任务分支用于为每个汉字标注拼音及对应声调;使用已标记盲文分词的汉字语料和汉字拼音的对照语料,交替训练该深度学习模型的两个子任务分支,直到两子任务分支的损失函数均收敛或达到预设迭代次数,保存当前深度学习模型作为识别模型;将待通用盲文转换的汉字数据输入该识别模型,得到该汉字数据的分词信息和带调拼音信息,并基于该分词信息和该带调拼音信息,以将该汉字数据转换为对应的通用盲文文本。本发明可以实现汉字到盲文的实时准确转换。
-
-