-
公开(公告)号:CN108052955A
公开(公告)日:2018-05-18
申请号:CN201711070466.9
申请日:2017-11-03
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种高精度盲文识别方法及系统,包括:利用采集设备获取纸版盲文的数字化图像;对数字化图像的盲文进行盲文点标注,并将标注完成的数字化图像作为训练样本,其中盲文点为凸点或凹点;根据训练样本中盲文点的标注信息,将数字化图像划分为包含盲文点的正样本和包含背景点的负样本;提取正样本和负样本的多种特征,分别训练多个分类器;对待检测盲文图像的盲文方进行定位,将以各盲文方对应的6个盲文点为中心的区域作为待检测区域,将待检测区域的多种特征分别输入至相应分类器;通过融合各分类器的识别结果,确定待检测盲文图像内盲文点的位置和类型信息。由此通过融合多分类器的检测结果,实现对盲文的高精度识别。
-
公开(公告)号:CN107958261A
公开(公告)日:2018-04-24
申请号:CN201711071085.2
申请日:2017-11-03
Applicant: 中国科学院计算技术研究所
IPC: G06K9/62
Abstract: 本发明涉及一种盲文点检测方法及系统,包括:利用采集设备获取纸版盲文的数字化图像;对该数字化图像的盲文进行盲文点标注;根据标注好的盲文图像,截取以盲文点为中心的盲文点图像区域作为正样本,截取除该盲文点图像区域以外的背景图像区域作为负样本;提取该正样本和该负样本的多个特征,训练级联分类器;在待检测的盲文图像上,利用该级联分类器进行盲文点的检测和定位。由此本发明可实现对盲文数字化图像的盲文点自动标注。
-
公开(公告)号:CN104538032B
公开(公告)日:2018-02-06
申请号:CN201410806233.0
申请日:2014-12-19
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了融合用户反馈的汉语语音识别方法及系统,涉及语音识别领域,包括步骤1,获取输入语音,根据所述输入语音,生成词网格,并将所述词网格转换为字的候选列表;步骤2,获取用户对所述候选列表中的所述用户反馈,所述用户反馈包括:所述用户选择所述候选列表中与所述输入语音相对应的正确字,或输入与所述输入语音相对应的所述正确字;步骤3,将所述正确字以及所述正确字对应的候选列之前的各候选列的第一个候选字作为已确定文字,并以所述已确定文字为约束和指导,调整未确定文字对应的所述候选列表,生成新的候选列表;步骤4,重复所述步骤2、3,直到正确识别所述输入语音或所述用户输入新输入语音,以完成语音识别。
-
公开(公告)号:CN105404621A
公开(公告)日:2016-03-16
申请号:CN201510623525.5
申请日:2015-09-25
Applicant: 中国科学院计算技术研究所
IPC: G06F17/28
Abstract: 本发明提出一种用于盲人读取汉字的方法及系统,涉及自然语言处理技术领域和面向残疾人的人机交互技术领域,该方法包括获取汉语文本,对所述汉语文本进行分词操作,生成汉字串,通过发音词典、多音字字典与词频信息,参考分词得到的词性标注,将所述汉字串中的每个词转换为对应的拼音并连接为拼音串;通过查找拼音和盲符的对照字典,将所述拼音串转换为盲符串,通过分词模型对所述盲符串进行盲文分词,生成初始盲文分词,将所述汉字串与所述初始盲文分词进行融合,生成新盲文分词,根据盲文分词连写规则对所述新盲文分词进行调整;对根据盲文分词连写规则调整后的所述新盲文分词进行盲文标调,生成最终盲文分词,将所述最终盲文分词进行显示。
-
公开(公告)号:CN102063726B
公开(公告)日:2012-08-22
申请号:CN201010620374.5
申请日:2010-12-31
Applicant: 中国科学院计算技术研究所
IPC: G06T7/20
Abstract: 本发明公开了一种运动目标分类方法和系统。所述方法包括下列步骤:提取运动目标灰度图像中的运动目标的边缘信息;根据所述边缘信息,提取运动目标边缘上的直线信息;根据所述运动目标的特点,结合所述直线信息构造分类特征;根据所述分类特征,对所述运动目标进行分类,确定运动目标类型。其能够对检测出的运动目标进行正确分类,并获得输出结果,为智能监控系统的后续处理提供基础。
-
公开(公告)号:CN102547466A
公开(公告)日:2012-07-04
申请号:CN201210048441.X
申请日:2012-02-27
Applicant: 中国科学院计算技术研究所
IPC: H04N21/472 , H04N21/422
Abstract: 本发明公开一种智能电视的交互方法与系统,包括如下步骤:步骤100,主控程序模块负责智能电视的交互控制,将智能电视的画面划分成主显示区、提示区、候选区,划分的区域根据应用需要来更换相应位置,等待步骤200的执行;步骤200,信号接收与解析模块负责接收按键信息,并进行相应的处理;步骤300,注册表存放节目表以及应用程序的列表,根据步骤200的请求执行相应的电视节目以及应用程序的列表;步骤400,注册表管理模块负责增加节目表或应用程序列表,动态调整使用频度,同时管理注册表指针;步骤500,显示模块负责按照注册表指针所指定的位置显示相应的内容。
-
公开(公告)号:CN1540571A
公开(公告)日:2004-10-27
申请号:CN200310104462.X
申请日:2003-10-29
Applicant: 中国科学院计算技术研究所
IPC: G06K9/00
Abstract: 一种基于局部特征分析的计算机笔迹鉴别方法,主要解决了特征字的局部书写特征的提取和描述问题。首先用线性归一化方法将特征字图像归一化到64×64大小;然后根据笔划方向、位置和粗细等特性,设计了一组优化的2维Gabor滤波器,采用8个方向和一个频率,共8个Gabor小波;接着,为了得到特征字的局部书写特征,对特征字进行8像素间隔的空间采样,并提取64个采样点上的Gabor小波系数,这样得到512维特征向量;最后利用基于以均值作为类代表点的最近邻分类器进行比较和判别。该发明具有识别率高、计算复杂度低、物理意义明确等特点。
-
公开(公告)号:CN114970453B
公开(公告)日:2025-04-08
申请号:CN202210569910.6
申请日:2022-05-24
Applicant: 中国科学院计算技术研究所
IPC: G06F40/117 , G06F40/151 , G06F40/289 , G06F40/30 , G06N3/0464 , G06N3/0499 , G06N3/084
Abstract: 本发明提出一种通用盲文到汉字的转换方法和系统,其特征在于,包括:构建深度学习模型,由通用盲文文本生成拼音音节序列和分词标记序列,经由深度学习模型的嵌入层向量化后拼接得到融合盲文分词信息的拼音嵌入向量,分别输入深度学习模型的局部语义特征提取层和全局语义特征提取层;得到局部语义信息和上下文语义信息,将两者拼接后输入全连接层得到通用盲文文本对应的汉字文本。本发明通过拼音音节嵌入与分词信息嵌入拼接为一个总体的嵌入向量,以及局部语义特征提取层和全局语义特征提取层共享嵌入层结合的特征提取模块,实现了高准确率的通用盲文‑汉字转换。
-
公开(公告)号:CN114519860A
公开(公告)日:2022-05-20
申请号:CN202210066282.X
申请日:2022-01-20
Applicant: 中国科学院计算技术研究所
IPC: G06V30/418 , G06V30/414 , G06V30/42 , G06V30/148 , G06V30/19 , G06V10/82 , G06F40/126 , G06F16/903 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明提出一种基于深度学习的盲文读物校对方法,包括:对已知盲文图像进行盲符标注,生成标注图,构建已知数据集;以该已知数据集对深度学习模型进行训练,获得初始识别模型;以盲文读物对应的盲文图像为目标盲文图像,将该目标盲文图像划分为迁移学习图像和校对图像,以该迁移学习图像对该初始识别模型进行迁移学习训练,得到目标识别模型;以该目标识别模型对该校对图像进行识别,获得该校对图像的校对电子盲文;通过该电子盲文和该校对图像对应的原始电子盲文进行对比,以完成对该盲文读物的质检校对。还提出一种基于深度学习的盲文读物校对系统,以及一种实施盲文读物校对的数据处理装置。
-
公开(公告)号:CN113743463A
公开(公告)日:2021-12-03
申请号:CN202110879294.X
申请日:2021-08-02
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种面向医学影像序列的基于深度学习的患者级肿瘤良恶性自动判别方法及系统。首先进行患者影像数据的采集和整理及标注,然后使用肿瘤区域检测模型、序列分类模型、年龄信息这三个信息模块获得不同级别下患者肿瘤良恶性的概率,最后通过多模型加权融合进行患者级肿瘤良恶性综合判别。该技术将有助于在患者早期,基于影像检测数据对肿瘤良恶性进行预判,从而制定相应的治疗方案及提升预后效果,同时也能辅助提高医生早期利用影像数据进行肿瘤良恶性诊断的准确率。
-
-
-
-
-
-
-
-
-