-
公开(公告)号:CN104463101A
公开(公告)日:2015-03-25
申请号:CN201410624173.0
申请日:2014-11-06
Applicant: 科大讯飞股份有限公司
CPC classification number: G06K9/6814
Abstract: 本发明公开了一种用于文字性试题的答案识别方法及系统,该方法包括:获取文字性试题答案图像;从所述答案图像中获得一个或多个待识别答案字符串;基于通用的声学模型对所述待识别答案字符串进行手写识别,得到第一识别结果;获取文字性试题的答案信息;根据所述第一识别结果及所述文字性试题的答案信息,构建自适应声学模型;利用所述自适应声学模型对所述待识别答案字符串进行手写识别,得到最终识别结果。利用本发明,可以有效提高文字性客观题的识别准确度,进而提高阅卷效率及准确性。
-
公开(公告)号:CN118098290A
公开(公告)日:2024-05-28
申请号:CN202410151287.1
申请日:2024-02-02
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种朗读评测方法、装置、设备、存储介质及计算机程序产品,该方法包括:获取朗读文本对应的目标音素序列;所述目标音素序列中对应多发音单词的目标音素位置具有多个音素;基于每个音素位置上所有音素的嵌入向量表示,生成所述目标音素序列的嵌入向量表示;对所述目标音素序列的嵌入向量表示和朗读语音的声学特征进行联合解码,确定标准朗读音素序列;基于所述标准朗读音素序列进行朗读评测。整个过程不再依赖于强制切分,避免了不良切分效果所造成的影响,提升了评测结果的稳定性。
-
公开(公告)号:CN114333780A
公开(公告)日:2022-04-12
申请号:CN202111679138.5
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
IPC: G10L15/02 , G10L15/06 , G10L15/183 , G10L15/26 , G10L25/24
Abstract: 本申请实施例公开了一种发音检错的方法、装置及电子设备。该方法包括:获取标准语音和待检测的用户语音,所述标准语音和所述用户语音对应于同一朗读文本;确定用于表征所述标准语音的内容信息的第一内容特征向量,以及确定用于表征所述用户语音的内容信息的第二内容特征向量;利用所述第一内容特征向量和所述第二内容特征向量对所述用户语音进行发音检错,用以提高检错结果的准确性。
-
公开(公告)号:CN113053409A
公开(公告)日:2021-06-29
申请号:CN202110274188.9
申请日:2021-03-12
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种音频测评方法及装置,所述方法包括:获取第一音频和第二音频,所述第一音频为待测评音频,所述第二音频为所述第一音频的标准音频,所述第一音频和所述第二音频均对应预设文本;根据所述第一音频和所述第二音频,确定音频关联矩阵;根据所述音频关联矩阵预测所述预设文本的读音;根据所述预设文本的读音对所述第一音频进行评分,得到评分结果。本申请通过引入第一音频的标准音频,结合第一音频的标注音频与第一音频来预测第一音频所对应文字的读音,可以更好的了解每个音频的发音特点,从而降低了对错误发音的容错性、提高了音频测评的准确度,同时也实现了音频的自动化测评。
-
公开(公告)号:CN107341487B
公开(公告)日:2021-05-04
申请号:CN201610290893.7
申请日:2016-04-28
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种涂抹字符的检测方法及系统,该方法包括:获取待检测文档图像;获取所述文档图像的二值图;获取所述文档图像的二值图的联通体成分单元,所述联通体成分单元包括:独立联通体成分单元和/或组合联通体成分单元;提取联通体成分单元特征;基于所述联通体成分单元特征检测涂抹字符。本发明可以针对各种联通体进行检测,此外,对多个联通体组成的组合联通体成分单元与独立联通体成分单元进行区别检测,能提高检测效率。
-
公开(公告)号:CN111833859A
公开(公告)日:2020-10-27
申请号:CN202010713116.5
申请日:2020-07-22
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种发音检错方法、装置、电子设备及存储介质,所述方法包括:基于朗读文本,对待检错的语音文件及其对应的发音视频文件进行切分,得到朗读文本包含的任一音素对应的语音片段和发音视频片段;将该音素及其对应的语音片段和发音视频片段输入至发音检错模型,得到发音检错模型输出的该音素的发音检错结果;发音检错模型用于基于语音片段的噪声水平,对语音片段和发音视频片段进行特征融合,并基于融合后的特征对该音素进行发音检错。本发明实施例提供的方法、装置、电子设备及存储介质,提高了发音检错方法的准确性和稳定性。
-
公开(公告)号:CN107622271B
公开(公告)日:2020-07-14
申请号:CN201610563053.3
申请日:2016-07-15
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种手写文本行提取方法及系统,该方法包括:接收包含手写文本的图像;利用预先构建的语义分割模型对所述图像进行语义分割,并根据语义分割结果确定各分割区域及其区域类别,所述区域类别包括:背景区域、文本行区域及文本行间隔区域;根据各分割区域的区域类别,提取文本行分割线;根据所述文本行分割线提取文本行。相较于现有技术,本发明方案不仅通用性强,而且可以有效提高文本行提取的准确性。
-
公开(公告)号:CN105989347B
公开(公告)日:2019-11-15
申请号:CN201510091479.9
申请日:2015-02-28
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种客观题智能阅卷方法及系统,该方法包括:获取答题卡图像;对所述答题卡图像进行灰度化处理,得到灰度图;根据答题卡模板参数对所述灰度图的答题区域进行分割,得到答题区域子图像;提取所述子图像中各选项的填涂特征,所述填涂特征用于描述单个选项的填涂程度;基于统计模型及所述填涂特征对所述选项进行识别,得到所述选项的填涂程度得分;根据所述选项的填涂程度得分确定填涂的选项。利用本发明,可以提升选项答案判定的准确度。
-
公开(公告)号:CN109408638A
公开(公告)日:2019-03-01
申请号:CN201811230610.5
申请日:2018-10-22
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种定标集更新方法及装置,属于人工智能技术领域。该方法包括:获取当前考试的考卷,将每一考卷中的文本内容转化为高维表示向量,并将定标集中每一样本考卷转化为高维表示向量;对所有高维表示向量进行聚类,根据每一考卷对应的聚类结果与定标集之间的距离,计算每一考卷对应的目标距离;将目标距离大于预设阈值的考卷作为目标样本考卷,根据目标样本考卷更新定标集。由于可确定当前考试的所有考卷中未被定标集涵盖的考卷,并可根据未被定标集涵盖的考卷更新定标集,从而使得后续根据定标集进行机器评分时,评分结果更加准确。
-
公开(公告)号:CN109215632A
公开(公告)日:2019-01-15
申请号:CN201811162964.0
申请日:2018-09-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音评测方法、装置、设备及可读存储介质,本申请获取待评测语音及作为评测标准的答案文本,基于待评测语音的声学特征和答案文本的文本特征,可以确定待评测语音与答案文本的对齐信息,可以理解的是,对齐信息表明了待评测语音与答案文本的对齐关系,进而可以根据对齐信息,实现自动化的确定待评测语音相对于答案文本的评测结果。由于不需要人工进行评测,既避免了人的主观影响对评测结果的干扰,又减少了人工成本的消耗。
-
-
-
-
-
-
-
-
-