-
公开(公告)号:CN114358579B
公开(公告)日:2025-05-23
申请号:CN202111665520.0
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
IPC: G06Q10/0639 , G06Q10/04 , G06Q50/20 , G06N3/0464 , G06N3/047 , G06N3/08 , G06F18/24 , G06F18/21 , G06F18/214 , G06F40/289
Abstract: 本申请公开了评阅方法、评阅装置、电子设备以及计算机可读存储介质。该评阅方法包括:获取到待评分的数学文本;其中,数学文本包括标准答案以及用户作答内容,数学文本包括数学式子和文字信息;其中,数学文本为经过分词处理后的文本;将数学文本输入到评分预测模型中,利用评分预测模型对数学文本中的文字信息以及数学式子进行识别;其中,评分预测模型是利用不完整的数学文本进行训练得到的;其中,不完整的数学文本包括被掩盖的数学式子以及被掩盖的文字信息;基于识别结果对用户作答内容进行评分并输出得分率。本申请能够较好地根据用户作答内容进行预测,从而满足解答题自动评阅的需求。
-
公开(公告)号:CN114267330B
公开(公告)日:2025-05-13
申请号:CN202111659164.1
申请日:2021-12-30
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本发明提供一种语音合成方法、装置、电子设备和存储介质,其中方法包括:确定待合成的篇章文本的篇章音素序列;对所述篇章音素序列进行编码,得到所述篇章文本的语音学特征;基于所述语音学特征进行语音合成,得到所述篇章文本的合成语音。本发明提供的方法、装置、电子设备和存储介质,通过对篇章文本的篇章音素序列进行编码,从而得到针对篇章文本整体建模的语音学特征,据此进行语音合成,能够保证合成语音在韵律、情感等语感层面的连贯性,提高合成语音的自然度。
-
公开(公告)号:CN119917608A
公开(公告)日:2025-05-02
申请号:CN202411763276.5
申请日:2024-12-03
Applicant: 科大讯飞股份有限公司
IPC: G06F16/3329 , G06F18/214 , G06F18/24
Abstract: 本申请公开了一种问答方法、问答模型训练方法及相关装置,该方法包括:获取目标问题;利用经训练的问答模型基于目标问题,给出目标答案;其中,问答模型基于第一样本问题的至少两个预测答案进行迭代训练,至少两个预测答案的得分不同;预测答案的得分由经训练的分类模型得到,分类模型基于第二样本问题的样本参考答案和第二样本问题的样本预测答案进行迭代训练。通过上述方式,本申请能够提高目标答案的准确度。
-
公开(公告)号:CN118170904A
公开(公告)日:2024-06-11
申请号:CN202311868908.X
申请日:2023-12-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种角色消歧方法、系统和相关装置,该方法包括:获取待处理图;其中,所述待处理图的节点是基于多个待处理角色名得到的,所述待处理图的边是基于任意两个所述待处理角色名对应的待处理段落得到的,所述待处理段落中的两个所述待处理角色名间隔的字符的数量小于第一阈值;将所述待处理图输入图神经网络,得到每条边所连接的两个节点对应的待处理角色名之间的分类结果;其中,所述图神经网络用于对所述待处理图中的边所连接的节点之间的关联关系进行分类,所述分类结果包括同属于一个角色和分属于两个角色中的一者。通过上述方式,本申请能够提高角色消歧的准确性。
-
公开(公告)号:CN117316158B
公开(公告)日:2024-04-12
申请号:CN202311599003.7
申请日:2023-11-28
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供了一种交互方法、装置、控制设备及存储介质,交互方法包括:获取目标用户的手部图像序列和语音序列;识别语音序列中的指令词,并获取指令词对应的时间;根据手部图像序列以及指令词对应的时间,确定目标用户发出指令词时的手部指向区域;根据目标用户发出指令词时的手部指向区域,确定交互设备;控制交互设备执行指令词对应的操作。本发明提供的交互方法为结合语音的指向交互方法,该交互方法有效利用了不同模态信息的互补性,其不但能够实现丰富的交互功能,而且具有较好的交互稳定性,用户体验较好。
-
公开(公告)号:CN117690144A
公开(公告)日:2024-03-12
申请号:CN202311580044.1
申请日:2023-11-21
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种文本问答方法、视觉语言模型的训练方法及其相关装置,该方法包括:获取目标文本图像以及关于目标文本图像的目标问题;利用视觉语言模型中的视觉编码器对目标文本图像进行视觉编码,得到第一目标特征;以及,利用视觉语言模型中的文本编码网络对目标文本图像进行文本编码,得到第二目标特征;利用视觉语言模型基于第一目标特征、第二目标特征和目标问题,得到目标问题的目标答案。通过上述方式,本申请能够提高问答准确率。
-
公开(公告)号:CN112417896B
公开(公告)日:2024-02-02
申请号:CN202011210710.9
申请日:2020-11-03
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本申请提供了一种领域数据获取方法、机器翻译方法及相关设备,领域数据获取方法可确定出通用领域的训练语料集中训练语料对应的第一目标值,由于第一目标值能够表征对应的训练语料与指定领域的匹配程度,因此,基于通用领域的训练语料集中训练语料对应的第一目标值,能够从通用领域的训练语料集中筛选出指定领域的训练语料。在此基础上,本申请还提供了一种机器翻译方法,该方法可利用预先建立的领域翻译模型实现指定领域文本的翻译,由于领域翻译模型采用大量指定领域的训练语料对通用翻译模型进行微调得到,因此,其为能够适应于指定领域的翻译模型,利用该翻译模型对指定领域的文本进行翻译,能够获得比较准确的翻译结果。
-
公开(公告)号:CN110210043B
公开(公告)日:2024-01-26
申请号:CN201910514220.9
申请日:2019-06-14
Applicant: 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/289
Abstract: 本申请提供一种文本翻译方法、装置、电子设备及可读存储介质,方法包括:接收待翻译的源语言文本;将所述源语言文本输入到翻译模型中,由所述翻译模型根据多个双语短语对的信息,对所述源语言文本进行编码和解码,得到所述源语言文本对应的目标语言文本。该方法使得在翻译过程中源语言文本的语义信息得以保留,从而极大提升翻译效果。
-
公开(公告)号:CN114742514A
公开(公告)日:2022-07-12
申请号:CN202210199273.8
申请日:2022-03-02
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了同传延迟检测方法及相关装置、电子设备、存储介质,其中,同传延迟检测方法包括:检测同传过程中各个语句对的语句同传延迟;其中,语句对包括源语种的第一语句和目标语种的第二语句,语句对的语句同传延迟包括语句对的帧级延迟;基于所述语句同传延迟,统计得到篇章同传延迟。上述方案,能够自动检测同传延迟,相较于人工检测有助于大幅减少检测时间和检测成本。
-
公开(公告)号:CN114358579A
公开(公告)日:2022-04-15
申请号:CN202111665520.0
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了评阅方法、评阅装置、电子设备以及计算机可读存储介质。该评阅方法包括:获取到待评分的数学文本;其中,数学文本包括标准答案以及用户作答内容,数学文本包括数学式子和文字信息;其中,数学文本为经过分词处理后的文本;将数学文本输入到评分预测模型中,利用评分预测模型对数学文本中的文字信息以及数学式子进行识别;其中,评分预测模型是利用不完整的数学文本进行训练得到的;其中,不完整的数学文本包括被掩盖的数学式子以及被掩盖的文字信息;基于识别结果对用户作答内容进行评分并输出得分率。本申请能够较好地根据用户作答内容进行预测,从而满足解答题自动评阅的需求。
-
-
-
-
-
-
-
-
-