-
公开(公告)号:CN113705240A
公开(公告)日:2021-11-26
申请号:CN202110888038.7
申请日:2021-08-03
Applicant: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
Abstract: 本申请公开了一种基于多语种分支模型的文本处理方法及相关装置,所述多语种分支模型包括嵌入层、多分支处理网络、第一混合器、共享网络和输出层,所述文本处理方法包括:基于所述嵌入层,获得待处理的文本对应的初始语义表示;基于所述多分支处理网络、所述第一混合器以及所述共享网络,对所述初始语义表示进行处理以获得综合语义表示;基于所述输出层,对所述综合语义表示进行变换以获得输出结果。通过上述方式,本申请能够在具备多语种处理能力的基础上,提高处理结果的精确度。
-
公开(公告)号:CN113158648A
公开(公告)日:2021-07-23
申请号:CN202011449650.6
申请日:2020-12-09
Applicant: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F40/232 , G06F40/289
Abstract: 本申请公开了一种文本补全方法以及电子设备、存储装置,其中文本补全方法包括:获取待补全文本,并确定待补全文本的缺失内容所源自的文本库;其中,待补全文本包括至少一个缺失位置;利用文本库对待补全文本进行补全预测,得到缺失位置的至少一个候选词语;利用各个缺失位置的候选词语,得到待补全文本的完整文本。上述方案,能够提高文本补全的效率并降低文本补全的成本。
-
公开(公告)号:CN108763535B
公开(公告)日:2020-02-07
申请号:CN201810550870.4
申请日:2018-05-31
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本发明实施例提供一种信息获取方法及装置,属于自然语言处理技术领域。方法包括:将问询文本和与问询文本相匹配的答复文本输入至关键内容计算模型,输出答复文本中的关键内容,并将关键内容作为问询文本的答复;其中,关键内容计算模型是基于样本问询文本、样本答复文本以及样本答复文本中的样本关键内容进行训练后得到,关键内容为样本问询文本的答复。由于可依据与问询文本相匹配的答复文本,并可直接针对问询文本本身来获取问询文本对应提问的答复内容,而非基于问询文本对应提问的相似问题,将相似问题对应的解答作为答复内容,从而可提高答复内容的可靠性及准确性,并提高了用户在与设备进行问答交互时的使用体验。
-
公开(公告)号:CN108763535A
公开(公告)日:2018-11-06
申请号:CN201810550870.4
申请日:2018-05-31
Applicant: 科大讯飞股份有限公司
IPC: G06F17/30
Abstract: 本发明实施例提供一种信息获取方法及装置,属于自然语言处理技术领域。方法包括:将问询文本和与问询文本相匹配的答复文本输入至关键内容计算模型,输出答复文本中的关键内容,并将关键内容作为问询文本的答复;其中,关键内容计算模型是基于样本问询文本、样本答复文本以及样本答复文本中的样本关键内容进行训练后得到,关键内容为样本问询文本的答复。由于可依据与问询文本相匹配的答复文本,并可直接针对问询文本本身来获取问询文本对应提问的答复内容,而非基于问询文本对应提问的相似问题,将相似问题对应的解答作为答复内容,从而可提高答复内容的可靠性及准确性,并提高了用户在与设备进行问答交互时的使用体验。
-
公开(公告)号:CN119760190A
公开(公告)日:2025-04-04
申请号:CN202411947060.4
申请日:2024-12-27
Applicant: 科大讯飞股份有限公司
IPC: G06F16/9032 , G06F16/908
Abstract: 本申请公开了一种问答数据生成方法及相关装置,涉及数据生成领域,问答数据生成方法包括:获取第一目标数据;根据第一目标数据,生成与第一目标数据相关的若干个问题;将若干个问题分别与第一目标数据组合,得到若干个第二目标数据;利用预训练模型,以若干个第二目标数据为依据,生成若干个问题分别对应的答案,得到由若干个问题与若干个问题分别对应的答案组成的若干问答对。通过本申请公开的问答数据生成方法可生成高质量的问答对。
-
公开(公告)号:CN117932011A
公开(公告)日:2024-04-26
申请号:CN202311687290.7
申请日:2023-12-06
Applicant: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC: G06F16/332 , G06V20/70 , G06V10/40 , G06V10/82
Abstract: 本申请公开了一种意图答复方法、系统和相关装置,该方法包括:获取用户的输入信息;其中,所述输入信息包括意图文本以及与所述意图文本关联的参考图像,所述意图文本包含目标实体,所述参考图像中包含与所述目标实体对应的参考区域;基于所述输入信息,获取与所述目标实体相关的答复信息。通过上述方式,本申请能够提高答复的准确性和直观性。
-
公开(公告)号:CN117764175A
公开(公告)日:2024-03-26
申请号:CN202311845793.2
申请日:2023-12-27
Applicant: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC: G06N5/04 , G06F40/284 , G06F40/205 , G06N3/0455 , G06N5/025
Abstract: 本申请公开了一种数学推理问答方法、装置、存储介质及设备,该方法包括:首先获取待答复的目标数学问题文本;并提取目标数学问题文本中的数值信息;然后提取目标数学问题文本中的文本特征向量;并利用目标数学问题文本中的数值信息,从文本特征向量中抽取数值特征向量;接着利用数值特征向量预测目标数学问题文本中的数值信息对应的计算表达式,并利用计算表达式和数值信息,计算目标数学问题文本对应的答案内容。可见,由于本申请的全过程无需额外的知识图谱相关构建,实现的是通过端到端的方式解答了目标数学问题。从而能够提高对于目标数学问题的答复效率和准确率,进而提高用户的问答体验。
-
公开(公告)号:CN115563963A
公开(公告)日:2023-01-03
申请号:CN202211337228.0
申请日:2022-10-28
Applicant: 科大讯飞股份有限公司
IPC: G06F40/232 , G06F18/25 , G06F40/205 , G06F40/126 , G06V30/18
Abstract: 本申请公开了一种盲文转换后文本的错别字检测方法、装置及相关设备,本申请提取待检测文本的文字模态特征,与待检测文本对应的盲文数据的盲文模态特征,将盲文模态特征和文字模态特征进行融合,基于融合特征确定盲文数据对应的真实文本,对比真实文本和待检测文本,以得到错别字检测结果。本申请在错别字检测时,在考虑了待检测文本的文字模态特征的基础上,进一步融合了对应盲文数据的盲文模态特征,使得预测结果更加准确,在此基础上,通过对比真实文本和待检测文本,确定错别字检测结果,大大提升了错别字检测的准确度。
-
公开(公告)号:CN109766407B
公开(公告)日:2021-05-04
申请号:CN201811436568.2
申请日:2018-11-28
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供了一种数据处理方法和装置,该方法包括:接收阅读理解文本、题干文本、多个选项文本;根据阅读理解文本的第一文本特征、题干文本的第二文本特征、多个选项文本中的任意一个选项文本的第三文本特征,识别阅读理解文本、题干文本以及选项文本之间两两匹配的至少两个语义匹配关系;根据至少两个语义匹配关系,识别多个选项文本中作为题干文本的正确答案的目标选项文本并输出。本发明能够利用选项、题干、篇章之间在高维向量空间的匹配关系,结合端到端的深度学习方法,提升了对选择型阅读理解题的作答准确度。
-
公开(公告)号:CN108804627B
公开(公告)日:2021-04-06
申请号:CN201810551681.9
申请日:2018-05-31
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/205
Abstract: 本发明实施例提供一种信息获取方法及装置,属于自然语言处理技术领域。方法包括:将问询文本和与问询文本相匹配的答复文本分别输入至N个关键内容计算模型,获取每一关键内容计算模型输出的候选关键内容;其中,关键内容计算模型是基于样本问询文本、样本答复文本以及样本答复文本中的样本关键内容进行训练后得到,每一候选关键内容是从答复文本中提取的;根据每一候选关键内容,获取最优关键内容,并将最优关键内容作为问询文本对应的答复。由于可将N个关键内容计算模型的输出结果进行融合,从而有效规避了单一模型在训练过程存在偏差的问题,进而可提高答复内容的可靠性及准确性,并提高了用户在与设备进行问答交互时的交互体验。
-
-
-
-
-
-
-
-
-