-
公开(公告)号:CN114898755B
公开(公告)日:2023-01-17
申请号:CN202210824381.X
申请日:2022-07-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音处理方法及相关装置、电子设备、存储介质,其中,语音处理方法包括:获取持续至当前时刻的空白语音的语音时长,并判断语音时长是否不小于首个检测时长;响应于语音时长不小于首个检测时长,基于截止至当前时刻采集到的有效语音,获取语音处理结果,并基于空白语音的端点时刻,确定参考时刻;将最新使用的检测时长的下一检测时长,作为参考时长,并判断从参考时刻开始持续采集参考时长的参考语音是否仍空白;若是且所有检测时长均已使用,则将最新获取的语音处理结果置为有效。上述方案,能够提升语音交互的响应速度。
-
公开(公告)号:CN112800227B
公开(公告)日:2023-01-17
申请号:CN202110124674.2
申请日:2021-01-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种文本分类模型的训练方法及其设备、存储介质。其中,文本分类模型的训练方法包括:获取正文本样本和与正文本样本对应的至少一个负文本样本,其中,正文本样本与对应的负文本样本属于不同的分类类型;利用正文本样本与至少一个负文本样本之间的第一语义差异,干预文本分类模型对正文本样本进行分类,得到正文本样本的预测类型;基于正文本样本的预测类型和实际类型,调整文本分类模型的网络参数。上述方案,文本分类模型在训练过程中,基于正文本样本和负文本样本之间的语义差异,干预文本分类模型的分类工作,使得训练得到的文本分类模型的分类更加准确。
-
公开(公告)号:CN112463964B
公开(公告)日:2023-01-17
申请号:CN202011386332.X
申请日:2020-12-01
Applicant: 科大讯飞股份有限公司
IPC: G06F16/35
Abstract: 本申请公开了一种文本分类及模型训练方法、装置、设备及存储介质,本申请首先将训练文本集划分为若干份训练文本子集,并利用每一子集训练对应的初始文本分类模型,进而分别以每一子集为验证集,利用除验证集外其它各子集对应的初始文本分类模型对验证集中每一训练文本进行分类预测,以得到每一训练文本的分类难度,按照分类难度,将训练文本集中各训练文本重新划分为若干份不同分类难度的训练文本子集。本申请文本分类方法为更好的训练目标文本分类模型提供了有力的训练数据支撑,后续可以基于不同分类难度的训练文本子集,按照分类难度由低至高顺序递进式训练目标文本分类模型,解决由于训练文本难度不均衡现象导致的模型训练效果不佳的问题。
-
公开(公告)号:CN111813940B
公开(公告)日:2023-01-17
申请号:CN202010673768.0
申请日:2020-07-14
Applicant: 科大讯飞股份有限公司
IPC: G06F16/35
Abstract: 本申请提供了一种文本的领域分类方法、装置、设备及存储介质,方法包括:根据目标文本获取领域集中每个领域对应的目标样例集,目标样例集包括对应领域对应的样例总集中、与目标文本最相似的预设个样例;基于目标文本、领域集中每个领域对应的目标样例集和样例总集,确定第一信息、第二信息和第三信息,基于第一信息、第二信息和第三信息确定目标文本所属的领域,第一信息、第二信息和第三信息依次为目标文本的语义表征向量、领域集中每个领域对应的类向量、领域集中每个领域对应的相似度特征。本申请提供的文本的领域分类方法可准确地确定出目标文本所属的领域。
-
公开(公告)号:CN108959268B
公开(公告)日:2023-01-17
申请号:CN201810806307.9
申请日:2018-07-20
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30
Abstract: 本申请公开了一种文本情感分析方法及装置,该方法包括:在获取待进行情感分析的目标文本后,确定出该目标文本中的每一目标元素,其中,该目标元素为目标文本中的一个词语或一个句子,然后可以对每一目标元素进行情感分析,得到对应于每一目标元素的情感倾向结果。可见,本申请在获取到待进行情感分析的目标文本后,不局限于只进行目标文本的整体情感分析,而是对目标文本中更细粒度的目标元素进行情感分析,以获得对应于目标元素的情感倾向结果,从而可以得到更全面的情感分析结果。
-
公开(公告)号:CN111090733B
公开(公告)日:2022-12-06
申请号:CN201911347217.9
申请日:2019-12-24
Applicant: 科大讯飞股份有限公司
IPC: G06F16/33 , G06F16/332
Abstract: 本申请实施例公开了一种人机交互方法、装置、设备及可读存储介质,在获取输入信息后,对输入信息进行多意图理解,得到多个意图理解结果;根据多个意图理解结果确定目标意图;调用目标意图对应的目标子流程,以响应输入信息;其中,目标子流程为多个子流程中的一个子流程;不同的子流程对应的意图不同。本申请实施例中,按意图将一个对话流程划分为多个子流程,每个子流程仅负责对应意图相关的业务逻辑,这样开发者在进行开发时只需要关注子流程相关的业务逻辑即可,而且可以多个开发人员同时对不同的子流程进行开发,大大降低了开发者的开发难度,简化了调试和设计难度。同时,所开发的子流程还可以复用,避免开发者重复创建类似的功能。
-
公开(公告)号:CN115169297A
公开(公告)日:2022-10-11
申请号:CN202210709307.3
申请日:2022-06-21
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC: G06F40/166 , G06F40/289 , G06F40/30
Abstract: 本发明提供一种文本改写方法、装置、电子设备和存储介质,所述方法包括:获取第一文本;将目标改写等级以及第一文本输入至文本改写模型,得到文本改写模型输出的与目标改写等级对应的第二文本;文本改写模型基于第一样本文本、第二样本文本以及样本改写等级训练得到,样本改写等级基于第一样本文本与第二样本文本之间的字符相似度确定。本发明提供的文本改写方法、装置、电子设备和存储介质,基于第一样本文本、第二样本文本以及样本改写等级训练得到文本改写模型,使得文本改写模型能够根据不同目标改写等级对第一文本进行文本改写,得到与不同目标改写等级对应的第二文本,实现能够根据不同场景需求灵活变更改写文本。
-
公开(公告)号:CN114817553A
公开(公告)日:2022-07-29
申请号:CN202111396510.1
申请日:2021-11-23
Applicant: 科大讯飞股份有限公司
IPC: G06F16/36 , G06F16/35 , G06F40/211 , G06F40/295 , G06F40/30 , G06N3/02
Abstract: 本发明公开了一种知识图谱构建方法、知识图谱构建系统和计算设备,该方法包括:获取作为原始数据的文本,对所述文本进行篇章级知识抽取和句子级事件抽取,以获得知识抽取结果和事件抽取结果;以及对所述知识抽取结果和所述事件抽取结果进行知识融合,以获得知识图谱。本发明将知识图谱的概念从传统的静态知识三元组变为包含静态知识五元组以及动态事件知识在内的复合知识,使用篇章级要素抽取与要素关联,可以大大提升五元组的提取效率与召回率,使得知识结构化属性更强。
-
公开(公告)号:CN108763221B
公开(公告)日:2022-05-17
申请号:CN201810638378.2
申请日:2018-06-20
Applicant: 科大讯飞股份有限公司
IPC: G06F40/295 , G06F40/30 , G06N3/02
Abstract: 本申请公开了一种属性名表征方法及装置,该方法包括:预先构建一属性名表征模型,该属性名表征模型用于使含义相同或相近的属性名对应于相同或相近的表征向量,在实际使用时,可以利用该属性名表征模型,对待表征的目标属性名进行向量表征,得到对应于目标属性名的表征向量。在本申请中,由于含义相同或相近的属性名,通常会对应相同或相近的属性值,因此,当模型构建时考虑了属性值信息时,该属性名表征模型可以使含义相同或相近的目标属性名对应于相同或相近的表征向量。
-
公开(公告)号:CN114298031A
公开(公告)日:2022-04-08
申请号:CN202111544933.3
申请日:2021-12-16
Applicant: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司
IPC: G06F40/289 , G06F40/247 , G06K9/62 , G06F40/166
Abstract: 本申请涉及人工智能技术领域,并公开了一种文本处理方法、计算机设备及存储介质,所述方法包括:获取待处理文本,所述待处理文本包括至少一条自然语言语句;将所述待处理文本输入预训练的文本润色模型,对所述自然语言语句、所述自然语言语句中的修饰词,和/或所述自然语言语句中的待优化词汇进行润色处理,得到目标文本。能够对文本从语句、语句的修饰词和/或语句的词汇层级进行润色处理,可以高效准确地提高文本内容的质量。
-
-
-
-
-
-
-
-
-