-
公开(公告)号:CN116228928A
公开(公告)日:2023-06-06
申请号:CN202211690947.0
申请日:2022-12-27
Applicant: 科大讯飞股份有限公司
IPC: G06T11/60 , G06F40/194 , G06F40/126
Abstract: 本申请提供了一种图像设计方法、装置、存储介质及电子设备,涉及计算机视觉领域。该图像设计方法包括:获取第一设计图像以及第一设计图像对应的修改描述文本;基于第一设计图像对应的修改描述文本,确定与修改描述文本匹配的参考图像;基于参考图像,确定第一设计图像对应的第二设计图像。通过本申请中的方案,能够快速地根据客户的修改意见,修改第一设计图像,节省了人力成本和时间成本。
-
公开(公告)号:CN115934905A
公开(公告)日:2023-04-07
申请号:CN202211430115.5
申请日:2022-11-15
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/33 , G06N3/04 , G06N3/0895
Abstract: 本发明涉及自然语言处理技术领域,提供一种文档问答方法、装置、系统、电子设备及存储介质,该方法利用粗排模型,得到目标文档库中的多个备选文档,利用精排模型得到每个备选文档与用户问题的相似度,并确定目标文档,进而确定用户问题对应的目标答案。粗排模型以及精排模型训练过程采用的样本包括内容文档对以及问题文档对集合,通过内容文档对可以使预训练粗排模型以及预训练精排模型在不引入人工标注的情况下学习到更充分的知识,不仅可以节约模型训练成本,提高训练效率,还可以解决高质量标注数据不足的问题。通过问题文档对集合,可以保证通过粗排模型以及精排模型可以为用户提供准确的目标答案。
-
公开(公告)号:CN115600608A
公开(公告)日:2023-01-13
申请号:CN202211407747.X
申请日:2022-11-10
Applicant: 科大讯飞股份有限公司(CN)
IPC: G06F40/30 , G06F40/211
Abstract: 本申请提出一种语义信息提取方法、装置、设备及存储介质,该方法包括:从目标语句中提取得到语义要素,并确定各个语义要素之间的关系信息;其中,所述语义要素包括实体要素和意图要素,所述关系信息包括句法关系信息、时空关系信息、句间关系信息和指代关系信息;基于各个语义要素,以及各个语义要素之间的关系信息,生成与所述目标语句对应的语义信息。采用上述的语义信息提取方法,能够全面、准确地提取目标语句的语义信息。
-
公开(公告)号:CN115080786A
公开(公告)日:2022-09-20
申请号:CN202211003823.0
申请日:2022-08-22
Applicant: 科大讯飞股份有限公司
IPC: G06F16/583 , G06N20/00 , G06F16/33 , G06F16/58 , G06F40/216 , G06F40/289
Abstract: 本申请公开了一种基于图片作诗的方法、装置、设备及存储介质,本申请预先配置了图片文本相似度模型,基于该模型计算目标图片与预先配置的关键词列表中每一关键词对应的关键文本间的相似度,基于相似度可以筛选出满足设定条件的目标关键词,基于该目标关键词和待生成诗的目标体裁,生成与目标图片匹配的诗。本申请配置的图片文本相似度模型已经能够很好的表征输入图片、文本的特征,进而计算图片和文本间的相似度。在此基础上,通过预先配置关键词列表,能够针对任一目标图片通过模型计算得到匹配的目标关键词,当有新的关键词出现时,可以直接添加到关键词列表中即可,无需对模型进行更新训练,减少了人力成本。
-
公开(公告)号:CN114330367A
公开(公告)日:2022-04-12
申请号:CN202111652611.0
申请日:2021-12-30
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/194 , G06K9/62
Abstract: 本发明公开了一种基于句子的语义相似度获得方法、装置以及设备,语义相似度获得方法包括:利用第一编码器获得第一句子的第一语义表征;利用所述第一编码器或第二编码器获得第二句子的第二语义表征;计算所述第一语义表征与所述第二语义表征之间的相似度,作为两个句子之间的语义相似度;其中,所述第一编码器包括第一编码层,所述第二编码器包括第二编码层和交互层,其中,所述第一编码层的模型参数与所述第二编码层的模型参数完全相同,所述第二编码层的输出数据作为所述交互层的输入数据,所述交互层的输出数据作为所述第二语义表征。本申请在将句子转化成语义表征时考虑句子之间的交互,有助于语义相似度的精确计算。
-
公开(公告)号:CN112347789A
公开(公告)日:2021-02-09
申请号:CN202011230897.9
申请日:2020-11-06
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/289
Abstract: 本申请提供了一种标点预测方法、装置、设备及存储介质,其中,方法包括:获取待预测文本,其中,待预测文本为当前语音片段的当前识别结果;以待预测文本是否为当前语音片段的首个中间识别结果为依据,获取历史预测信息,其中,历史预测信息为,在对历史识别结果进行标点预测的过程中所产生的、用于确定标点预测结果的中间信息;根据历史预测信息和待预测文本预测待预测文本中词的标点信息。本申请提供的标点预测方法具有较高的预测准确度和预测效率,该优势使得本申请提供的标点预测方法能够适用于机器同声传译场景。
-
公开(公告)号:CN110210043A
公开(公告)日:2019-09-06
申请号:CN201910514220.9
申请日:2019-06-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种文本翻译方法、装置、电子设备及可读存储介质,方法包括:接收待翻译的源语言文本;将所述源语言文本输入到翻译模型中,由所述翻译模型根据多个双语短语对的信息,对所述源语言文本进行编码和解码,得到所述源语言文本对应的目标语言文本。该方法使得在翻译过程中源语言文本的语义信息得以保留,从而极大提升翻译效果。
-
公开(公告)号:CN119862262A
公开(公告)日:2025-04-22
申请号:CN202411994929.0
申请日:2024-12-31
Applicant: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC: G06F16/3329 , G06F16/353 , G06F16/334 , G06N5/04 , G06F40/35
Abstract: 本发明提供一种对话数据生成方法、装置、设备、存储介质和程序产品,涉及人工智能技术领域。其中方法包括:确定目标角色对应的目标角色输入文本,并从用户输入文本库中确定出当前对话轮次对应的目标用户输入文本;将目标用户输入文本和当前待生成多轮对话的对话数据输入至角色扮演模型,得到角色扮演模型输出的用户侧对话数据,并将用户侧对话数据更新至对话数据中;将目标角色输入文本和对话数据输入至角色扮演模型,得到角色扮演模型输出的扮演目标角色的角色侧对话数据,并将角色侧对话数据更新至对话数据中;其中,用户输入文本库包括多种人类说话模式对应的用户输入文本。本发明可以提高对话数据的生成效率,并降低对话数据的生成成本。
-
公开(公告)号:CN119847500A
公开(公告)日:2025-04-18
申请号:CN202510017430.2
申请日:2025-01-06
Applicant: 科大讯飞股份有限公司
Abstract: 本发明涉及计算机技术领域,提供了一种代码处理方法、装置、电子设备和存储介质,其中方法包括:确定用户的代码指令对应的代码任务类型;从代码模块集合中确定代码任务类型对应的目标代码模块;基于代码模型以及目标代码模块,对代码指令进行响应;代码模块集合包括多种类型的代码任务对应的代码模块,每一代码模块是应用对应类型的代码任务对应的样本代码数据,进行低秩微调训练得到的,克服了目前行业领域模型定制的资源消耗大、易出现“知识杂糅”问题的缺陷,通过为不同的代码任务定制对应的代码模块,并采用低秩适应方式进行微调训练,对计算资源友好,且不会造成模型通用能力丢失,同时避免了“知识杂糅”问题,实现了模型性能的提升。
-
公开(公告)号:CN119783639A
公开(公告)日:2025-04-08
申请号:CN202411728220.6
申请日:2024-11-28
Applicant: 科大讯飞股份有限公司
IPC: G06F40/166 , G06F16/35 , G06F40/35
Abstract: 本申请公开了一种问答对生成方法、装置、存储介质及设备,该方法包括:首先根据文本语料数据生成预设格式的第一目标问题文本和第一目标答案文本;然后利用第一目标问题文本构建第一prompt,输入至预设的大语言模型,对第一目标问题文本进行改写,得到模型输出的第二目标问题文本和第二目标答案文本;并利用文本语料数据构建第二prompt,输入至大语言模型,得到模型输出的第三目标问题文本和第三目标答案文本,接着对文本语料数据进行切分处理,并利用切分结果构建第三prompt,输入至大语言模型,得到模型输出的第四目标问题文本和第四目标答案文本;进而利用这些目标问题文本和目标答案文本生成问答对。从而能够提升问答对的生成效率、多样性、专业性等。
-
-
-
-
-
-
-
-
-