-
公开(公告)号:CN117473954A
公开(公告)日:2024-01-30
申请号:CN202311383422.7
申请日:2023-10-24
Applicant: 科大讯飞股份有限公司
IPC: G06F40/126 , G06F40/289 , G06F40/151 , G06N3/0464
Abstract: 本申请提供了一种文本生成方法、装置、设备和存储介质,涉及人工智能技术领域。主要技术方案包括:利用大语言模型(LLM)的嵌入层获取文本模态的输入数据对应的特征表示;利用非文本模态对应的编码器对非文本模态的输入数据进行编码,得到非文本模态的输入数据对应的第一特征表示,利用非文本模态对应的转化器将第一特征表示转换至LLM的嵌入层采用的特征空间,得到非文本模态的输入数据的第二特征表示;对文本模态的输入数据对应的特征表示和非文本模态的输入数据对应的第二特征表示进行融合,将融合得到的特征表示提供给LLM,由LLM利用融合得到的特征表示生成输出文本。本申请能够提高LLM在多模态输入数据上的文本生成效果。
-
公开(公告)号:CN117688928A
公开(公告)日:2024-03-12
申请号:CN202311388350.5
申请日:2023-10-24
Applicant: 科大讯飞股份有限公司
IPC: G06F40/194 , G06F40/247 , G06F40/284 , G06F16/332
Abstract: 本申请公开了一种数据构建方法、模型训练方法、检查方法及相关装置,该方法包括:获取第一样本医疗用词分别与第一样本医疗用词的若干负向医疗标准词之间的相似度,其中,第一样本医疗用词的负向医疗标准词与第一样本医疗用词不具有映射关系;基于相似度,从第一样本医疗用词的若干负向医疗标准词中,选出第一样本医疗用词的至少一个搭配医疗标准词;利用第一样本医疗用词和至少一个搭配医疗标准词,构建得到负样本医疗数据,负样本医疗数据用于对语言大模型进行微调,经微调后的语言大模型用于确定医疗用词与医疗标准词之间是否具有映射关系。通过上述方式,本申请能够提高语言大模型对不具有映射关系的医疗用词与医疗标准词的检查能力。
-
公开(公告)号:CN117393099A
公开(公告)日:2024-01-12
申请号:CN202311382015.4
申请日:2023-10-23
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种医学文书生成方法、装置、电子设备及存储介质,所述医学文书生成方法,包括:根据患者医疗数据和医学文书生成需求,生成任务描述;所述任务描述包括对医学文书生成任务的描述信息,所述医学文书生成任务用于生成与所述患者医疗数据对应的、符合所述医学文书生成需求的医学文书;生成至少包括所述患者医疗数据以及所述任务描述的任务指令;将所述任务指令输入预先训练的文书生成模型,得到医学文书;其中,所述文书生成模型至少通过对预训练的生成式语言模型进行基于任务指令的医学文书生成训练得到。
-
-