-
公开(公告)号:CN118230985A
公开(公告)日:2024-06-21
申请号:CN202410193253.9
申请日:2024-02-21
Applicant: 四川大学
IPC: G16H80/00 , G06F40/295 , G06N5/04 , G06N5/025 , G06N3/045 , G06N3/0499
Abstract: 本发明提供了一种基于插件指令微调大模型的口腔医学导诊方法及系统,属于人工智能技术领域,本发明在为通用领域大模型引入医学相关知识的同时使其对话思维符合医学规范,通过构建符合医学对话思维的指令数据集,使得插件指令微调大模型获得医学对话思维,能够模拟医生对病人进行多轮问询。同时,将构建得到的医学领域指令数据集按照医学细分学科分类,通过插件指令微调为模型补齐医学专业知识。本发明在解决实际导诊问题时的能力更强,特别是解决了传统知识图谱方法覆盖范围小、用户意图理解不准确且导诊步骤繁琐的问题。
-
公开(公告)号:CN118780338B
公开(公告)日:2025-03-14
申请号:CN202410901076.5
申请日:2024-07-05
Applicant: 四川大学
IPC: G06N3/082 , G06N3/0495 , G06N5/04 , G16H70/20 , G06N3/0455
Abstract: 本发明公开了一种面向医学大模型压缩的混合动态剪枝方法,采用基于混合稀疏预测的稀疏预测器,相比其他单纯基于动态稀疏预测的动态剪枝方法具有降低性能损失的优势。有效解决目前医学大模型压缩后性能下降严重的问题,并提高模型推理速度,为实现高稀疏化,高性能的大模型在实际应用的推广和应用提供了可行的解决方案。
-
公开(公告)号:CN118520082B
公开(公告)日:2025-02-14
申请号:CN202410555789.0
申请日:2024-05-07
Applicant: 四川大学
IPC: G06F16/3329 , G06F16/334 , G06F16/353 , G06F40/279 , G06F40/216
Abstract: 本发明公开了一种用于构建口腔医学大模型的问答对话数据生成方法及系统,问答对话数据生成方法包括搜集若干篇与口腔医学关联的文献,并将每篇口腔医学文献分割成若干文本,对每条文本抽取若干候选医学知识三元组;采用训练后的Transformer编码器对每条文本的若干候选医学知识三元组进行评分,每条文本选取预设数量评分最高的医学知识三元组;将所有文本选取的医学知识三元组输入采用口腔对话和医学三元组训练的基于Qwen的问答对话数据生成模型,得到每条文本的口腔问答对话数据。问答对话数据生成系统包括依次连接的口腔专业知识生成模块、口腔专业知识评分模块和口腔对话数据重建组件。
-
公开(公告)号:CN118780338A
公开(公告)日:2024-10-15
申请号:CN202410901076.5
申请日:2024-07-05
Applicant: 四川大学
IPC: G06N3/082 , G06N3/0495 , G06N5/04 , G16H70/20 , G06N3/0455
Abstract: 本发明公开了一种面向医学大模型压缩的混合动态剪枝方法,采用基于混合稀疏预测的稀疏预测器,相比其他单纯基于动态稀疏预测的动态剪枝方法具有降低性能损失的优势。有效解决目前医学大模型压缩后性能下降严重的问题,并提高模型推理速度,为实现高稀疏化,高性能的大模型在实际应用的推广和应用提供了可行的解决方案。
-
公开(公告)号:CN118520082A
公开(公告)日:2024-08-20
申请号:CN202410555789.0
申请日:2024-05-07
Applicant: 四川大学
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/279 , G06F40/216
Abstract: 本发明公开了一种用于构建口腔医学大模型的问答对话数据生成方法及系统,问答对话数据生成方法包括搜集若干篇与口腔医学关联的文献,并将每篇口腔医学文献分割成若干文本,对每条文本抽取若干候选医学知识三元组;采用训练后的Transformer编码器对每条文本的若干候选医学知识三元组进行评分,每条文本选取预设数量评分最高的医学知识三元组;将所有文本选取的医学知识三元组输入采用口腔对话和医学三元组训练的基于Qwen的问答对话数据生成模型,得到每条文本的口腔问答对话数据。问答对话数据生成系统包括依次连接的口腔专业知识生成模块、口腔专业知识评分模块和口腔对话数据重建组件。
-
-
-
-