-
公开(公告)号:CN119721238A
公开(公告)日:2025-03-28
申请号:CN202411765028.4
申请日:2024-12-04
Applicant: 北京邮电大学
IPC: G06N5/04 , G06F18/213 , G06F18/22
Abstract: 本发明涉及一种面向基础模型的场景自适应的边云协同推理系统及方法,包括场景自适应的边侧模型定制和自适应推理两个组件;场景自适应的边侧模型定制组件通过超类路由和模型蒸馏的方法,从云侧部署的基础模型中提取混合专家模型,随后,利用边缘设备上少量的无标签原始数据,选择合适的专家模块压缩并微调出边侧定制模型。自适应推理组件协同边侧定制模型和云侧部署的基础模型处理推理任务。将边侧定制模型推理结果上传决策模块,计算置信度分数,并决定是否需要上传数据块选择器,如需上传,上传局部且重要的数据块到云侧部署的基础模型,起到减少传输开销和保护数据隐私的作用。