-
公开(公告)号:CN118093833A
公开(公告)日:2024-05-28
申请号:CN202410473758.0
申请日:2024-04-19
Applicant: 创意信息技术股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/34
Abstract: 本发明提供了一种基于大语言模型的多智能体问答系统及方法,属于问答系统技术领域。系统包括多个根据系统应用场景创建的功能相互独立的智能体,每个智能体之间都使用自然语言处理进行交流和自我适应;智能体中包括监视器模块、上下文管理器模块、话题管理器模块、话题丰富器模块和聊天代理模块。本发明通过使用多智能体对复杂场景进行职责和功能的划分,智能体间相互协作,共同完成复杂的业务场景需求。同时,在智能体内部,系统可以进行主动式的提问,从用户那里收集专业问答所必要的特有信息;最后,该系统能够在对话中自动管理话题,跟踪话题推进,并有效地进行以当前话题为中心的讨论,能够让大语言模型在复杂场景下的专业领域知识问答。
-
公开(公告)号:CN118093833B
公开(公告)日:2024-06-18
申请号:CN202410473758.0
申请日:2024-04-19
Applicant: 创意信息技术股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/34
Abstract: 本发明提供了一种基于大语言模型的多智能体问答系统及方法,属于问答系统技术领域。系统包括多个根据系统应用场景创建的功能相互独立的智能体,每个智能体之间都使用自然语言处理进行交流和自我适应;智能体中包括监视器模块、上下文管理器模块、话题管理器模块、话题丰富器模块和聊天代理模块。本发明通过使用多智能体对复杂场景进行职责和功能的划分,智能体间相互协作,共同完成复杂的业务场景需求。同时,在智能体内部,系统可以进行主动式的提问,从用户那里收集专业问答所必要的特有信息;最后,该系统能够在对话中自动管理话题,跟踪话题推进,并有效地进行以当前话题为中心的讨论,能够让大语言模型在复杂场景下的专业领域知识问答。
-
公开(公告)号:CN118071939A
公开(公告)日:2024-05-24
申请号:CN202410463053.0
申请日:2024-04-17
Applicant: 创意信息技术股份有限公司
Abstract: 本发明提供了一种基于神经辐射场的场景重建方法及装置,属于3D场景重建技术领域。方法先从多视角图像中提取多尺度特征进行栅格投影,得到多个栅格的插值特征,对多个插值特征进行融合,获得对应的栅格特征;然后对栅格特征进行稀疏卷积,得到融合特征,并将其分别输入两个MLP网络,分别预测每个栅格预测占据概率和TSDF预测值,然后进行多次上采样处理,得到精细三维重建结果。最后对结果中的上采样点进行邻域节点特征融合,得到单一融合特征并进行神经辐射场体积渲染,获得三维重建场景。本申请结合显示体素和隐式神经辐射场的端到端的3D重建,利用神经辐射场来约束特征体的特征生成,提高了3D重建的准确率。
-
公开(公告)号:CN117743556B
公开(公告)日:2024-04-16
申请号:CN202410175322.3
申请日:2024-02-07
Applicant: 创意信息技术股份有限公司
IPC: G06F16/332 , G06F40/30 , G06F18/22 , G06F40/289
Abstract: 本发明提供了一种基于知识库的多轮问答意图识别方法及装置,属于意图识别技术领域。方法利用预设知识库文本的关键词集合与预处理后的问题文本进行相似度匹配,获得与问题文本相似的候选文本集合和对应的关键词集合;同时依据对候选文本集合进行第一分级阈值筛选和二级阈值分流,筛选出合适的文本输入预设大模型进行回答。在未能筛选到合适文本时,将问题文本与最近的历史问题文本结合,得到新的问题文本后,将其与候选文本集合输入预设大模型进行回答。本发明通过对多轮问答的问题意图进行识别,将历史问题中的重要信息识别出来与当前问题组合后在知识库中进行匹配,提高了用户输入意图匹配度,解决了多轮问答意图难以识别的问题。
-
公开(公告)号:CN117743556A
公开(公告)日:2024-03-22
申请号:CN202410175322.3
申请日:2024-02-07
Applicant: 创意信息技术股份有限公司
IPC: G06F16/332 , G06F40/30 , G06F18/22 , G06F40/289
Abstract: 本发明提供了一种基于知识库的多轮问答意图识别方法及装置,属于意图识别技术领域。方法利用预设知识库文本的关键词集合与预处理后的问题文本进行相似度匹配,获得与问题文本相似的候选文本集合和对应的关键词集合;同时依据对候选文本集合进行第一分级阈值筛选和二级阈值分流,筛选出合适的文本输入预设大模型进行回答。在未能筛选到合适文本时,将问题文本与最近的历史问题文本结合,得到新的问题文本后,将其与候选文本集合输入预设大模型进行回答。本发明通过对多轮问答的问题意图进行识别,将历史问题中的重要信息识别出来与当前问题组合后在知识库中进行匹配,提高了用户输入意图匹配度,解决了多轮问答意图难以识别的问题。
-
公开(公告)号:CN117349034B
公开(公告)日:2024-02-23
申请号:CN202311650783.3
申请日:2023-12-05
Applicant: 创意信息技术股份有限公司
Abstract: 本发明提供了一种大语言模型分层加载方法及装置,属于模型加载技术领域。方法包括:根据大语言模型的模型层次结构,在内存中创建对应的空模型,并确定空模型中参数层的元数据信息;依据空模型中参数层的元数据信息进行空间占用计算,并根据空间占用计算结果确定空模型中参数层的设备分布状况;基于空模型中参数层的设备分布状况,从磁盘中分层加载空模型的模型参数权重,并将分层加载的模型参数权重拷贝至空模型中各参数层对应的分布设备;释放已拷贝至分布设备的模型参数权重所占用的内存资源,完成大语言模型的分层加载。本发明可以大幅度提升模型的加载速度,减少模型的加载时间,实现了时间资源与空间资源的模型双向优化加载。
-
公开(公告)号:CN117349034A
公开(公告)日:2024-01-05
申请号:CN202311650783.3
申请日:2023-12-05
Applicant: 创意信息技术股份有限公司
Abstract: 本发明提供了一种大语言模型分层加载方法及装置,属于模型加载技术领域。方法包括:根据大语言模型的模型层次结构,在内存中创建对应的空模型,并确定空模型中参数层的元数据信息;依据空模型中参数层的元数据信息进行空间占用计算,并根据空间占用计算结果确定空模型中参数层的设备分布状况;基于空模型中参数层的设备分布状况,从磁盘中分层加载空模型的模型参数权重,并将分层加载的模型参数权重拷贝至空模型中各参数层对应的分布设备;释放已拷贝至分布设备的模型参数权重所占用的内存资源,完成大语言模型的分层加载。本发明可以大幅度提升模型的加载速度,减少模型的加载时间,实现了时间资源与空间资源的模型双向优化加载。
-
-
-
-
-
-