-
公开(公告)号:CN120086332A
公开(公告)日:2025-06-03
申请号:CN202510148266.9
申请日:2025-02-10
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F16/3329 , G06F16/334 , G06F40/30
Abstract: 本发明涉及大语言模型技术领域,具体为一种基于大语言模型的高效任务型对话构建方法,该方法通过将用户的输入话术和当前的实体信息共同更新到当前的Prompt中;Prompt更新后大语言模型会根据Prompt给出特定的输出,接着对于大语言模型的输出至Response进行后处理,根据后处理的结果更新实体信息,并判断是否继续进行对话;当判断不需要继续对话时,会在用户的下一轮对话中进行对话收尾与结束会话并输出内容。通过将大语言模型与任务型对话系统融合,可以快速搭建一个任务型对话流程,不需要模型训练与人工标注,也不需要预先定义特定的流程树,整个搭建过程速度快并且可调整性强,同时整个对话流程会更加流畅。
-
公开(公告)号:CN119962510A
公开(公告)日:2025-05-09
申请号:CN202510034044.4
申请日:2025-01-09
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F40/194 , G06F40/16 , G06F18/25 , G06N3/045 , G06N3/0475 , G06N5/025
Abstract: 本公开提供了一种基于大语言模型的文本生成方法和系统,通过响应于用户输入的需求信息,将所述需求信息和提示词模板输入至大语言模型,生成与所述需求信息对应的目标目录,所述提示词模板包括引导信息和初始目录;获取知识库中与所述目标目录对应的文本信息,其中,所述文本信息中嵌入有非文本元素;将所述文本信息和所述目标目录输入至大语言模型,生成与所述目标目录格式一致的目标文本;将所述目标文本中的非文本元素替换为与所述非文本元素对应的非文本对象。本公开生成的目标文本中包括有非文本元素,实现了多模态数据的查询与文本内容生成,生成的目标文本既符合目标目录的格式要求又具有高度准确性,提升了用户的满意度。
-
公开(公告)号:CN119884161A
公开(公告)日:2025-04-25
申请号:CN202411965467.X
申请日:2024-12-27
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F16/245 , G06F16/25 , G06F16/248 , G06N5/025
Abstract: 本发明提供一种多模态知识库构建与检索方法、系统、存储介质和程序产品,涉及计算机技术领域。其中多模态知识库构建方法包括以下步骤:获取原始资料,对原始资料进行结构化知识拆分,得到结构化的知识单元;对结构化的知识单元进行知识重组,得到多层次的索引;根据多层次的索引,对结构化的知识单元进行多模态知识整合,得到多模态知识库。本发明能够将非结构化的资料数据转化为多模态结构化数据、多模态知识库构建、多模态知识检索等算法模块功能与相关知识。整个多模态知识库构建与检索流程可信性、可拓展性强,可明显提高知识管理的整体效能。
-
公开(公告)号:CN119646156A
公开(公告)日:2025-03-18
申请号:CN202411761150.4
申请日:2024-12-03
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F16/3329 , G06F16/334 , G06F16/38 , G06N5/04
Abstract: 本发明公开了一种基于自记忆增强的检索文本生成方法、系统、产品及设备。所述检索文本生成方法包括:接收检索任务并获取大语言模型的知识检索结果;分析所述知识检索结果以得到对应的知识缺口;所述知识缺口包括所述大语言模型未完成检索任务时缺失的信息;以所述检索任务、所述知识缺口和上一次的知识检索结果作为下一次检索的输入,并进行迭代直到知识检索结果不存在知识缺口。该检索文本生成方法,通过使每次输出作为下一轮检索的输入进行迭代,反复优化生成内容,逐步填补知识缺口,确保每轮生成都能利用最新的知识和信息,使得生成文本的质量显著提高,进而显著提高了生成内容的完整性和连贯性,特别适用于需要多跳推理的复杂任务。
-
公开(公告)号:CN118427319A
公开(公告)日:2024-08-02
申请号:CN202410098048.4
申请日:2024-01-23
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本申请提供了一种问答方法及装置、存储介质、计算设备,该问答方法包括:获取类比示例和目标问题,类比示例包括示例问题和示例答案;预测示例问题和示例答案的潜在关系;在知识图谱中查找与目标问题具有潜在关系的多个候选答案;根据潜在关系以及目标问题与多个候选答案的候选关系确定目标答案。本申请提供了一种提升大语言模型的问答准确率的方案。
-
公开(公告)号:CN118333152A
公开(公告)日:2024-07-12
申请号:CN202410350501.6
申请日:2024-03-26
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本发明公开了一种基于知识消歧的知识图谱扩充方法、系统、设备及介质,涉及计算机技术领域。该方法包括:获取目标文本数据和待扩充知识图谱,基于知识抽取模型对目标文本数据进行知识抽取得到目标知识数据,将目标知识数据进行聚类消歧处理,获得目标聚类簇,选取目标聚类簇的聚类中心为目标知识节点,将目标知识节点与待扩充知识图谱建立关联。本发明通过对自然语言文本进行知识抽取,并对该知识进行消歧聚类处理,避免语义重复、知识体系冗余,同时还能减小计算量,选取聚类中心作为新的知识节点扩充到知识图谱中,提升知识图谱的完备性,提高其在实际应用中的效能,整个知识图谱扩充流程完备,可信度高、可拓展性强。
-
公开(公告)号:CN119248916A
公开(公告)日:2025-01-03
申请号:CN202411303314.9
申请日:2024-09-18
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/30 , G06N5/04 , G06N5/022 , G06N3/0455
Abstract: 本发明提供一种自适应检索增强大语言模型构建和问答方法、系统、存储介质和程序产品,其中构建方法包括:收集问答数据,包括问题、标准答案和参考的上下文;使用大语言模型回答问题,得到初始答案;判断所述初始答案和标准答案是否一致,根据判断结果构建训练数据;基于所述训练数据,对大语言模型进行微调训练,得到自适应检索增强大语言模型。问答方法包括:输入问题;自适应检索增强大语言模型回答问题,并判断是否需要获取额外知识;根据判断结果,输出answer作为最终答案。本发明能够在资源利用和回答质量之间实现平衡,解决资源消耗大、问答效率低以及回答准确度差的问题。
-
公开(公告)号:CN118657483A
公开(公告)日:2024-09-17
申请号:CN202410687885.0
申请日:2024-05-30
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06Q10/10 , G06N5/04 , G06F16/332
Abstract: 本公开提供一种工作流管理方法、系统、设备、介质和程序产品,工作流管理方法包括:响应于用户的输入触发,在不满足工作流停止条件时,通过训练好的深度学习语言表示模型从用户输入的信息中识别出需要跳转到的下一个工作流节点,并跳转到下一个工作流节点;通过训练好的大语言模型引导并提取用户提供当前工作流节点所需的信息,并存储提取出的信息;在已获得当前工作流节点所需的全部信息时完成执行当前工作流节点。本公开通过将大语言模型与传统的深度学习语言表示模型相结合的任务流管理,既能够基于人机对话交互模式辅助用户高效完成任务,又能够支持工作流的灵活扩展和节点间的准确地自由跳转,从而成为用户日常工作中不可或缺的可靠助手。
-
公开(公告)号:CN118569385A
公开(公告)日:2024-08-30
申请号:CN202410658940.3
申请日:2024-05-24
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06N5/04 , G06N5/025 , G06N3/045 , G06F16/332 , G06F16/33
Abstract: 本发明提供一种融合大语言模型的智能任务型对话方法,具体包括:获取与用户的对话;针对用户的输入信息进行识别解析,获取识别解析的结果;根据所述识别解析的结果同步更新对话状态追踪器的状态;根据追踪器的智能引导至恰当的对话场景节点;执行预先设定好的Action以完成特定的任务;基于当前对话节点情境和对话历史数据,生成机器人的反馈话术。本发明结合了大语言模型的强大能力,实现了场景的快速适应和高效配置。通过动态加载特定场景的配置信息,该系统能够按照预设的流程逻辑高效地推进轮对话过程,极大地简化了数据标注和模型训练的步骤。
-
公开(公告)号:CN118332068A
公开(公告)日:2024-07-12
申请号:CN202410363601.2
申请日:2024-03-28
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本发明公开了一种数据管理系统的构建方法、使用方法、设备、介质及产品,涉及自然语言处理领域。该方法应用于数据管理系统,系统包括数据存储架构模块、知识库模块和历史对话检索模块,方法包括基于初始文本信息构建数据存储架构模块,初始文本信息为文档结构化生成的片段或问答,基于信息抽取模型将初始文本信息进行标签化处理,构建知识库模块,基于双层分类模型对与用户产生的对话进行分类,并将分类后的对话进行存储生成历史对话库,与用户产生的对话基于用户与初始文本信息交互形成,历史对话检索模块基于历史对话库构建。本发明中将历史对话进行分类存储,不仅避免直接存储干扰信息,还能结合上下文,将多轮对话中的信息完整全面的保存。
-
-
-
-
-
-
-
-
-