-
公开(公告)号:CN117875280B
公开(公告)日:2025-02-14
申请号:CN202311810308.8
申请日:2023-12-26
Applicant: 北京大学 , 北京大学长沙计算与数字经济研究院
IPC: G06F40/174 , G06F40/30 , G06F16/2455
Abstract: 本发明公开了一种数字报告的生成方法及装置、存储介质、电子设备。其中,该方法包括:获取目标信息的第一语义嵌入向量,以及获取预训练的AI GC模型生成的查询语句集合的第二语义嵌入向量,其中,目标信息包括目标企业进行数字化转型的内部提供信息和外部公开信息,AI GC模型用于进行数字化转型的评级;计算第一语义嵌入向量与第二语义嵌入向量的相似度;基于相似度从目标信息中召回与查询语句相似的目标文本段落;采用目标文本段落和查询语句通过AI GC模型生成目标信息的数字化转型评级报告。通过本发明,解决了相关技术生成数字报告效率低的技术问题,提高了数字化转型咨询流程的效率和准确性。
-
公开(公告)号:CN119004026A
公开(公告)日:2024-11-22
申请号:CN202411066468.0
申请日:2024-08-05
Applicant: 北京大学长沙计算与数字经济研究院 , 北京大学
IPC: G06F18/20 , G06F18/241 , G06F18/214 , G06F18/2135
Abstract: 本申请公开了一种基于大模型的数据分析方法、装置及非易失性存储介质。其中,该方法包括:获取结构化数据;通过大模型依据目标场景信息确定结构化数据所属的任务类型并按照任务类型将结构化数据划分至不同的数据集,每个数据集对应一个任务类型,其中,不同任务类型对应不同的模型集合,每个模型集合中包含多个不同模型,每个模型包含能力描述信息以及参数设置信息,能力描述信息用于描述模型实现的任务功能,参数设置信息用于设置模型的初始参数和调整模型的参数;通过大模型与任务类型选择对应的模型集合对任务类型对应的数据集进行分析,生成分析结果并展示。本申请解决了由于相关技术中数据分析方法自动化程度低造成的分析效率低的技术问题。
-
公开(公告)号:CN119312792A
公开(公告)日:2025-01-14
申请号:CN202411349903.0
申请日:2024-09-26
Applicant: 北京大学 , 北京大学长沙计算与数字经济研究院
IPC: G06F40/205 , G06F16/35 , G06F16/36 , G06F18/214 , G06N3/045 , G06N3/0475 , G06N3/094 , G06N5/022
Abstract: 本申请涉及一种文本标注方法、系统和计算机设备。包括:通过获取的初始文本和标注任务,并确定对初始文本进行多尺寸切分后的文本片段、确定与标注任务相关联的提示词。通过大语言模型和提示词对文本片段进行标注,得到初始标注数据。最后通过目标模型对多条初始标注数据进行特征评分过滤,得到目标标注数据。采用本方法能够提高标注数据的准确性和一致性。
-
公开(公告)号:CN119179695A
公开(公告)日:2024-12-24
申请号:CN202411076741.8
申请日:2024-08-07
Applicant: 北京大学长沙计算与数字经济研究院 , 北京大学
IPC: G06F16/22 , G06F16/332 , G06F18/22
Abstract: 本申请涉及一种基于大模型的数据分析方法、装置和计算机设备。包括:对于输入的任意单张表格,可以自动进行表格信息提取,对于输入的问题自动拆解形成回答思维链数据,通过基于大语言模型的生成算法模块生成数据分析代码,经过优化和后处理最终形成数据分析结论。因此,将传统数据分析过程中大量重复性工作通过模块化、自动化的工作流进行了优化,大大提升了数据分析工作效率,同时也降低了数据分析工作的门槛,可以通过自然语言实现直接对数据提问。
-
公开(公告)号:CN119003725A
公开(公告)日:2024-11-22
申请号:CN202411079096.5
申请日:2024-08-07
Applicant: 北京大学长沙计算与数字经济研究院 , 北京大学
IPC: G06F16/332 , G06F18/22 , G06F18/24 , G06N3/08
Abstract: 本发明涉及智能问答技术领域,公开了一种基于RAG的文档问答方法、系统、设备及介质,方法包括:获取用户查询的目标问题,并利用预设分类器对目标问题的复杂度进行评估,得到目标问题的复杂度评估结果;根据目标问题的复杂度评估结果确定目标问题的答案生成方案,答案生成方案包括利用预设大语言模型直接生成答案,或,利用预设检索器检索预设文档得到与目标问题相关的外部知识,结合外部知识利用预设大语言模型生成答案。本发明提供的基于RAG的文档问答方法,通过动态调整答案生成方案以优化对不同类型问题的问答响应,简化了对简单问题的处理过程,节约了计算资源,优化了问答过程,提高了对复杂问题的回答准确性。
-
公开(公告)号:CN117875280A
公开(公告)日:2024-04-12
申请号:CN202311810308.8
申请日:2023-12-26
Applicant: 北京大学 , 北京大学长沙计算与数字经济研究院
IPC: G06F40/174 , G06F40/30 , G06F16/2455
Abstract: 本发明公开了一种数字报告的生成方法及装置、存储介质、电子设备。其中,该方法包括:获取目标信息的第一语义嵌入向量,以及获取预训练的AI GC模型生成的查询语句集合的第二语义嵌入向量,其中,目标信息包括目标企业进行数字化转型的内部提供信息和外部公开信息,AI GC模型用于进行数字化转型的评级;计算第一语义嵌入向量与第二语义嵌入向量的相似度;基于相似度从目标信息中召回与查询语句相似的目标文本段落;采用目标文本段落和查询语句通过AI GC模型生成目标信息的数字化转型评级报告。通过本发明,解决了相关技术生成数字报告效率低的技术问题,提高了数字化转型咨询流程的效率和准确性。
-
公开(公告)号:CN117556018A
公开(公告)日:2024-02-13
申请号:CN202311606865.8
申请日:2023-11-29
Applicant: 北京大学长沙计算与数字经济研究院 , 北京大学
Abstract: 本申请涉及一种火电厂智能问答方法、装置、计算机设备、存储介质和计算机程序产品,其中,方法包括:根据火电厂设备运行业务,构建故障诊断知识图谱本体模型;对火电厂非结构化数据和专家经验进行知识抽取、并导入至故障诊断知识图谱本体模型,得到火电厂的故障诊断知识图谱;当检测到用户输入的查询消息时,利用大语言模型对查询消息中携带的故障查询语言进行处理,确定故障原因查询文本;根据故障原因查询文本在火电厂的故障诊断知识图谱中进行查询,得到智能问答结果。整个过程中,使用大语言模型对故障查询语言进行深度理解,通过与故障诊断知识图谱的结合,其能够实现准确的火电厂智能问答。
-
-
-
-
-
-