-
公开(公告)号:CN118982075A
公开(公告)日:2024-11-19
申请号:CN202411470800.X
申请日:2024-10-21
Applicant: 之江实验室
Abstract: 本说明书提供了一种基于知识图谱的增强大模型推理的方法、装置及设备,通过根据确定的输入大模型的输入文本中的输入实体,以及预测的该输入实体与问题答案之间的目标关系,从预设的知识图谱库中,确定匹配的匹配节点以及目标路径。然后,根据匹配节点以及目标路径确定提示路径,以根据提示路径构建子图,确定用于描述匹配节点的提示文本,并输入大模型。在为大模型补充了有效知识的同时,避免了由于输入的文本较多而超出大模型的窗口限制,也减少了输入大模型的噪声,提高了大模型推理答案的准确率,减小了“幻觉”的出现。
-
公开(公告)号:CN118277645B
公开(公告)日:2024-08-09
申请号:CN202410710728.7
申请日:2024-06-04
Applicant: 之江实验室
IPC: G06F16/953 , G06N5/022
Abstract: 本发明公开了一种基于大语言模型的数据增强方法和装置,方法包括以下步骤:获取领域种子实体,将种子实体在原始语料数据中进行实体筛查以得到对应种子实体的上下文片段数据;以种子实体和上下文片段数据为基础,通过大语言模型进行用于网页信息查询的检索增强生成,生成扩展后的检索语句;将检索语句输入搜索引擎进行网页信息查询,获得返回结果中的TopN网页,解析TopN网页得到检索数据集;将检索语句与检索数据集一并输入大语言模型进行摘要总结,输出得到总结后的增强语料数据。本发明能够高质量地对原始语料数据进行自动化补充和扩展,实现更加高效和准确的数据增强。
-
公开(公告)号:CN117890885A
公开(公告)日:2024-04-16
申请号:CN202410295971.7
申请日:2024-03-15
Applicant: 之江实验室
IPC: G01S7/481
Abstract: 本发明公开了一种激光雷达扫描机构及其扫描方法,该扫描机构包括转台、转轴、激光源和液晶屏,其中,转轴安装在转台上,激光源安装在转轴上,液晶屏位于激光源的一侧,液晶屏包括第一液晶屏和第二液晶屏,第一液晶屏和第二液晶屏的屏幕形状为圆弧面,该圆弧面的圆心为激光源所在位置。本发明仅需一个转轴即可实现激光在两个不平行的方向进行扫描,单轴驱动的方式简化了扫描机构的结构和装配难度,降低了强度振动的影响,减轻了扫描机构的总重量和成本,通过转轴旋转驱动激光源实现第一个方向的旋转从而实现扫描功能,通过控制液晶屏的光学透过率和光学透明点可以实现第二个方向的扫描。
-
公开(公告)号:CN118277645A
公开(公告)日:2024-07-02
申请号:CN202410710728.7
申请日:2024-06-04
Applicant: 之江实验室
IPC: G06F16/953 , G06N5/022
Abstract: 本发明公开了一种基于大语言模型的数据增强方法和装置,方法包括以下步骤:获取领域种子实体,将种子实体在原始语料数据中进行实体筛查以得到对应种子实体的上下文片段数据;以种子实体和上下文片段数据为基础,通过大语言模型进行用于网页信息查询的检索增强生成,生成扩展后的检索语句;将检索语句输入搜索引擎进行网页信息查询,获得返回结果中的TopN网页,解析TopN网页得到检索数据集;将检索语句与检索数据集一并输入大语言模型进行摘要总结,输出得到总结后的增强语料数据。本发明能够高质量地对原始语料数据进行自动化补充和扩展,实现更加高效和准确的数据增强。
-
公开(公告)号:CN118982075B
公开(公告)日:2025-03-21
申请号:CN202411470800.X
申请日:2024-10-21
Applicant: 之江实验室
Abstract: 本说明书提供了一种基于知识图谱的增强大模型推理的方法、装置及设备,通过根据确定的输入大模型的输入文本中的输入实体,以及预测的该输入实体与问题答案之间的目标关系,从预设的知识图谱库中,确定匹配的匹配节点以及目标路径。然后,根据匹配节点以及目标路径确定提示路径,以根据提示路径构建子图,确定用于描述匹配节点的提示文本,并输入大模型。在为大模型补充了有效知识的同时,避免了由于输入的文本较多而超出大模型的窗口限制,也减少了输入大模型的噪声,提高了大模型推理答案的准确率,减小了“幻觉”的出现。
-
公开(公告)号:CN118170933B
公开(公告)日:2024-08-13
申请号:CN202410585594.0
申请日:2024-05-13
Applicant: 之江实验室
IPC: G06F16/45 , G06F16/483 , G06F16/41 , G06F16/215 , G06F40/30 , G06N3/045
Abstract: 本发明公开了一种面向科学领域多模态语料数据的构建方法和装置,方法包括以下步骤:按语料主题分类采集待处理的科学领域相关多模态原始语料数据;构建任务处理流管线对原始语料数据依次进行预处理、内容解析、数据清洗和结构化得到整体语料数据;对包括文本、图片、表格和公式的不同子类型语料数据进行语料评测,基于语料评测结果对整体语料数据进行质量评估;根据质量评估结果优化整体语料数据完成科学领域语料数据库构建。本发明通过自动化任务处理流管线高效处理并生成语料数据,同时提供统一存储与质量评测,通过不断优化处理流程得到高质量科学领域语料数据库,能够为大模型训练提供可靠的数据基础,推动科学研究和应用技术的不断发展。
-
公开(公告)号:CN118170933A
公开(公告)日:2024-06-11
申请号:CN202410585594.0
申请日:2024-05-13
Applicant: 之江实验室
IPC: G06F16/45 , G06F16/483 , G06F16/41 , G06F16/215 , G06F40/30 , G06N3/045
Abstract: 本发明公开了一种面向科学领域多模态语料数据的构建方法和装置,方法包括以下步骤:按语料主题分类采集待处理的科学领域相关多模态原始语料数据;构建任务处理流管线对原始语料数据依次进行预处理、内容解析、数据清洗和结构化得到整体语料数据;对包括文本、图片、表格和公式的不同子类型语料数据进行语料评测,基于语料评测结果对整体语料数据进行质量评估;根据质量评估结果优化整体语料数据完成科学领域语料数据库构建。本发明通过自动化任务处理流管线高效处理并生成语料数据,同时提供统一存储与质量评测,通过不断优化处理流程得到高质量科学领域语料数据库,能够为大模型训练提供可靠的数据基础,推动科学研究和应用技术的不断发展。
-
公开(公告)号:CN117890885B
公开(公告)日:2024-06-04
申请号:CN202410295971.7
申请日:2024-03-15
Applicant: 之江实验室
IPC: G01S7/481
Abstract: 本发明公开了一种激光雷达扫描机构及其扫描方法,该扫描机构包括转台、转轴、激光源和液晶屏,其中,转轴安装在转台上,激光源安装在转轴上,液晶屏位于激光源的一侧,液晶屏包括第一液晶屏和第二液晶屏,第一液晶屏和第二液晶屏的屏幕形状为圆弧面,该圆弧面的圆心为激光源所在位置。本发明仅需一个转轴即可实现激光在两个不平行的方向进行扫描,单轴驱动的方式简化了扫描机构的结构和装配难度,降低了强度振动的影响,减轻了扫描机构的总重量和成本,通过转轴旋转驱动激光源实现第一个方向的旋转从而实现扫描功能,通过控制液晶屏的光学透过率和光学透明点可以实现第二个方向的扫描。
-
公开(公告)号:CN117890886A
公开(公告)日:2024-04-16
申请号:CN202410296601.5
申请日:2024-03-15
Applicant: 之江实验室
IPC: G01S7/481
Abstract: 本发明公开了一种通过单轴驱动实现两方向扫描的扫描设备及扫描方法,该扫描设备包括驱动电机、转轴、双转速结构、第一反射镜、第二反射镜和激光源,转轴与驱动电机相连,双转速结构的第一转速件和转轴相连;通过双转速结构实现两个有着固定转速比的转速输出,第一转速件和第二转速件分别固定连接第一反射镜和第二反射镜,第一反射镜的旋转导致发射光在第一次反射后扫描出一条线,实现第一个扫描方向的扫描;由于第一反射镜和第二反射镜存在相对转速差,使得第一反射镜和第二反射镜的相对位置随时间变化,从而导致光路变化进而实现第二个扫描方向的扫描。本发明单轴驱动的方式简化了结构和装配难度,降低了强度振动影响,减轻了总重量和成本。
-
公开(公告)号:CN119046468B
公开(公告)日:2025-04-08
申请号:CN202411525965.2
申请日:2024-10-30
Applicant: 之江实验室
Abstract: 本发明公开了一种基于大语言模型的垂直领域实体扩充方法和装置,包括:基于收集的开源数据文本构建包括头实体、关系和尾实体的知识图谱三元组及其来源文本语句;输入大模型生成尾实体的解释,选取部分包括尾实体及其解释的词条输入大语言模型并结合人工判断进行辅助分类并对词条进行打标;将采集的非实体中性词汇、标准垂直领域实体、标准非垂直领域实体、以及打标的词条转换为嵌入特征向量输入垂直领域实体分类模型进行训练;将未打标的词条转换为嵌入特征向量输入训练好的垂直领域实体分类模型进行判断,将所有确认为垂直领域实体的尾实体添加到垂直领域实体库中。本发明能高质高效地更新垂直领域实体库,显著提升垂直领域实体库的广度和质量。
-
-
-
-
-
-
-
-
-