-
公开(公告)号:CN118982075A
公开(公告)日:2024-11-19
申请号:CN202411470800.X
申请日:2024-10-21
Applicant: 之江实验室
Abstract: 本说明书提供了一种基于知识图谱的增强大模型推理的方法、装置及设备,通过根据确定的输入大模型的输入文本中的输入实体,以及预测的该输入实体与问题答案之间的目标关系,从预设的知识图谱库中,确定匹配的匹配节点以及目标路径。然后,根据匹配节点以及目标路径确定提示路径,以根据提示路径构建子图,确定用于描述匹配节点的提示文本,并输入大模型。在为大模型补充了有效知识的同时,避免了由于输入的文本较多而超出大模型的窗口限制,也减少了输入大模型的噪声,提高了大模型推理答案的准确率,减小了“幻觉”的出现。
-
公开(公告)号:CN118277645B
公开(公告)日:2024-08-09
申请号:CN202410710728.7
申请日:2024-06-04
Applicant: 之江实验室
IPC: G06F16/953 , G06N5/022
Abstract: 本发明公开了一种基于大语言模型的数据增强方法和装置,方法包括以下步骤:获取领域种子实体,将种子实体在原始语料数据中进行实体筛查以得到对应种子实体的上下文片段数据;以种子实体和上下文片段数据为基础,通过大语言模型进行用于网页信息查询的检索增强生成,生成扩展后的检索语句;将检索语句输入搜索引擎进行网页信息查询,获得返回结果中的TopN网页,解析TopN网页得到检索数据集;将检索语句与检索数据集一并输入大语言模型进行摘要总结,输出得到总结后的增强语料数据。本发明能够高质量地对原始语料数据进行自动化补充和扩展,实现更加高效和准确的数据增强。
-
公开(公告)号:CN117896076A
公开(公告)日:2024-04-16
申请号:CN202410038697.5
申请日:2024-01-10
Applicant: 之江实验室
Abstract: 本说明书公开了一种面向体育领域的获奖证书生成方法、装置及电子设备。所述面向体育领域的获奖证书生成方法包括:接收获奖证书的生成请求,并根据生成请求,获取体育赛事的赛事信息、获奖人信息以及奖励信息;在预设的模板库中确定出与赛事信息以及奖励信息相匹配的证书模板,作为目标证书模板,以及,根据赛事信息、获奖人信息以及预设的证书编号生成指定长度的散列值,并基于认证机构预先下发的私钥对散列值进行加密,得到证书签名;将赛事信息、获奖人信息、奖励信息、证书签名添加到目标证书模板中并进行渲染,生成针对获奖人的获奖证书并进行存储。本方案可以自动生成获奖证书,提高了证书生成效率,充分满足用户需求。
-
公开(公告)号:CN116307575A
公开(公告)日:2023-06-23
申请号:CN202310253543.3
申请日:2023-03-09
Applicant: 之江实验室
IPC: G06Q10/0631 , G06F18/22 , G06F40/295
Abstract: 本说明书公开了一种任务分配的方法、装置、存储介质及电子设备。所述任务分配的方法包括:接收任务处理请求,根据所述任务处理请求,确定待处理任务的任务信息,识别所述待处理任务中所涉及的实体对象,以及从所述任务信息中提取出目标数据,所述目标数据用于表征所述待处理任务的重要程度,根据所述目标数据以及所述实体对象,确定所述待处理任务的任务类型,基于所述任务类型,根据获取到的各处理人员当前的工作状态信息、所述待处理任务的任务特征和所述各处理人员的历史工作信息中的至少一种,确定负责处理所述待处理任务的处理人员,作为目标人员,并将所述待处理任务分配给所述目标人员所使用的终端设备。
-
公开(公告)号:CN115120248B
公开(公告)日:2022-12-20
申请号:CN202211068196.9
申请日:2022-09-02
Applicant: 之江实验室
IPC: A61B5/352 , A61B5/00 , A61B5/024 , A61B5/0245
Abstract: 本发明公开了基于直方图的自适应阈值R峰检测、心律分类方法及装置,通过计算心电信号的最大、最小值,若最小值的绝对值大于最大值,则将预处理后的心电信号进行水平翻转;提取心电信号的极大值作为候选R峰;统计R峰的直方图分布;根据人体极限心率范围及心电信号时长,确定R峰的数量范围,并截取相应的直方图范围;根据最大类间方差法确定直方图分割阈值,从而得到R峰阈值;取高于阈值的R峰;根据人体极限心率范围,确定R峰间隔阈值,过滤小于间隔阈值的R峰,得到最终的R峰。根据R峰值,计算时域特征,再将时域特征转换为频域特征,将时域特征和频域特征作为心电信号特征指标;将心电信号特征指标输入心电识别模型获得心律分类结果。
-
公开(公告)号:CN114756629B
公开(公告)日:2022-10-21
申请号:CN202210677318.8
申请日:2022-06-16
Applicant: 之江实验室
IPC: G06F16/27 , G06F16/242 , G06F9/48
Abstract: 本发明公开了基于SQL的多源异构数据交互分析引擎及方法,引擎包括:依次连接的交互控制台、协调器、执行器和源驱动器,方法包括:步骤S1:交互控制台获取SQL数据,反馈SQL执行结果;步骤S2:协调器解析SQL数据生成逻辑计划树,逻辑计划树包括一系列具有依赖关系的任务,将逻辑计划树拆分成能够并发执行的子计划,各子计划包含一组任务,将子计划调度到执行器;步骤S3:执行器根据子计划,通过源驱动器获取数据源数据,进行子计划中任务的执行,并将SQL执行结果反馈交互控制台。实现多源异构数据的交互式关联融合分析的目的,降低了成本,提高了数据准确性、时效性,提升了扩展性和维护性。
-
公开(公告)号:CN115120248A
公开(公告)日:2022-09-30
申请号:CN202211068196.9
申请日:2022-09-02
Applicant: 之江实验室
IPC: A61B5/352 , A61B5/00 , A61B5/024 , A61B5/0245
Abstract: 本发明公开了基于直方图的自适应阈值R峰检测、心律分类方法及装置,通过计算心电信号的最大、最小值,若最小值的绝对值大于最大值,则将预处理后的心电信号进行水平翻转;提取心电信号的极大值作为候选R峰;统计R峰的直方图分布;根据人体极限心率范围及心电信号时长,确定R峰的数量范围,并截取相应的直方图范围;根据最大类间方差法确定直方图分割阈值,从而得到R峰阈值;取高于阈值的R峰;根据人体极限心率范围,确定R峰间隔阈值,过滤小于间隔阈值的R峰,得到最终的R峰。根据R峰值,计算时域特征,再将时域特征转换为频域特征,将时域特征和频域特征作为心电信号特征指标;将心电信号特征指标输入心电识别模型获得心律分类结果。
-
公开(公告)号:CN114490860A
公开(公告)日:2022-05-13
申请号:CN202210071437.9
申请日:2022-01-21
Applicant: 之江实验室
IPC: G06F16/26 , G06F16/215 , G06F16/25 , G06F40/30 , G06F40/186
Abstract: 本发明公开了一种数据转换操作语义的可视化方法及装置、电子设备,包括:为数据转换操作挑选含有二维数据表的图形图符模板;根据数据转换操作,确定用于展示在二维数据表上的行和列;从真实表格中挑选出与数据转换操作语义相关的行列单元格数据,并填入二维数据表中;在二维数据表的外围填入与数据转换操作语义相关的非真实表格数据;为所述二维数据表中的单元格进行颜色的编码;用标记框将二维数据表中具有依赖关系的列框选出,并用连接线相连;根据真实表格的行列数目大小,为二维数据表绘制行列滚动条。本发明采用多种视觉通道从不同维度可视化数据转换操作的语义,具有通用性广、可扩展性强、可解释性高等优点。
-
公开(公告)号:CN113673252A
公开(公告)日:2021-11-19
申请号:CN202110924937.8
申请日:2021-08-12
Applicant: 之江实验室
IPC: G06F40/30 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及多维数据分析领域,具体为一种基于字段语义的数据表自动join推荐方法,包括:步骤1,将待join的两数据表中的字段两两组合,作为计算相似度值的集合;步骤2,推断出字段的语义类型;步骤3,判断两字段的数据类型和语义类型是否一致,再判断两字段名是否一致,接着判断两字段值是否存在枚举类;步骤4,分别计算字段名相似度和字段值的相似度,后通过加权求和,得到匹配系数,即两字段的相似度;步骤5,将所有字段的相似度的分值从高到低进行排序并输出提取前20条,作为推荐。本发明通过对数据表字段名和字段值的分析来推荐join的联接子句,更准确更全面地帮助用户发现多维数据隐藏的关联信息,有效地提升大数据分析系统的智能化水平。
-
公开(公告)号:CN119046468B
公开(公告)日:2025-04-08
申请号:CN202411525965.2
申请日:2024-10-30
Applicant: 之江实验室
Abstract: 本发明公开了一种基于大语言模型的垂直领域实体扩充方法和装置,包括:基于收集的开源数据文本构建包括头实体、关系和尾实体的知识图谱三元组及其来源文本语句;输入大模型生成尾实体的解释,选取部分包括尾实体及其解释的词条输入大语言模型并结合人工判断进行辅助分类并对词条进行打标;将采集的非实体中性词汇、标准垂直领域实体、标准非垂直领域实体、以及打标的词条转换为嵌入特征向量输入垂直领域实体分类模型进行训练;将未打标的词条转换为嵌入特征向量输入训练好的垂直领域实体分类模型进行判断,将所有确认为垂直领域实体的尾实体添加到垂直领域实体库中。本发明能高质高效地更新垂直领域实体库,显著提升垂直领域实体库的广度和质量。
-
-
-
-
-
-
-
-
-