-
公开(公告)号:CN118839053A
公开(公告)日:2024-10-25
申请号:CN202411321148.5
申请日:2024-09-23
Applicant: 之江实验室
IPC: G06F16/951 , G06F16/955 , G06N3/0455 , G06F40/186
Abstract: 本申请涉及一种网页数据采集方法、系统、计算机设备和可读存储介质。该方法采集到的网页数据用于对目标领域的大语言模型进行预训练,所述方法包括:确定目标场景模板和目标关键词;将所述目标关键词填充到所述目标场景模板中,调用通用的大语言模型,生成多个搜索词句;调用搜索服务,基于所述搜索词句生成第一URL列表;基于爬虫技术和所述第一URL列表采集得到网页数据。采用本方法能够降低硬件资源消耗成本、人力成本以及提高预训练数据的获取效率。
-
公开(公告)号:CN119201746B
公开(公告)日:2025-05-13
申请号:CN202411494940.0
申请日:2024-10-24
Applicant: 之江实验室
IPC: G06F11/3604 , G06F11/3668
Abstract: 本说明书公开了一种智能飞行体的飞行测试方法、装置、介质及电子设备,包括:确定智能飞行体的测试需求,将测试需求输入预先训练的初始态生成模型,确定智能飞行体的第一初始态。根据第一初始态,确定智能飞行体的第一测试用例。根据第一测试用例,对智能飞行体进行飞行测试。通过基于测试需求,采用初始态生成模型,生成智能飞行体的第一初始态,并基于第一初始态,对智能飞行体进行飞行测试,使得可覆盖更多飞行姿态,最大化测试覆盖面,减少飞行测试盲区,缩短测试周期,提高智能飞行体的性能。
-
公开(公告)号:CN119201746A
公开(公告)日:2024-12-27
申请号:CN202411494940.0
申请日:2024-10-24
Applicant: 之江实验室
IPC: G06F11/36
Abstract: 本说明书公开了一种智能飞行体的飞行测试方法、装置、介质及电子设备,包括:确定智能飞行体的测试需求,将测试需求输入预先训练的初始态生成模型,确定智能飞行体的第一初始态。根据第一初始态,确定智能飞行体的第一测试用例。根据第一测试用例,对智能飞行体进行飞行测试。通过基于测试需求,采用初始态生成模型,生成智能飞行体的第一初始态,并基于第一初始态,对智能飞行体进行飞行测试,使得可覆盖更多飞行姿态,最大化测试覆盖面,减少飞行测试盲区,缩短测试周期,提高智能飞行体的性能。
-
公开(公告)号:CN117743476B
公开(公告)日:2024-11-26
申请号:CN202311554759.X
申请日:2023-11-21
Applicant: 之江实验室
IPC: G06F16/28 , G06F16/21 , G06F16/215 , G06F16/22 , G06F16/242 , G06F16/25
Abstract: 本发明公开了一种面向核聚变数据标准化的数据仓库架构及数据处理系统,包括:操作型数据层,用于提取并转存核聚变业务数据,核聚变业务数据包括:核聚变数据业务操作数据、核聚变物理/业务实体数据、聚变实验数据;数据标准层,用于通过数据工具集对核聚变业务数据进行清洗、标准化;语义标准层,用于基于核聚变业务数据获取事实表、数据维表;根据核聚变数据业务建立雪花模型维护事实表与数据维表;并将聚变实验数据与事实表、数据维表建立关系,得到数据宽表;分析标准层,用于对语义标准层提供的数据宽表进行主题分类,得到每个主题下的数据宽表;数据应用层,用于将每个主题下的数据宽表面向目标维度进行聚合或数据转换。
-
公开(公告)号:CN119202730A
公开(公告)日:2024-12-27
申请号:CN202411717226.3
申请日:2024-11-27
Applicant: 之江实验室
IPC: G06F18/214 , G06F18/2431 , G06F18/22 , G06N20/00
Abstract: 本说明书公开了一种游戏决策模型训练方法、装置、存储介质及电子设备,获取样本玩家的历史游戏视频,对历史游戏视频进行数据提取,确定指定时间段内样本玩家的游戏数据,并作为训练样本,以及确定在训练样本对应的游戏状态下样本玩家执行的决策对应的第一决策信息,并作为训练样本的第一标注。确定训练样本对应的第一提示文本,并将第一提示文本和训练样本输入通用大语言模型,确定通用大语言模型输出的第一信息。将第一标注和第一信息作为训练样本的第二标注,根据训练样本和第二标注,对待训练的游戏决策模型进行训练,以使得训练完成的游戏决策模型可用于根据待决策玩家的游戏数据,确定游戏决策,提高了游戏决策的生成速度以及准确性。
-
公开(公告)号:CN119007088A
公开(公告)日:2024-11-22
申请号:CN202411478721.3
申请日:2024-10-22
Applicant: 之江实验室
IPC: G06V20/40 , G06V10/764 , G06V10/774
Abstract: 本说明书公开了一种模型训练及轨迹预测方法、装置、介质及设备。包括获取历史视频数据,确定轨迹预测的目标物。根据目标物在历史视频数据中各帧图像对应的坐标,确定目标物的初始坐标序列。根据预设的扰动参数以及初始坐标序列,确定扰动后的初始坐标序列。针对每轮训练,将扰动后的初始坐标序列输入待训练的预测模型,得到预测模型输出的预测坐标序列,并根据预测坐标序列与目标物实际坐标序列之间的第一差异,确定第一损失值,以及根据初始坐标序列和扰动后的初始坐标序列,确定第二损失值。根据第一损失值与第二损失值,确定该轮训练对应的综合损失值,以根据该轮训练对应的综合损失值,对待训练的预测模型进行训练。
-
公开(公告)号:CN117743476A
公开(公告)日:2024-03-22
申请号:CN202311554759.X
申请日:2023-11-21
Applicant: 之江实验室
IPC: G06F16/28 , G06F16/21 , G06F16/215 , G06F16/22 , G06F16/242 , G06F16/25
Abstract: 本发明公开了一种面向核聚变数据标准化的数据仓库架构及数据处理系统,包括:操作型数据层,用于提取并转存核聚变业务数据,核聚变业务数据包括:核聚变数据业务操作数据、核聚变物理/业务实体数据、聚变实验数据;数据标准层,用于通过数据工具集对核聚变业务数据进行清洗、标准化;语义标准层,用于基于核聚变业务数据获取事实表、数据维表;根据核聚变数据业务建立雪花模型维护事实表与数据维表;并将聚变实验数据与事实表、数据维表建立关系,得到数据宽表;分析标准层,用于对语义标准层提供的数据宽表进行主题分类,得到每个主题下的数据宽表;数据应用层,用于将每个主题下的数据宽表面向目标维度进行聚合或数据转换。
-
公开(公告)号:CN117555867A
公开(公告)日:2024-02-13
申请号:CN202311408184.0
申请日:2023-10-26
Applicant: 之江实验室
IPC: G06F16/172 , G06F18/22 , G06F16/23 , G06F16/16 , G06F16/178
Abstract: 本申请涉及一种针对大科学装置的科学实验数据管理方法、装置和系统。所述方法包括:获取待存储目标数据;基于预设的数据类型将待存储目标数据进行分割,得到与科学实验一一对应的至少一种待存储实验数据,并将所有待存储实验数据存储至预设的私有存储系统中;获取对应于待存储目标数据的存储指令,基于存储指令从待存储实验数据中确定公有文件,并将公有文件基于私有存储系统上传到预设的公有存储系统中,得到对应于待存储目标数据的存储结果。采用本方法能够提高科学装置相关的数据存储效率,并提高针对实验数据的管理效率。
-
公开(公告)号:CN118839053B
公开(公告)日:2025-02-11
申请号:CN202411321148.5
申请日:2024-09-23
Applicant: 之江实验室
IPC: G06F16/951 , G06F16/955 , G06N3/0455 , G06F40/186
Abstract: 本申请涉及一种网页数据采集方法、系统、计算机设备和可读存储介质。该方法采集到的网页数据用于对目标领域的大语言模型进行预训练,所述方法包括:确定目标场景模板和目标关键词;将所述目标关键词填充到所述目标场景模板中,调用通用的大语言模型,生成多个搜索词句;调用搜索服务,基于所述搜索词句生成第一URL列表;基于爬虫技术和所述第一URL列表采集得到网页数据。采用本方法能够降低硬件资源消耗成本、人力成本以及提高预训练数据的获取效率。
-
公开(公告)号:CN119357275A
公开(公告)日:2025-01-24
申请号:CN202411920576.X
申请日:2024-12-25
Applicant: 之江实验室
IPC: G06F16/25 , G06F16/28 , G06N5/04 , G06N3/0455 , G06N3/08
Abstract: 基于异构数据库和大语言模型的训练数据管理系统及方法,系统包括:异构数据库系统模块,包括多个支持不同数据类型的数据库;数据管理注册中心模块,用于管理所述多个数据库及所注册的数据服务的节点信息;前置大语言模型模块,用于解析客户端发送的自然语言指令,对应生成用于描述所述数据服务的标准执行语句;数据服务控制器模块,用于解析所述标准执行语句并转换为目标执行语句,基于所述目标执行语句从所述数据管理注册中心模块中对应的节点信息调用对应的数据服务,以在对应的数据库上执行对应的操作。本申请可提升查询并收集特定训练数据等数据服务的效率,并大大降低数据管理的复杂性。
-
-
-
-
-
-
-
-
-