测天文光红移的标准数据集和基线模型的构建方法和系统

    公开(公告)号:CN118378091B

    公开(公告)日:2024-09-24

    申请号:CN202410791652.5

    申请日:2024-06-19

    Abstract: 测天文光红移的标准数据集和基线模型的构建方法和系统,其方法包括:收集与测光红移任务相关的天文图像数据,进行数据预处理;计算红移真值并进行归一化处理,将红移数据转换为三元组;选择深度模型,根据分类数量修改模型头部为并行的分类头和回归头,并随机初始化网络参数;对输入样本计算分类损失和回归损失,并使用梯度下降算法更新神经网络模型参数,直至模型在训练集上的损失不再降低;联合建模深度神经网络和贝叶斯神经网络实现红移的不确定性估计;最后将训练好的模型进行部署,完成红移估计任务。本发明针对测光红移估计问题,建立了完整的机器学习数据集和基线模型方法,推进了机器学习方法在天文测光红移问题的应用。

    天文图像形态分类标准数据集和基线模型构建方法与系统

    公开(公告)号:CN118365975B

    公开(公告)日:2024-09-06

    申请号:CN202410799005.9

    申请日:2024-06-20

    Abstract: 天文图像形态分类标准数据集和基线模型构建方法与系统,其方法包括:收集与形态分类任务相关的天文图像数据,设定形态分类问题;针对收集的图像数据和设立的形态分类问题进行粗标注,设计正负样本阈值机制筛选高质量的标注数据并划分训练集和验证集;选择待训练的深度模型,修改模型头部为多个并行的全连接,实现全连接网络与形态分类问题相互对应,随机初始化网络参数;计算每个全连接神经网络的预测值与真值之间的交叉熵之和作为训练损失,并根据梯度下降算法更新网络参数;最后将训练好的模型进行部署,完成形态分类任务。本发明建立了形态分类问题的标准数据集和评价指标,能够同时用于所有的形态分类问题。

    化学工艺时间序列数据因果关系图构建方法、装置和介质

    公开(公告)号:CN118053518A

    公开(公告)日:2024-05-17

    申请号:CN202410451611.1

    申请日:2024-04-16

    Abstract: 本发明涉及化学工艺时间序列数据因果关系图构建方法、装置和介质,方法包括:将实际的化学工艺时间序列数据集输入因果关系图构建模型,得到实际权重矩阵,转化为因果关系图,因果关系图构建模型的训练过程为:S1、获取训练用的化学工艺时间序列数据集;S2、基于时间卷积网络编码器‑解码器,得到重建特征;S3、将自注意力编码器的输出作为图卷积网络的初始化的邻接矩阵,图卷积网络输出特征矩阵;S4、特征矩阵输入多层感知器网络,输出变量预测值;S5、构建联合损失函数,基于联合损失函数进行迭代训练,得到训练完成的因果关系图构建模型。与现有技术相比,本发明具有提高因果发现的准确性等优点。

    一种基于语义的多源表格自动匹配方法、装置及存储介质

    公开(公告)号:CN117252183B

    公开(公告)日:2024-04-02

    申请号:CN202311285984.8

    申请日:2023-10-07

    Abstract: 本说明书公开了一种基于语义的多源表格自动匹配方法、装置及存储介质,首先获取两个待匹配的表格,针对每个待匹配的表格,确定该表格的结构和该表格中实体单元格的语义以及列类型。根据每个表格的列类型,进行初步匹配得到初步匹配结果,并将初步匹配结果中存在匹配关系的列作为目标列,计算目标列之间的第一相似度和第二相似度,确定两个表格中的目标列是否匹配。从上述方法中可以看出,本申请对两个表格进行相似度匹配前,先确定出了表格语义和列类型,以对全表格的语义信息进行解析,在语义信息的基础上进行相似度匹配,使得多源表格相似度匹配更加高效准确,方便后续对多源表格进行关联分析。

    一种基于大语言模型的智能对话方法、装置、介质及设备

    公开(公告)号:CN117076650B

    公开(公告)日:2024-02-23

    申请号:CN202311328288.0

    申请日:2023-10-13

    Abstract: 在本说明书提供的基于大语言模型的智能对话方法,根据用户输入的第一文本的分类结果,确定不同的对话方法,当用户输入的第一文本为非知识类文本时,将第一文本输入第三方大语言模型确定返回用户的目标文本。当用户输入的第一文本为知识类文本时,对第一文本进行本地搜索和线上搜索,再将第一文本和所有的搜索结果输入本地大语言模型,确定返回用户的目标文本,若不存在关联度大于预设值的检索结果,则将第一文本输入第三方大语言模型,将第三方大语言模型的输出结果作为返回用户的目标文本。通过在系统中融合若干个本地模型,减少了对第三方大语言模型的调用,降低了智能对话系统的使用成本的同时,也降低了智能对话过程的时延。

    一种自适应权重的视觉深度特征重建方法和装置

    公开(公告)号:CN117152752B

    公开(公告)日:2024-02-20

    申请号:CN202311415421.6

    申请日:2023-10-30

    Abstract: 本发明公开了一种自适应权重的视觉深度特征重建方法和装置,将训练集图像分别输入视觉编码器E1和视觉编码器E2,以视觉编码器E2计算得到的重建特征目标#imgabs0#作为视觉编码器E1的监督信号;根据监督特征自身的数值大小,构建特征重建损失#imgabs1#,使视觉编码器E1在训练过程中,更加关注监督特征的重要信息,减弱无关冗余信息对特征学习的影响。实践表明,本发明能够简单有效的提升编码器对数据的表征能力,并且,相对于现有技术方法,不需要额外的训练成本,能够充分利用监督特征的有益知识信息。

    一种机器阅读方法、装置、存储介质及电子设备

    公开(公告)号:CN116720008B

    公开(公告)日:2024-01-09

    申请号:CN202311010113.5

    申请日:2023-08-11

    Abstract: 本说明书公开了一种机器阅读方法、装置、存储介质及电子设备。在采用本说明书提供的机器阅读方法,确定目标问题的目标答案时,可通过搜索引擎获取目标问题的候选文本,并以匹配度计算的方式确定出与目标问题匹配的匹配文本;通过预先训练的阅读模型以及生成式模型,根据目标问题与匹配文本,分别得到第一候选答案和第二候选答案;最终根据目标问题与各候选答案之间的相似度确定出最终的候选答案并回复给用户。在采用本方法时可无需预先设置具有庞大数据量的问答模板以及知识库等内容,实施成本较低,且能够适用于多种不同的场景,灵活性较强。

    一种基于语义的多源表格自动匹配方法、装置及存储介质

    公开(公告)号:CN117252183A

    公开(公告)日:2023-12-19

    申请号:CN202311285984.8

    申请日:2023-10-07

    Abstract: 本说明书公开了一种基于语义的多源表格自动匹配方法、装置及存储介质,首先获取两个待匹配的表格,针对每个待匹配的表格,确定该表格的结构和该表格中实体单元格的语义以及列类型。根据每个表格的列类型,进行初步匹配得到初步匹配结果,并将初步匹配结果中存在匹配关系的列作为目标列,计算目标列之间的第一相似度和第二相似度,确定两个表格中的目标列是否匹配。从上述方法中可以看出,本申请对两个表格进行相似度匹配前,先确定出了表格语义和列类型,以对全表格的语义信息进行解析,在语义信息的基础上进行相似度匹配,使得多源表格相似度匹配更加高效准确,方便后续对多源表格进行关联分析。

    一种机器阅读方法、装置、存储介质及电子设备

    公开(公告)号:CN116720008A

    公开(公告)日:2023-09-08

    申请号:CN202311010113.5

    申请日:2023-08-11

    Abstract: 本说明书公开了一种机器阅读方法、装置、存储介质及电子设备。在采用本说明书提供的机器阅读方法,确定目标问题的目标答案时,可通过搜索引擎获取目标问题的候选文本,并以匹配度计算的方式确定出与目标问题匹配的匹配文本;通过预先训练的阅读模型以及生成式模型,根据目标问题与匹配文本,分别得到第一候选答案和第二候选答案;最终根据目标问题与各候选答案之间的相似度确定出最终的候选答案并回复给用户。在采用本方法时可无需预先设置具有庞大数据量的问答模板以及知识库等内容,实施成本较低,且能够适用于多种不同的场景,灵活性较强。

Patent Agency Ranking