-
公开(公告)号:CN117076650A
公开(公告)日:2023-11-17
申请号:CN202311328288.0
申请日:2023-10-13
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/35 , G06F16/36 , G06N5/022 , G06N5/04
Abstract: 在本说明书提供的基于大语言模型的智能对话方法,根据用户输入的第一文本的分类结果,确定不同的对话方法,当用户输入的第一文本为非知识类文本时,将第一文本输入第三方大语言模型确定返回用户的目标文本。当用户输入的第一文本为知识类文本时,对第一文本进行本地搜索和线上搜索,再将第一文本和所有的搜索结果输入本地大语言模型,确定返回用户的目标文本,若不存在关联度大于预设值的检索结果,则将第一文本输入第三方大语言模型,将第三方大语言模型的输出结果作为返回用户的目标文本。通过在系统中融合若干个本地模型,减少了对第三方大语言模型的调用,降低了智能对话系统的使用成本的同时,也降低了智能对话过程的时延。
-
公开(公告)号:CN116860977A
公开(公告)日:2023-10-10
申请号:CN202311053620.7
申请日:2023-08-21
Applicant: 之江实验室
IPC: G06F16/35 , G06F16/34 , G06F18/2433 , G06F18/2135 , G06F18/2323
Abstract: 本发明公开了一种面向矛盾纠纷调解的异常检测系统及方法,包括:数据获取模块,获取原始表格数据;数据清洗模块,清洗数据获取有效数据;时序异常检测模块,从有效数据构建时序数据,对时序数据进行线性插值,并对其进行异常检测,得到异常时间段;主题聚类模块:从事项文本获取有效词向量,输入至文本聚类模型,提取事项的主题聚类结果;异常分析模块:对比异常时段与正常时段中事项主题分布的差异,进一步提取聚类主题,提取各聚类主题的关键词和摘要。本发明能够有效感知和汇聚近期异常的矛盾纠纷事件,为管理者提供异常报告,能够以数据驱动的方式提前感知问题,介入纠纷,避免纠纷的扩大和矛盾的深化,提高社会治理的智能化水平。
-
公开(公告)号:CN116205290B
公开(公告)日:2023-09-15
申请号:CN202310499470.6
申请日:2023-05-06
Applicant: 之江实验室
IPC: G06N3/096 , G06N3/0464 , G06V10/764 , G06V10/82 , G06V10/80 , G06V10/74
Abstract: 一种基于中间特征知识融合的知识蒸馏方法和装置,将图像数据喂入教师模型和学生模型,并提取教师模型和学生模型的各阶段中间特征;构建阶段级残差连接,将学生模型某一阶段中间特征与上一阶段特征实现特征知识融合;将教师模型与融合后的学生模型分别经过全局平均池化,构建出语义类别特征向量,对该特征向量计算交叉熵损失,以最大化特征相似性;将学生模型预测输出与类别标签的分类损失与特征向量相似性损失加权求和,训练学生模型。还包括一种基于中间特征知识融合的知识蒸馏系统。本发明相较于现有技术,本发明充分融合教师模型的中间特征知识,知识蒸馏性能更优。
-
公开(公告)号:CN116484768A
公开(公告)日:2023-07-25
申请号:CN202310598800.7
申请日:2023-05-25
IPC: G06F30/28 , G06F111/10 , G06F113/08 , G06F119/14
Abstract: 本说明书公开了一种系统动力学模型构建方法及装置,可以将用于构建系统动力学模型的各结构组件对应的配置代码语句和处理代码语句单独分割出来,可以使用户在需要构建系统动力学模型时,仅需要对各组件的主要参数进行配置,从而可以根据用户配置的参数实时生成由用户选定的指定编程语言编写的配置代码语句和处理代码语句,并基于生成的配置代码语句和处理代码语句构建系统动力学模型,进而可以提升系统动力学模型的构建效率。
-
公开(公告)号:CN119993301A
公开(公告)日:2025-05-13
申请号:CN202510467532.4
申请日:2025-04-15
Applicant: 之江实验室
IPC: G16C20/10 , G16C20/70 , G06N3/096 , G06N3/0455
Abstract: 本申请提供一种基于领域知识编辑的深度化学反应预测方法及系统。该方法包括:向待预测化学反应的反应数据添加化学反应约束作为动态约束标记,所述待预测化学反应的反应数据包括反应物或产物的SMILES字符串;构建所述反应物或产物的分子图;将所述分子图输入经训练的神经网络深度学习模型,获得符合所述化学反应约束的SMILES序列;对所述符合所述化学反应约束的SMILES序列进行后处理与验证,获得所述待预测化学反应的预测结果。
-
公开(公告)号:CN119847532A
公开(公告)日:2025-04-18
申请号:CN202510321770.4
申请日:2025-03-18
Applicant: 之江实验室
Abstract: 本申请公开了一种代码生成方法、装置、介质及设备,在接收到包含有用于描述待生成的代码在设定领域中所能实现功能信息的用户指令后,基于用户指令确定生成用户所需代码的各拆解步骤,并基于各拆解步骤从设定领域API库中确定与该用户指令相匹配的候选API的API列表,将API列表中的API与用户指令输入到大语言模型,使得大语言模型生成代码,通过解析生成的代码获得解析出的API,将其与API库中的API比对,更新API列表,以迭代生成代码,将执行代码时出现的错误信息反馈给大语言模型,并根据不同错误类型执行专项检索,以更新API列表,本申请显著增强领域代码生成的可靠性和准确率,为从业人员提供更高质量的编程支持。
-
公开(公告)号:CN119207609A
公开(公告)日:2024-12-27
申请号:CN202411728782.0
申请日:2024-11-28
Applicant: 之江实验室
IPC: G16C20/10
Abstract: 本说明书公开了一种化学反应式识别方法、装置、存储介质及设备,服务器可以从文档中智能地自动识别化学反应式,进而能够根据化学反应式中化学分子式的物种名称,精准地获取其相应的SMILES结构信息,并补全化学反应式中缺失的SMILES结构信息,以确保最终生成的是以SMILES形式完整表达的化学反应式。此外,服务器在最终输出以SMILES形式完整呈现的化学反应式之前,进行了化学反应式的有效性验证。从而极大地提升了信息识别的精确度和可靠性。
-
公开(公告)号:CN118378091A
公开(公告)日:2024-07-23
申请号:CN202410791652.5
申请日:2024-06-19
Applicant: 之江实验室
IPC: G06F18/214 , G06F18/27 , G06F18/2431 , G06N3/0464 , G06N3/084
Abstract: 测天文光红移的标准数据集和基线模型的构建方法和系统,其方法包括:收集与测光红移任务相关的天文图像数据,进行数据预处理;计算红移真值并进行归一化处理,将红移数据转换为三元组;选择深度模型,根据分类数量修改模型头部为并行的分类头和回归头,并随机初始化网络参数;对输入样本计算分类损失和回归损失,并使用梯度下降算法更新神经网络模型参数,直至模型在训练集上的损失不再降低;联合建模深度神经网络和贝叶斯神经网络实现红移的不确定性估计;最后将训练好的模型进行部署,完成红移估计任务。本发明针对测光红移估计问题,建立了完整的机器学习数据集和基线模型方法,推进了机器学习方法在天文测光红移问题的应用。
-
公开(公告)号:CN118365975A
公开(公告)日:2024-07-19
申请号:CN202410799005.9
申请日:2024-06-20
Applicant: 之江实验室
IPC: G06V10/764 , G06V10/774 , G06V10/776 , G06V10/82 , G06N3/0464 , G06N20/00
Abstract: 天文图像形态分类标准数据集和基线模型构建方法与系统,其方法包括:收集与形态分类任务相关的天文图像数据,设定形态分类问题;针对收集的图像数据和设立的形态分类问题进行粗标注,设计正负样本阈值机制筛选高质量的标注数据并划分训练集和验证集;选择待训练的深度模型,修改模型头部为多个并行的全连接,实现全连接网络与形态分类问题相互对应,随机初始化网络参数;计算每个全连接神经网络的预测值与真值之间的交叉熵之和作为训练损失,并根据梯度下降算法更新网络参数;最后将训练好的模型进行部署,完成形态分类任务。本发明建立了形态分类问题的标准数据集和评价指标,能够同时用于所有的形态分类问题。
-
公开(公告)号:CN117591661B
公开(公告)日:2024-04-26
申请号:CN202410076463.X
申请日:2024-01-18
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/36 , G06F40/211 , G06F40/30 , G06N3/09 , G06N3/0895
Abstract: 本说明书公开了一种基于大语言模型的问答数据构建方法及装置,可以从知识图谱中提取出基础三元组以及从文档库中提取出文本素材,而后,可以根据文本素材,对基础三元组进行补充,得到三元组集合;针对三元组集合中的每个三元组,可以确定该三元组的关联三元组以及从文本素材中确定出该三元组的关联文本段落,以得到多源知识数据。而后,可以根据多源知识数据,生成问答数据,可以对生成的问答数据进行标注,从而通过半监督的方式训练识别模型,以通过识别模型从问答数据中筛选出有效的问答数据,筛选出的有效的问答数据可以用于对大语言模型进行训练或微调,从而本方法能够提到生成问答数据的效率和有效性。
-
-
-
-
-
-
-
-
-