-
公开(公告)号:CN116312864B
公开(公告)日:2023-10-27
申请号:CN202310122433.3
申请日:2023-01-19
Applicant: 之江实验室
Abstract: 一种基于过滤曲率的预测一个分子和一个蛋白质的结合亲和力的系统,包括数据存储器、数据整理器和模型预测器。数据整理器使用数据存储器中存储的蛋白质‑‑配体数据生成图和图的结构,并将所述的图和图的结构传递给模型预测器以预测结合亲和力。数据整理器的图模块使用数据预处理模块从所述的蛋白质—配体数据中提取亲和力、原子的坐标和属性生成图,结构模块使用所述的图生成图的结构。模型预测器的过滤曲率模块将图中的原子间的距离信息和曲率信息融合成边的表示。而基于角度和自适应图注意力机制的SIHN模块利用个性化的注意力机制将图的角度信息纳入图表示从而预测结合亲和力。本发明还包括一种基于过滤曲率的预测一个分子和一个蛋白质的结合亲和力的方法。
-
公开(公告)号:CN116757278A
公开(公告)日:2023-09-15
申请号:CN202311053464.4
申请日:2023-08-21
Applicant: 之江实验室
Abstract: 本说明书公开了一种预测模型的训练方法、装置、存储介质及电子设备,通过对样本图中的各节点进行聚类,再基于聚类结果中与目标节点属于相同聚类簇但与目标节点不存在链接关系的各节点,以及与所述目标节点距离较近但与该目标节点之间也不存在链接关系的各节点,确定指定节点,并将该指定节点和目标节点进行组合得到负样本对,以及根据确定出的负样本对和基于样本图中原有的链接关系确定出的正样本对,对该预测模型进行训练。本方法能充分考虑并利用节点间的相似信息进行负采样,从而使得训练得到的预测模型,可针对每个节点,准确预测其他节点与该节点之间存在链接关系的可能性,提高了预测结果的准确率。
-
公开(公告)号:CN116453615A
公开(公告)日:2023-07-18
申请号:CN202310420710.9
申请日:2023-04-14
Applicant: 之江实验室
Abstract: 本说明书公开了一种预测方法、装置、可读存储介质及电子设备,基于待预测分子的分子结构,通过图神经网络模型,确定该待预测分子的子结构对应的指定子图,进而基于指定子图对应的指定特征,以及预设的各指定性质的表征特征,确定指定子图具有的指定性质,进而预测该待预测分子的分子性质。可见,该待预测分子具有其对应的分子性质,是因为该待预测分子包含具有指定性质的子结构。显然,该预测方法为该待预测分子具有其对应的分子性质提供了可解释性,保证了该预测结果的可信度。
-
公开(公告)号:CN116312864A
公开(公告)日:2023-06-23
申请号:CN202310122433.3
申请日:2023-01-19
Applicant: 之江实验室
Abstract: 一种基于过滤曲率的预测一个分子和一个蛋白质的结合亲和力的系统,包括数据存储器、数据整理器和模型预测器。数据整理器使用数据存储器中存储的蛋白质‑‑配体数据生成图和图的结构,并将所述的图和图的结构传递给模型预测器以预测结合亲和力。数据整理器的图模块使用数据预处理模块从所述的蛋白质—配体数据中提取亲和力、原子的坐标和属性生成图,结构模块使用所述的图生成图的结构。模型预测器的过滤曲率模块将图中的原子间的距离信息和曲率信息融合成边的表示。而基于角度和自适应图注意力机制的SIHN模块利用个性化的注意力机制将图的角度信息纳入图表示从而预测结合亲和力。本发明还包括一种基于过滤曲率的预测一个分子和一个蛋白质的结合亲和力的方法。
-
公开(公告)号:CN116051132A
公开(公告)日:2023-05-02
申请号:CN202310342924.9
申请日:2023-04-03
Applicant: 之江实验室
IPC: G06Q30/018 , G06N5/02 , G06N3/0464 , G06N3/08 , G06V10/40 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种违规商品识别方法、装置、计算机设备和存储介质,该方法包括:首先根据多模态知识图谱数据集构建多模态知识图谱,并提取知识图谱中视觉模态实体的视觉特征和文本模态实体的文本特征;然后根据数据库获取商品图像和商品文本;再根据商品图像生成商品视觉特征;再根据商品文本生成商品文本特征;其次根据视觉特征和文本特征以及商品视觉特征和商品文本特征,采用实体链接方法将商品图像和商品文本链接到知识图谱中;最后根据链接后的知识图谱获取商品图像和商品文本的关联性,以判定商品违规情况。本发明通过引入知识图谱,基于知识实现商品违规风险合理推断,有覆盖面广、成本低、鲁棒性强等明显优点。
-
公开(公告)号:CN120069098A
公开(公告)日:2025-05-30
申请号:CN202510549483.9
申请日:2025-04-29
Applicant: 之江实验室
IPC: G06N5/04 , G06N5/022 , G06F16/3329
Abstract: 本申请一种垂直领域大模型的微调方法、装置及介质,该方法包括:从指定领域的知识图谱中,提取初始三元组;基于预先构建的问答提示词工程和初始三元组,调用指定大模型生成关于初始三元组的问答对;确定用于表征问答对质量的质量分数;质量分数越大,问答对的质量越高;通过质量分数大于阈值的目标问答对,对垂直领域大模型进行微调训练。由此,基于问答提示词和知识图谱的初始三元组,指定大模型可以快速生成高质量问答对,避免丢失三元组中的有效信息。此外,基于问答对质量分数的筛选,通过高质量的目标问答对对垂直领域大模型进行微调训练,提升大模型在垂直领域的问答准确性。
-
公开(公告)号:CN119990184A
公开(公告)日:2025-05-13
申请号:CN202510461285.7
申请日:2025-04-14
Applicant: 之江实验室
IPC: G06N3/042 , G06N3/0464 , G06N3/08
Abstract: 本说明书公开了一种基于能量约束的高深度图神经网络构建方法和装置,获取待定图神经网络,待定图神经网络包括多个残差层,残差层包含图卷积子层和第一组合子层,残差层对图卷积子层与第一组合子层输出做线性组合,第一组合子层线性组合之前各个残差层的输出的两组线性组合中的一个和另一个的投射。本方法中,通过将残差层的可学习参数矩阵设置为单位矩阵,将残差层的狄利克雷能量约束在指定范围,确定各组合系数,得到目标图神经网络。本发明通过构建所述的模型,能够用于生成人物画像,网络攻击检测和学术知识图谱学科分类等。本发明的优点有两个方面,一是解决了图神经网络的过平滑问题,另一个是可产生大批量的高深度图神经网。
-
公开(公告)号:CN119378524B
公开(公告)日:2025-04-18
申请号:CN202411954877.4
申请日:2024-12-27
Applicant: 之江实验室
IPC: G06F40/186 , G06F16/34 , G06F16/35
Abstract: 本说明书公开了一种信息图生成方法、装置、设备及可读存储介质,从获取的数据文件中提取总结性摘要,从预先构建的信息图模板库中选择目标模板,根据总结性摘要、数据文件和目标模板得到数据事实,根据数据事实生成可视化图表,并将可视化图表填入目标模板得到目标信息图。可见,以从数据文件中提取的总结性摘要和数据文件本身为依据,通过大语言模型生成适配目标模板的数据事实,能够客观地描述数据文件,并且,基于数据事实生成的信息图能够以美观的布局结构充分展示数据文件,可以直接应用于特定专业领域,在降低信息图生成门槛的同时,提升了效率。
-
公开(公告)号:CN119150996B
公开(公告)日:2025-03-18
申请号:CN202411624995.9
申请日:2024-11-14
Applicant: 之江实验室
Abstract: 本发明公开了一种结构感知的大模型图推理方法和系统,能够将图数据转化为结构感知的序列,支持大模型的零样本推理,从而高效且准确地完成图推理任务。包括:首先,准备图数据和图推理任务,图数据包括节点、边及其特征,然后对图数据进行标准化处理,并对图数据进行结构化编码;接着,将结构化编码的图数据转化为结构感知的序列,该序列可以是代码语言或者标准的图查询语言;随后,将序列化的图数据输入到大模型中,并设计特定的输入格式和任务描述,使大模型能够理解和执行图推理任务;紧接着,从大模型的输出中解析推理的结果,转化为结构化数据或者自然语言描述,供用户或者其他系统使用;最后,对推理结果进行验证和评估,确保结果的可靠性。
-
公开(公告)号:CN119441805A
公开(公告)日:2025-02-14
申请号:CN202411481596.1
申请日:2024-10-23
Applicant: 之江实验室
IPC: G06F18/21 , G06F18/214 , G06N3/045 , G06N3/084 , G06V10/774 , G06V10/776 , G06V10/82
Abstract: 本发明提供一种训练数据有效性评估方法、系统及装置,所述方法包括:获取训练集,所述训练集为从待评估数据中均匀降采样所得;获取测试集,所述测试集包括至少1个基准测试集和至少1个关联测试集;用所述训练集训练一个探针模型;用所述测试集对所述探针模型进行测试,记录测试指标;根据所述测试指标作观测图,所述作观测图包括:以基准测试集测试指标为横轴、关联测试集测试指标为纵轴建立直角坐标系;根据所述测试指标在所述直角坐标系中画出关键点;根据所述观测图对待评估数据做出有效性评价。本发明的优点在于:可以用很低的算力,迅速给出数据有效性评估,能提高模型研发迭代效率,尤其是对前沿的复杂模型,增益更明显。
-
-
-
-
-
-
-
-
-