一种违规商品识别方法、装置、计算机设备和存储介质

    公开(公告)号:CN116051132A

    公开(公告)日:2023-05-02

    申请号:CN202310342924.9

    申请日:2023-04-03

    Abstract: 本发明公开了一种违规商品识别方法、装置、计算机设备和存储介质,该方法包括:首先根据多模态知识图谱数据集构建多模态知识图谱,并提取知识图谱中视觉模态实体的视觉特征和文本模态实体的文本特征;然后根据数据库获取商品图像和商品文本;再根据商品图像生成商品视觉特征;再根据商品文本生成商品文本特征;其次根据视觉特征和文本特征以及商品视觉特征和商品文本特征,采用实体链接方法将商品图像和商品文本链接到知识图谱中;最后根据链接后的知识图谱获取商品图像和商品文本的关联性,以判定商品违规情况。本发明通过引入知识图谱,基于知识实现商品违规风险合理推断,有覆盖面广、成本低、鲁棒性强等明显优点。

    一种知识图谱增强的大模型多跳推理方法和系统

    公开(公告)号:CN119293218A

    公开(公告)日:2025-01-10

    申请号:CN202411795064.5

    申请日:2024-12-09

    Abstract: 本发明公开了一种知识图谱增强的大模型多跳推理方法和系统,根据需要回答的问题,从外部知识图谱中提取以实体为中心的路径知识,并整合注入到大模型的理解和推理过程中,增强了大模型在解决复杂问题中的推理能力,并减少了幻觉现象。首先,基于给定的问题提取问题中的实体;接着,从外部知识图谱中搜索以实体为起点的多跳路径知识和以实体对为起终点的限长路径知识;随后,使用编码器计算给定问题和路径知识的嵌入向量并计算它们之间的相似性,保留相似度最高的路径知识;再利用大模型聚合筛选后的路径知识,形成全局知识;最后,使用预定义的指令模板整合筛选后的路径知识和聚合得到的全局知识到提示词中,激发大模型生成基于提供知识的答案。

    一种模型训练的方法以及分子结构信息的推荐方法及装置

    公开(公告)号:CN116597892A

    公开(公告)日:2023-08-15

    申请号:CN202310560994.1

    申请日:2023-05-15

    Abstract: 本说明书公开了一种模型训练的方法以及分子结构信息的推荐方法及装置,通过获取到的数据集,构建出指定蛋白降解靶向嵌合体的三维分子图信息,该三维分子图信息充分的表征出指定蛋白降解靶向嵌合体的分子结构的各种特征,将该三维分子图信息输入到预测模型中后,预测模型会根据三维分子图信息,来预测与指定蛋白降解靶向嵌合体组合成具有预设药物功能的分子片段的片段信息,作为目标片段信息,进而根据预测出的目标片段信息以及与指定蛋白降解靶向嵌合体对应的标签分子片段的片段信息之间的偏差,对预测模型进行训练,使得后续在预测分子结构的过程中,可以通过该预测模型实现快速、准确的分子片段预测,从而提高了分子片段探索的效率以及准确性。

    一种模型训练的方法以及分子结构信息的推荐方法及装置

    公开(公告)号:CN116597892B

    公开(公告)日:2024-03-19

    申请号:CN202310560994.1

    申请日:2023-05-15

    Abstract: 本说明书公开了一种模型训练的方法以及分子结构信息的推荐方法及装置,通过获取到的数据集,构建出指定蛋白降解靶向嵌合体的三维分子图信息,该三维分子图信息充分的表征出指定蛋白降解靶向嵌合体的分子结构的各种特征,将该三维分子图信息输入到预测模型中后,预测模型会根据三维分子图信息,来预测与指定蛋白降解靶向嵌合体组合成具有预设药物功能的分子片段的片段信息,作为目标片段信息,进而根据预测出的目标片段信息以及与指定蛋白降解靶向嵌合体对应的标签分子片段的片段信息之间的偏差,对预测模型进行训练,使得后续在预测分子结构的过程中,可以通过该预测模型实现快速、准确的分子片段预测,从而提高了分子片段探索的效率以及准确性。

    一种同义词挖掘方法、装置、存储介质及电子设备

    公开(公告)号:CN116340469B

    公开(公告)日:2023-08-11

    申请号:CN202310615472.7

    申请日:2023-05-29

    Abstract: 本说明书公开了一种同义词挖掘方法、装置、存储介质及电子设备,本说明书实施例基于用户同一会话下的搜索词序列所产生的搜索日志序列中的曝光日志和点击日志,确定出搜索日志序列的编码字符串和搜索词序列的搜索词串。基于“换词搜索后点击”代表换词之前的搜索词与换词后点击时的搜索词很大可能是同义词的原理,根据预设的编码字符模式,从搜索词串中提取子搜索词串,基于子搜索词串,挖掘出候选同义词对,并基于候选同义词对,确定出最终同义词对。在此方法中,采用用户针对搜索词的上下文日志,以及结合用户执行点击行为前后的搜索词来挖掘同义词,可以避免同一搜索词在不同语境下的不同意思,从而提高挖掘同义词对的准确性。

    一种同义词挖掘方法、装置、存储介质及电子设备

    公开(公告)号:CN116340469A

    公开(公告)日:2023-06-27

    申请号:CN202310615472.7

    申请日:2023-05-29

    Abstract: 本说明书公开了一种同义词挖掘方法、装置、存储介质及电子设备,本说明书实施例基于用户同一会话下的搜索词序列所产生的搜索日志序列中的曝光日志和点击日志,确定出搜索日志序列的编码字符串和搜索词序列的搜索词串。基于“换词搜索后点击”代表换词之前的搜索词与换词后点击时的搜索词很大可能是同义词的原理,根据预设的编码字符模式,从搜索词串中提取子搜索词串,基于子搜索词串,挖掘出候选同义词对,并基于候选同义词对,确定出最终同义词对。在此方法中,采用用户针对搜索词的上下文日志,以及结合用户执行点击行为前后的搜索词来挖掘同义词,可以避免同一搜索词在不同语境下的不同意思,从而提高挖掘同义词对的准确性。

    一种知识图谱增强的大模型多跳推理方法和系统

    公开(公告)号:CN119293218B

    公开(公告)日:2025-03-07

    申请号:CN202411795064.5

    申请日:2024-12-09

    Abstract: 本发明公开了一种知识图谱增强的大模型多跳推理方法和系统,根据需要回答的问题,从外部知识图谱中提取以实体为中心的路径知识,并整合注入到大模型的理解和推理过程中,增强了大模型在解决复杂问题中的推理能力,并减少了幻觉现象。首先,基于给定的问题提取问题中的实体;接着,从外部知识图谱中搜索以实体为起点的多跳路径知识和以实体对为起终点的限长路径知识;随后,使用编码器计算给定问题和路径知识的嵌入向量并计算它们之间的相似性,保留相似度最高的路径知识;再利用大模型聚合筛选后的路径知识,形成全局知识;最后,使用预定义的指令模板整合筛选后的路径知识和聚合得到的全局知识到提示词中,激发大模型生成基于提供知识的答案。

    一种违规商品识别方法、装置、计算机设备和存储介质

    公开(公告)号:CN116051132B

    公开(公告)日:2023-06-30

    申请号:CN202310342924.9

    申请日:2023-04-03

    Abstract: 本发明公开了一种违规商品识别方法、装置、计算机设备和存储介质,该方法包括:首先根据多模态知识图谱数据集构建多模态知识图谱,并提取知识图谱中视觉模态实体的视觉特征和文本模态实体的文本特征;然后根据数据库获取商品图像和商品文本;再根据商品图像生成商品视觉特征;再根据商品文本生成商品文本特征;其次根据视觉特征和文本特征以及商品视觉特征和商品文本特征,采用实体链接方法将商品图像和商品文本链接到知识图谱中;最后根据链接后的知识图谱获取商品图像和商品文本的关联性,以判定商品违规情况。本发明通过引入知识图谱,基于知识实现商品违规风险合理推断,有覆盖面广、成本低、鲁棒性强等明显优点。

    一种训练数据有效性评估方法、系统及装置

    公开(公告)号:CN119441805A

    公开(公告)日:2025-02-14

    申请号:CN202411481596.1

    申请日:2024-10-23

    Abstract: 本发明提供一种训练数据有效性评估方法、系统及装置,所述方法包括:获取训练集,所述训练集为从待评估数据中均匀降采样所得;获取测试集,所述测试集包括至少1个基准测试集和至少1个关联测试集;用所述训练集训练一个探针模型;用所述测试集对所述探针模型进行测试,记录测试指标;根据所述测试指标作观测图,所述作观测图包括:以基准测试集测试指标为横轴、关联测试集测试指标为纵轴建立直角坐标系;根据所述测试指标在所述直角坐标系中画出关键点;根据所述观测图对待评估数据做出有效性评价。本发明的优点在于:可以用很低的算力,迅速给出数据有效性评估,能提高模型研发迭代效率,尤其是对前沿的复杂模型,增益更明显。

Patent Agency Ranking