-
公开(公告)号:CN119578426A
公开(公告)日:2025-03-07
申请号:CN202411616032.4
申请日:2024-11-13
Applicant: 中国科学院计算技术研究所
IPC: G06F40/30 , G06F40/284 , G06F16/36 , G06F16/31 , G06N20/00
Abstract: 本发明提供了一种数字内容标识体系的构建方法,包括:利用预训练的大语言模型,生成模型训练所需的训练数据;根据所述训练数据从不同维度构建初始的树状结构,形成初始标识体系;从所述初始标识体系提取标识数据,构建正负样本对,并利用所述正负样本对将语义嵌入模型进行微调;利用微调后的所述语义嵌入模型,将新出现的数字内容标识与标识体系里的标识进行语义比较,确定所述新数字内容标识在所述树状结构中的内容关联的同级结点,并将所述新数字内容标识定位到所述同级结点处。本发明还提供一种数字内容标识体系的构建系统、存储介质及电子设备。借此,本发明在无需大量基础数据情况下,能够构建一个准确捕捉词语深层语义关系的标识体系,使得标识集结构化和关系化,便于分析、展示和持续更新。
-
公开(公告)号:CN118427348A
公开(公告)日:2024-08-02
申请号:CN202410527639.9
申请日:2024-04-29
Applicant: 中国科学院计算技术研究所
IPC: G06F16/35 , G06F18/213 , G06F18/23
Abstract: 本发明提出一种链上多模态数字内容的标识集构建方法及装置,包括:利用区块链交互库,对目标智能合约中的元数据更新事件进行监测,当该目标智能合约的元数据发生更新,采用多模态模型,分析更新后的元数据,将其转换成文本描述;提取该文本描述和该元数据的语义信息,得到其高维语义特征;将该高维语义特征转换到低维空间,得到低维语义特征;根据该低维语义特征对该文本描述和该元数据的语义信息进行聚类,得到多个聚类,每个聚类对应一个新主题;从每个聚类中提取关键词,作为该新主题的主题内容,将各个新主题和其对应的主题内容作为该目标智能合约的数字内容标识集构建结果。
-