-
公开(公告)号:CN116561335A
公开(公告)日:2023-08-08
申请号:CN202310403733.9
申请日:2023-04-14
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/36 , G06F16/901 , G06F16/35 , G06F40/211
Abstract: 本发明实施例涉及一种图谱构建方法、装置、电子设备及存储介质,所述方法包括:从预设的产业数据库中确定与目标产业匹配的产业数据;根据所述产业数据确定产业链图谱中各实体之间的上下位关系;获取所述目标产业的企业信息;根据所述上下位关系及所述企业信息,构建所述目标产业的产业链图谱。由此,可以实现准确确定产业链图谱中各实体之间的上下位关系,避免需要人工大量的查阅产业资料,简化操作流程,提升了产业链图谱生成的便利性,一定程度上解决了人工构建可能不全面的问题。
-
公开(公告)号:CN116561334A
公开(公告)日:2023-08-08
申请号:CN202310403556.4
申请日:2023-04-14
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06F16/36 , G06F16/31 , G06N3/0464 , G06F18/22 , G06N3/084
Abstract: 本发明实施例涉及一种关系抽取方法、装置、图谱构建方法及存储介质,所述方法包括:确定预设实体库中各实体之间的关系,所述关系为所述实体库中技术与技术之间的关系,和/或所述实体库中技术与企业之间的关系;根据所述实体库中所述实体之间的关系,建立邻接矩阵;基于所述邻接矩阵,构建与所述实体对应的图卷积网络;利用所述图卷积网络抽取所述实体库中各实体之间的关系。由此,可以实现确定预设实体库中各实体之间的关系,根据实体之间的关系建立邻接矩阵,进而构建与实体对应的图卷积网络,以实现基于图卷积网络简单、便捷地确定各个实体之间的关系,提高效率,提升用户体验。
-
公开(公告)号:CN113378090A
公开(公告)日:2021-09-10
申请号:CN202110445408.X
申请日:2021-04-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958 , G06F16/35 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种互联网网站相似度分析方法、装置以及可读存储介质,方法包括:从多个未分类的互联网网站中提取文本特征词;将各个未分类的互联网网站的文本特征词分别输入预先获取到的孪生网络编码工具,得到各个未分类的互联网网站的文本向量序列,其中:所述孪生网络编码工具是从训练好的孪生网络中的输入层至权值共享循环神经网络层进行迁移得到,且所述孪生网络的训练是基于从多个已分类的互联网网站中提取的文本特征词实现;将各个未分类的互联网网站的文本向量序列组成的矩阵进行降维处理得到低维弱相关矩阵;对低维弱相关矩阵进行聚类分析,根据聚类分析结果获取所述多个未分类的互联网网站的相似度情况,从而实现互联网网站相似度分析。
-
公开(公告)号:CN118656490A
公开(公告)日:2024-09-17
申请号:CN202410629623.9
申请日:2024-05-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/30 , G06N3/0455 , G06N5/04
Abstract: 本发明涉及一种文本分类方法、装置、设备和存储介质,文本分类方法包括:获取待处理文本,待处理文本包含对于目标事件的目标观点;将大模型运用到特定文本分类任务上,在该分类任务的目标立场下对待处理文本进行分类处理,确定目标事件的事件类别,且大模型还是基于少数据量的数据集上训练的,准确率也很高,同时在分类任务的基础上,提出了多任务间的自我校验的可解释优化任务,确定反应目标观点情感倾向的可解释的倾向信息;使用二分类模型对可解释的倾向信息进行语义分析,审核大模型的分类准确性,确定反应目标观点情感倾向的倾向类别;根据倾向类别和事件类别,确定待处理文本的目标类别,有效提高了文本分类的准确性。
-
公开(公告)号:CN118734928A
公开(公告)日:2024-10-01
申请号:CN202410629625.8
申请日:2024-05-21
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种微调指令的构造方法、装置、设备及介质,该方法包括:将负面文本样本的标签划分为多个级别的目标分类标签;基于目标分类标签,使用预设的大模型对负面文本样本构造初始微调指令数据;在检查待微调的目标模型无法遵循初始微调指令数据的情况下,将初始微调指令数据修改为目标微调指令数据。本公开针对从知识库或网络上中搜索到负面文本样本,先划分目标分类标签,在基于此构造初始微调指令数据,其中,对于模型不能理解指令的问题,本实施例可以检查目标模型是否能遵循初始微调指令数据,并在无法遵循的情况下,将初始微调指令数据修改为目标微调指令数据,由此得到的目标微调指令能够使文本分类任务更好的拟合预训练目标模型的知识,提高了微调指令的可用性。
-
公开(公告)号:CN116561244A
公开(公告)日:2023-08-08
申请号:CN202310403811.5
申请日:2023-04-14
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06F16/31 , G06F16/35 , G06F40/289 , G06F16/36 , G06F18/214 , G06F18/24 , G06F40/30 , G06N3/0499 , G06N3/0895
Abstract: 本发明实施例涉及一种目标关系的识别方法及装置,所述方法包括:获取目标关系对应的训练数据集和检测数据集;根据上下句预测和掩码预测对联合模型进行模型预训练,得到训练好的联合抽取预训练模型;将所述训练数据集输入到所述联合抽取预训练模型中进行模型训练,得到训练好的联合抽取模型;将所述检测数据集输入到所述联合抽取模型中进行数据抽取处理,得到检测抽取结果;根据所述检测抽取结果确定所述检测数据集对应目标关系的识别结果。通过将检测数据集输入到训练好的联合抽取模型中,实现数据抽取,得到检测抽取结果,将在抽取到的检测抽取结果进行判断分析,确定所述检测数据集的识别结果;由本方案,可以实现企业关系、资本谱系或实体关系的快速识别的技术效果。
-
公开(公告)号:CN113378090B
公开(公告)日:2022-09-06
申请号:CN202110445408.X
申请日:2021-04-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958 , G06F16/35 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种互联网网站相似度分析方法、装置以及可读存储介质,方法包括:从多个未分类的互联网网站中提取文本特征词;将各个未分类的互联网网站的文本特征词分别输入预先获取到的孪生网络编码工具,得到各个未分类的互联网网站的文本向量序列,其中:所述孪生网络编码工具是从训练好的孪生网络中的输入层至权值共享循环神经网络层进行迁移得到,且所述孪生网络的训练是基于从多个已分类的互联网网站中提取的文本特征词实现;将各个未分类的互联网网站的文本向量序列组成的矩阵进行降维处理得到低维弱相关矩阵;对低维弱相关矩阵进行聚类分析,根据聚类分析结果获取所述多个未分类的互联网网站的相似度情况,从而实现互联网网站相似度分析。
-
公开(公告)号:CN116702022A
公开(公告)日:2023-09-05
申请号:CN202310512618.5
申请日:2023-05-08
Applicant: 国家计算机网络与信息安全管理中心
Inventor: 李林 , 李美燕 , 王秀文 , 崔雨涵 , 陈鹏云 , 杨菁林 , 徐丹丹 , 秦韬 , 郭富民 , 刘志丞 , 李娅强 , 曾宣玮 , 张栋 , 王峰 , 李政达 , 李东明 , 秦恺
IPC: G06F18/241 , G06F18/23 , G06Q30/0601
Abstract: 本发明实施例涉及一种商品分类模型训练方法、装置、计算机设备及存储介质,该方法包括:根据特征提取模型提取商品集合中每个商品的第一特征,得到第一特征集合,所述第一特征用于表征所述商品的商品特征和所述商品对应的企业特征;对所述第一特征集合进行聚类处理,得到多个簇,每个所述簇中包含多个所述第一特征;从每个所述簇中提取多个目标第一特征,得到目标第一特征集合;根据所述目标第一特征集合对第一初始模型进行训练,得到训练好的商品分类模型。由此,可以实现通过商品特征和企业特征结合进行分类模型的训练,提高了分类的准确度,且对训练的特征进行了筛选,提高模型训练效率。
-
-
-
-
-
-
-