-
公开(公告)号:CN119323263A
公开(公告)日:2025-01-17
申请号:CN202411879184.3
申请日:2024-12-19
Applicant: 北京工业大学
Abstract: 本发明公开了面向社会治理知识图谱三元组构建的大模型提示模板生成方法,涉及人工智能领域,包括如下步骤:步骤S1、数据预处理优化;步骤S2、数据脱敏;步骤S3、设计预期输出模板;步骤S4、提示模板生成;步骤S5、知识图谱三元组构建;步骤S6、三元组质量评估;步骤S7、反馈优化机制。本发明通过大模型自动生成大模型本身需要的提示的模板,并基于输入文本和任务需求动态调整模板内容。这一过程区别于传统的人工设计模板,显著提升了社会治理任务的效率和准确性,特别是在任务的定制化和场景适配性方面具有显著优势。
-
公开(公告)号:CN118779463A
公开(公告)日:2024-10-15
申请号:CN202410780089.1
申请日:2024-06-17
Applicant: 北京工业大学
Abstract: 本发明公开了基于大语言模型的时序知识图谱补全方法,设计了一个用于时序知识图谱补全的框架时序知识图谱‑大语言模型框架(TKG‑LLM)。将四元组中的实体、关系以及时间信息拼接为文本序列,通过设计特定任务的提示约束大语言模型的输出,将提示、文本序列、以及辅助提示按照一定的规则进行拼接作为大语言模型的输入。为了增强大语言模型在时序知识图谱补全领域的专业性和输出可控性,使用指令微调技术以预测实体/关系或评估四元组的合理性,缓解了大语言模型在该任务中的幻觉问题。
-
公开(公告)号:CN113869404B
公开(公告)日:2024-05-28
申请号:CN202111136030.1
申请日:2021-09-27
Applicant: 北京工业大学
IPC: G06F18/23 , G06F18/25 , G06F18/22 , G06N3/0464 , G06N3/042 , G06N3/0455 , G06N3/08
Abstract: 面向论文网络数据的自适应图卷积聚类方法适用于数据挖掘领域。该方法首次将自适应图卷积网络应用到深度图卷积聚类任务中,自适应的更新图结构并学习最优的数据表示;其次,该方法创造性地提出了一个基于注意力机制的融合模块,逐层加权融合两个并行网络的数据表示,同时有效缓解了图卷积网络的过平滑的问题。该方法的提出,主要解决的技术问题包括所有样本之间内在结构的挖掘,确保模型能够捕获更完整的数据结构信息,避免不准确的图结构对聚类性能产生的负影响,以及异构信息的有效融合。
-
公开(公告)号:CN116304756A
公开(公告)日:2023-06-23
申请号:CN202310183587.3
申请日:2023-03-01
Applicant: 北京工业大学
IPC: G06F18/23 , G06F18/22 , G06F18/2413 , G06N3/048 , G06N3/08 , G06N3/0464 , G06F16/35
Abstract: 本发明公开了一种面向引文数据聚类的多图卷积聚类方法,构造蕴含原始数据底层结构信息的K最近邻图,为了提取原始数据的底层结构信息,对每一个样本数据,将计算样本数据与不同样本数据之间的余弦相似度。基于构建K最近邻图,获取到原始数据的底层结构信息,用自编码模块增强的数据表证,引入更多已经构建的关系图;经过多图卷积模块,得到了经过不同图卷积操作的特征表示。受到自注意力机制的启发,寻求在每一个节点之间学习相对应的自适应权重。通过融合各个视图的信息来获得丰富的判别信息,同时使得聚类效果得到提升。本发明通过利用多图数据,降低了对单图质量的依赖性,与现有的图卷积聚类方法相比,模型更具鲁棒性。
-
公开(公告)号:CN113918722A
公开(公告)日:2022-01-11
申请号:CN202111343981.6
申请日:2021-11-14
Applicant: 北京工业大学
Abstract: 本发明公开了面向引文网络数据的基于稀疏图学习的图卷积聚类方法,该方法在图卷积网络的每个图卷积层前面嵌入了一个稀疏图结构学习层,挖掘高维数据中的低维结构从而构建更优的图结构。在模型优化时,交替更新图结构和节点表示,减少不准确的图结构对图卷积网络带来的负影响,最终对得到的节点表示执行K‑Means获得最终的聚类结果。相比于现有的固定图结构的图卷积深度聚类方法,不断更新的图结构对边攻击更加鲁棒。本发明从节点表示中学习自适应图来提高原始图结构的质量。所使用的持续更新的图结构可以有效地帮助生成更全面和更具有判别性的节点特征。最后,逐层交替的更新图结构和节点表示可以有效缓解图卷积网络中过平滑的问题。
-
公开(公告)号:CN112598060A
公开(公告)日:2021-04-02
申请号:CN202011533129.0
申请日:2020-12-22
Applicant: 北京工业大学
IPC: G06K9/62
Abstract: 基于自步学习的多视聚类方法及装置,能够有效避免传统方法的不足,能够有效提高模型对噪声点和离群值的鲁棒性,确保视角共享一致性信息最大化的同时还能有效利用到每个视角自己的内在化差异性信息。方法包括:(1)输入为多视角数据集,对每个视角、每个样本对应一个节点,以每个节点为中心,利用自适应图学习方法学习节点之间的相似性从而构建边,以此完成每个视角的图的构建;(2)基于一致性和个性化信息分离策略构建多图聚类模型;(3)使用自步学习权重矩阵来衡量图中每个节点的复杂性,从较少的简单节点过渡到越来越多的复杂节点,逐渐参与到多图学习中去,直到模型收敛;(4)输出聚类结果。
-
公开(公告)号:CN111461257A
公开(公告)日:2020-07-28
申请号:CN202010337201.6
申请日:2020-04-24
Applicant: 北京工业大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于乘积Grassmann流形的多视点视频数据的共享-差异表示(PGM-CER)聚类分析方法,用于解决传统多视聚类方法无法将多视数据中的共享和差异信息分离开来、不适用于具有复杂非线性结构的多维数据的问题。本方法中,聚类过程分为三部分,首先,用乘积Grassmann流形来表示多视点视频,再将共享-差异表示从欧氏空间扩展到乘积Grassmann流形空间;然后,建立PGM-CER模型,在全局约束下学习其共享-差异信息;最终,实现多视点视频聚类。直接求解流形上的优化问题比较困难,本方法通过流形空间与欧氏空间的映射求解最优解,简化了学习过程,效果显著优于其他经典多视聚类方法。
-
-
-
公开(公告)号:CN119918677A
公开(公告)日:2025-05-02
申请号:CN202510398928.8
申请日:2025-04-01
Applicant: 北京工业大学
IPC: G06N5/04 , G06N3/045 , G06N5/022 , G06F16/36 , G06F16/353 , G06F40/295 , G06F40/30 , G06Q50/26
Abstract: 本发明公开了基于CoT链式思维的社会治理知识图谱构建的大模型提示设计方法,涉及人工智能领域,具体包括以下步骤:步骤S1、数据预处理;步骤S2、预期输出设计;步骤S3、提示模板生成;步骤S4、知识图谱构建;步骤S5、结果优化与反馈机制。本发明通过引入CoT链式思维,通过任务分解、逐步推理、示范性输出、反馈机制等技术手段,在提示生成过程中引导模型逐步推理,从而确保信息提取的准确性和结构的标准化,最终构建出符合知识图谱要求的数据。CoT链式思维设计的提示有效地帮助大模型理解复杂任务生成高质量输出,并实现了实体标注自动化,输出包含实体类别的五元组数据。
-
-
-
-
-
-
-
-
-