基于大语言模型的专利多维度评价方法及系统

    公开(公告)号:CN119397028A

    公开(公告)日:2025-02-07

    申请号:CN202411975479.0

    申请日:2024-12-31

    Abstract: 本发明提供了基于大语言模型的专利多维度评价方法及系统,其属于文献分析技术领域,所述方案通过基于聚类分析和大语言模型构建的技术集群,来确定每个专利所属的专利集群,并通过构建专利集群网络的方式,来确定每个专利在整个专利集群的重要性,然后结合专利所属集群的多维特征对专利进行评价,对原始专利数据进行了有效利用,保证了专利评价结果的全面性和准确性;有效解决了传统方案聚类分析结果的准确性无法保证,且缺少对同领域和跨领域专利之间的相关关系的考虑,进而对专利评价结果的准确性产生较大影响,以及,现有的专利评价方式的评价维度单一,导致专利评价结果的准确性不足的问题。

    检索增强生成系统自动化评测方法及系统

    公开(公告)号:CN119166785A

    公开(公告)日:2024-12-20

    申请号:CN202411334441.5

    申请日:2024-09-24

    Abstract: 本发明属于人工智能技术领域。提供了一种检索增强生成系统自动化评测方法及系统,针对检索增强生成系统生成的答案以及所述测评数据集中的答案,采用不同的答案评价算法进行评价,得到多个算法评价指标;计算各个检索增强生成系统的多个整体评价指标,对全部的所述算法评价指标和所述整体评价指标进行主成分分析,进而进行RAG系统的评测。本发明解决了文档解析和问答数据生成的自动化问题,提供了高质量的问答对,自动评估RAG系统的问答质量和检索质量,使用多种评价指标结合主成分分析方法得到了更为精准的自动化评测结果。

    一种基于实体关系和图卷积网络的知识融合方法及系统

    公开(公告)号:CN117194680A

    公开(公告)日:2023-12-08

    申请号:CN202311248113.9

    申请日:2023-09-25

    Abstract: 本发明属于知识图谱构建领域,尤其涉及一种基于实体关系和图卷积网络的知识融合方法及系统。该方法包括,确定人才科创多源知识图谱所需的数据类型,根据所述数据类型从多个独立人才科创系统、行业或领域中获取数据中的实体及实体关系,构建子图谱;基于实体及实体关系,采用社区发现算法,挖掘子图谱中的实体簇特征;基于所述实体簇特征,采用图卷积网络,聚合实体直接邻居的关系特征,得到实体向量;对不同子图谱中实体向量进行相似度计算,完成子图谱之间相同实体的合并,构建人才科创多源知识图谱。

    一种面向互联网采集的栏目页智能获取方法及系统

    公开(公告)号:CN115858963A

    公开(公告)日:2023-03-28

    申请号:CN202211705685.0

    申请日:2022-12-29

    Abstract: 本发明属于数据采集技术领域,提供了一种面向互联网采集的栏目页智能获取方法及系统。该方法包括,根据当前站点url获取网页HTML源代码;根据网页HTML源代码获取当前网页中的所有 标签节点;对 标签进行过滤,获取有效 标签和有效 标签信息列表;遍历有效 标签信息列表,记当前 标签信息为item_a,判断item_a是否满足加入栏目页列表的条件,若是,则加入栏目页列表,否则,不加入栏目页列表;判断站点的深度是否小于设置的采集深度阈值,如果不小于采集深度阈值,结束循环;如果小于采集深度阈值,遍历有效 标签信息列表,记当前有效 标签的url为当前站点url且站点深度值自增1,迭代循环,直至站点的深度不小于采集深度阈值;返回栏目页列表结果。

Patent Agency Ranking