检索增强生成系统自动化评测方法及系统

    公开(公告)号:CN119166785A

    公开(公告)日:2024-12-20

    申请号:CN202411334441.5

    申请日:2024-09-24

    Abstract: 本发明属于人工智能技术领域。提供了一种检索增强生成系统自动化评测方法及系统,针对检索增强生成系统生成的答案以及所述测评数据集中的答案,采用不同的答案评价算法进行评价,得到多个算法评价指标;计算各个检索增强生成系统的多个整体评价指标,对全部的所述算法评价指标和所述整体评价指标进行主成分分析,进而进行RAG系统的评测。本发明解决了文档解析和问答数据生成的自动化问题,提供了高质量的问答对,自动评估RAG系统的问答质量和检索质量,使用多种评价指标结合主成分分析方法得到了更为精准的自动化评测结果。

    一种数据要素处理系统及方法
    3.
    发明公开

    公开(公告)号:CN117455527A

    公开(公告)日:2024-01-26

    申请号:CN202311360630.5

    申请日:2023-10-19

    Abstract: 本发明涉及数据处理技术领域,提供了一种数据要素处理系统及方法。该系统包括,数据获取模块,用于采用多种途径确定数据来源,获取数据;数据治理模块,用于制定符合企业数据战略需求的组织架构,协调数据管理过程中所需要的资源,根据数据战略,设计数据资产目录,根据资产目录创建实体数据集,根据实体数据集的类型设计数据安全策略;将获取的数据与数据资产目录进行对应匹配,规范数据权属;运营授权模块,用于制定数据服务定价机制,计算数据服务价格,以此对数据资产价值进行评定和估算;根据数据需方的需求,给出答复,若所述需求审核通过,则进行数据汇集和数据开发,形成数据服务发布到门户;若不通过,则结束。

    基于提示学习的知识抽取方法及系统

    公开(公告)号:CN117056515A

    公开(公告)日:2023-11-14

    申请号:CN202311027108.5

    申请日:2023-08-15

    Abstract: 本发明提供了一种基于提示学习的知识抽取方法及系统,将获取的非结构化文本数据进行嵌入得到缓存向量值;对同质提示符串进行嵌入得到同质提示符向量值,对异质提示字符串进行嵌入得到异质提示字符向量值;对缓存向量值、同质提示符向量值和异质提示字符向量值进行拼接得到拼接向量,以拼接向量作为预训练语言模型的缓存向量值;采用正则匹配的方法从预训练语言模型生成的文本数据中获取结构化数据;本发明利用自动编码的提示字符,自动学习标签的潜在语义表示,并通过生成式大规模预训练语言模型,以通用的方式解决知识抽取问题,提高了知识抽取的精度和效率。

    基于大模型的知识图谱推理方法及系统

    公开(公告)号:CN119761506A

    公开(公告)日:2025-04-04

    申请号:CN202411821471.9

    申请日:2024-12-11

    Abstract: 本发明属于数据处理技术领域。提出了一种基于大模型的知识图谱推理方法及系统,实现了了针对知识图谱的可解释性推理问答,在问题处理方面,首先采用字符级和语义级别的协同,完整且高效的获得了主实体,之后使用大模型Agent的方式在图谱上进行推理,采用原子方法的形式,使大模型有多个工具能够充分的在图谱上进行答案的寻找,解决了传统知识图谱推理只能单步单路径的问题,同时推理过程非常透明且可追溯,具有强的可解释性。

    具有意图识别的SQL数据库查询方法、问答方法及系统

    公开(公告)号:CN118708604A

    公开(公告)日:2024-09-27

    申请号:CN202410724226.X

    申请日:2024-06-05

    Abstract: 本发明提供了一种具有意图识别的SQL数据库查询方法、问答方法及系统,属于数据处理技术领域。对用户问题中的意图进行识别和修正,得到对齐后的数据库字段到用户问题涉及到的字段内容字典;根据所述字段内容字典生成数据库补充信息描述,将数据库补充信息描述与标准化数据库描述组合以形成上下文信息;根据所述上下文信息以及预设的大语言模型,得到所述用户问题对应的SQL查询语句,根据所述SQL查询语句查询到的SQL数据库以得到待查询内容;本发明有效解决了用户问题与SQL数据库的实际数据的对齐问题,能够准确找到用户问题涉及的字段内容,生成符合要求的SQL查询语句,极大的提高了查询精度和查询效率。

    基于领域本体库的工作简历结构化解析方法及系统

    公开(公告)号:CN115510844A

    公开(公告)日:2022-12-23

    申请号:CN202211200761.2

    申请日:2022-09-29

    Abstract: 本发明属于简历解析领域,提供了一种基于领域本体库的工作简历结构化解析方法及系统,包括获取工作简历数据,提取括号文本内容并进行筛选,得到待处理语句集合;以拆分标志符为拆分依据,对待处理语句集合进行拆分并重组,得到修正后的待处理语句集合;基于修正后的待处理语句集合,根据时间、地址、工作单位以及工作职务的顺序进行实体提取;将提取到的时间实体、地址实体、工作单位实体以及职务实体进行汇总。本发明无需准备标准格式的训练集,对单位、职务等结构分情况考虑,根据结果优化先验标志符集合。

Patent Agency Ranking