-
公开(公告)号:CN119415536A
公开(公告)日:2025-02-11
申请号:CN202411237384.9
申请日:2024-09-04
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 姚顺雨
IPC: G06F16/242 , G06F16/22 , G06F16/28
Abstract: 本公开提供了一种基于大语言模型的检索增强生成方法及相关设备,涉及自然语言处理技术领域。该方法包括,当输入问题需要检索时,确定输入问题对应的检索方式;根据检索方式对输入问题进行检索,确定知识片段;将知识片段与输入问题输入大语言模型,确定输出结果。本公开针对输入问题的类型,确定对应的检索方法,提高了检索的质量,能够减少引入不必要的信息,解决不必要的检索信息影响大语言模型输出的问题。
-
公开(公告)号:CN116861884A
公开(公告)日:2023-10-10
申请号:CN202310841713.X
申请日:2023-07-10
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 姚顺雨
IPC: G06F40/205 , G06F40/284 , G06N20/00
Abstract: 本公开涉及一种事件抽取模型的训练方法、事件抽取方法、装置、电子设备及计算机可读介质,属于自然语言处理技术领域。该事件抽取模型的训练方法包括:从训练样本文档中获取训练数据,包括每个事件中的触发词和论元以及无关实体;将训练数据输入语言模型中得到触发词向量、论元向量和无关实体向量;基于同一事件中的触发词向量和论元向量得到正样本对,基于无关实体向量以及不同事件中的触发词向量和论元向量得到负样本对;将正负样本对的样本相似度与样本标签进行对比,计算模型损失;根据模型损失对模型进行训练得到预训练语言模型,基于预训练语言模型进一步得到事件抽取模型。本公开通过计算正负样本对的相似度,可以提高事件抽取模型的性能。
-
公开(公告)号:CN119227805A
公开(公告)日:2024-12-31
申请号:CN202411365791.8
申请日:2024-09-27
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 姚顺雨
IPC: G06N5/04
Abstract: 本公开提供了一种推理结果的生成方法、装置、计算机存储介质和电子设备,涉及人工智能技术领域。包括:获取待推理问题,生成待推理问题对应目标数量的推理示例组成的推理示例集合,将待推理问题和推理示例集合输入至预设的大语言模型中,使大语言模型基于推理示例集合中的各推理示例,对待推理问题进行推理解答,得到待推理问题对应的第一推理结果;基于大语言模型,确定与第一推理结果匹配的目标推理问题;通过搜索引擎对目标推理问题进行搜索,根据搜索结果对第一推理结果进行修正,得到修正后的第二推理结果。本公开可以减少模型不准确推理结果的生成,提高事实正确性,进而提高模型性能,提升应用的可信度和有效性,进而提高用户的信任度。
-
公开(公告)号:CN119150812A
公开(公告)日:2024-12-17
申请号:CN202411354090.4
申请日:2024-09-26
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F40/166 , G06F18/22
Abstract: 本公开提供一种文章生成方法、文章生成装置、计算机程序产品与电子设备,涉及人工智能技术领域。该文章生成方法包括:将写作需求信息输入信息收集智能体,以使信息收集智能体基于写作需求信息进行信息收集,得到与写作需求信息相匹配的写作提纲及素材;将与写作需求信息相匹配的写作提纲及素材输入文章生成智能体,以使文章生成智能体基于与写作需求信息相匹配的写作提纲及素材生成第一文章。本公开根据信息收集智能体所确定的写作提纲及素材生成文章,可提升文章内容的丰富度、逻辑性以及准确性,通过多智能体协作,可提升文章生成的自动化以及智能化。
-
公开(公告)号:CN118897883A
公开(公告)日:2024-11-05
申请号:CN202411081063.4
申请日:2024-08-07
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 姚顺雨
IPC: G06F16/332 , G06F16/33 , G06N20/10 , G06N20/00
Abstract: 本公开提供一种基于大语言模型的信息处理方法、装置、计算机程序产品与电子设备,涉及信息处理技术领域。该基于大语言模型的信息处理方法包括:获取第一输入信息,并判断第一输入信息对应的特定属性参数是否满足预设知识库检索条件;若第一输入信息对应的特定属性参数满足预设知识库检索条件,基于第一输入信息,从知识库中进行检索,得到与第一输入信息相匹配的目标检索信息;基于目标检索信息,确定第二输入信息,并通过大语言模型对第二输入信息进行处理,得到输入答复信息。本公开可在确保大语言模型输出准确性的同时,减少不必要的知识库检索操作,避免引入可能产生误导的信息。
-
公开(公告)号:CN119782468A
公开(公告)日:2025-04-08
申请号:CN202411855626.0
申请日:2024-12-16
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F16/3329 , G06F16/334 , G06F16/35 , G06F16/36 , G06F40/30 , G06N5/022 , G06N5/04 , G06N3/0455 , G06N3/08
Abstract: 本公开提供了一种文本数据处理方法、装置及相关设备,涉及自然语言处理技术领域,该方法包括:获取待处理的问题文本;基于预先建立的知识文档库,查询与问题文本具有关联关系的证据文本集合;对证据文本集合进行预处理,确定问题文本对应的证据文本;将问题文本与证据文本进行拼接,输入至预先训练好的答案文本生成模型中,输出问题文本的答案文本。本公开能够提高证据文本的检索效率,提升答案文本的准确性。
-
公开(公告)号:CN116861363A
公开(公告)日:2023-10-10
申请号:CN202310854673.2
申请日:2023-07-12
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 姚顺雨
IPC: G06F18/25 , G06F18/2415 , G06N3/047 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本公开提供一种多模态的特征处理方法、装置、存储介质与电子设备,涉及人工智能与多模态技术领域。该方法包括:获取第一模态待处理信息和第二模态待处理信息;对第一模态待处理信息提取第一模态初始特征,对第二模态待处理信息提取第二模态初始特征;根据第一模态初始特征确定第一查询信息,根据第二模态初始特征确定第一键信息和第一值信息,并通过注意力机制进行处理,得到第一中间特征;根据第二模态初始特征确定第二查询信息,根据第一模态初始特征确定第二键信息和第二值信息,并通过注意力机制进行处理,得到第二中间特征;融合第一中间特征和第二中间特征,得到多模态目标特征。本公开能够实现多模态特征的高质量融合。
-
公开(公告)号:CN115935950A
公开(公告)日:2023-04-07
申请号:CN202211610488.0
申请日:2022-12-14
Applicant: 中国电信股份有限公司
IPC: G06F40/211 , G06F40/103
Abstract: 本公开提供了一种文档级论元抽取方法,涉及通信技术领域,该方法包括:获取目标文档包含的事件类型信息;从所述目标文档中识别出实体,得到实体向量;基于图模型和变换器的双向编码器表示模型Graph‑BERT根据所述目标文档中的句向量和所述实体向量得到文档级上下文信息的实体编码表示;以及依次抽取所述实体编码表示中与所述事件类型信息相关联的论元。本公开使用基于Graph‑BERT的方法实现了从文档中的多个句子中抽取事件论元,实现了对文档级论元的抽取。
-
-
-
-
-
-
-