-
公开(公告)号:CN117609495A
公开(公告)日:2024-02-27
申请号:CN202311301217.1
申请日:2023-10-09
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F16/35 , G06F40/30 , G06F18/2111 , G06F18/214 , G06F18/241 , G06N3/006
Abstract: 本公开提供了一种文本特征分类方法、分类装置、电子设备和存储介质,涉及人工智能技术领域。其中,文本特征分类方法包括:基于语义向量编码模型提取历史文本中的高维文本特征向量;基于所述高维文本特征向量配置粒子,以基于混合粒子群算法对所述高维文本特征向量进行特征优化选择,得到优化选择的低维文本特征向量;基于所述低维文本特征向量对分类器进行模型训练,得到特征分类模型;将待分类文本输入所述特征分类模型,得到分类结果。通过本公开的技术方案,将待分类文本输入特征分类模型得到的输出结果能够具有较高的分类准确性。
-
公开(公告)号:CN117312564A
公开(公告)日:2023-12-29
申请号:CN202311345040.5
申请日:2023-10-17
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F18/214 , G06F18/22 , G06F18/241
Abstract: 本公开提供了一种文本分类方法、分类装置、电子设备和存储介质,涉及机器学习技术领域。其中,文本分类方法包括:基于对原始文本的因果约束关系挖掘操作生成因果事件图谱;将因果事件图谱和预设文本库进行匹配操作,基于匹配结果配置因果事件图谱的提示模板;基于目标数据集执行多感知并行的模型预训练,得到多个预训练模型;基于多个预训练模型以及对应的模型权重和提示模板得到预测分类模型;基于预测分类模型对待分类文本进行预测分类并输出预测分类标签;对预测分类标签和备选目标标签进行相似度计算,以基于计算结果确定目标分类标签。通过本公开的技术方案,基于预设文本库所包含的结构化知识有利于降低提示模板的构建成本。
-
公开(公告)号:CN119558404A
公开(公告)日:2025-03-04
申请号:CN202411622147.4
申请日:2024-11-13
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 石丽娟
IPC: G06N5/04 , G06F16/334
Abstract: 本公开提供了一种对大模型幻觉的优化方法、装置、设备及介质,涉及计算机技术领域。该方法包括:获取查询文本;基于查询文本在知识向量数据库中进行查询,得到外部知识第一上下文候选集;对查询文本进行信息抽取,得到查询文本树;基于查询文本树和第一上下文候选集,评估第一上下文候选集中知识的可见度,其中,每条知识的可见度用于表示第一上下文候选集中每条知识与查询文本的相关程度;基于第一上下文候选集中知识的可见度,对第一上下文候选集中知识重新排序,得到目标上下文候选集;将目标上下文候选集和查询文本输入大模型进行推理,得到查询文本的答复文本。根据本公开实施例,能够抑制大模型的幻觉问题。
-
公开(公告)号:CN119150812A
公开(公告)日:2024-12-17
申请号:CN202411354090.4
申请日:2024-09-26
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F40/166 , G06F18/22
Abstract: 本公开提供一种文章生成方法、文章生成装置、计算机程序产品与电子设备,涉及人工智能技术领域。该文章生成方法包括:将写作需求信息输入信息收集智能体,以使信息收集智能体基于写作需求信息进行信息收集,得到与写作需求信息相匹配的写作提纲及素材;将与写作需求信息相匹配的写作提纲及素材输入文章生成智能体,以使文章生成智能体基于与写作需求信息相匹配的写作提纲及素材生成第一文章。本公开根据信息收集智能体所确定的写作提纲及素材生成文章,可提升文章内容的丰富度、逻辑性以及准确性,通过多智能体协作,可提升文章生成的自动化以及智能化。
-
公开(公告)号:CN119886152A
公开(公告)日:2025-04-25
申请号:CN202411962260.7
申请日:2024-12-27
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Abstract: 本申请的实施例揭示了一种提示注入防御方法、系统、电子设备及存储介质,方法包括:对输入文本进行初步检测,得到初步检测结果;对输入文本进行语义分析生成语义理解分析报告;获取目标大语言模型的当前运行参数;根据当前运行参数,获取目标大语言模型的行为模式分析结果;根据所述初步检测结果、所述语义理解分析报告和所述行为模式分析结果,获取所述目标大语言模型的当前防御策略;本申请通过从输入文本和大语言模型的运行状态两个方面进行紧密结合,不仅可以准确检测出大模型受到的提示注入攻击以及高效防止大模型受到恶意攻击,并且在面对复杂的攻击场景时可以制定出相对应的防御策略,实现更有效的防御,提升整体防御系统的鲁棒性。
-
公开(公告)号:CN119576304A
公开(公告)日:2025-03-07
申请号:CN202411749398.9
申请日:2024-11-29
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Abstract: 本公开提供了一种代码生成方法及相关设备,涉及人工智能技术领域。该方法包括:获取用户输入的需求描述和示例代码;基于需求描述和示例代码,得到多个任务及多个任务之间的依赖关系,多个任务用于生成与需求描述对应的目标代码;在预设提示词中确定与每个任务匹配的提示词;将多个任务、依赖关系及每个任务对应的提示词输入大语言模型中,得到需求描述对应的目标代码。根据本公开实施例,无需用户进行额外的模型训练,大大降低了用户的使用门槛,并且能够引导大模型生成符合特定任务需求的代码,提高用户满意度。
-
公开(公告)号:CN117763084A
公开(公告)日:2024-03-26
申请号:CN202311715572.3
申请日:2023-12-13
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F16/33 , G06F16/332 , G06F18/22 , G06F40/35 , G06N20/00
Abstract: 本公开提供了一种基于文本压缩的知识库检索方法及相关设备,涉及自然语言处理技术领域。该方法包括,获取待回答问题;根据待回答问题,在预先构建的知识库中检索得到待回答问题对应的多个文本信息;根据待回答问题与多个文本信息的相似度对多个文本信息进行压缩,确定压缩后的多个文本信息;将待回答问题和压缩后的多个文本信息输入预训练的大型语言模型,输出待回答问题的答案。本公开通过对知识库中检索得到的文本信息进行压缩处理,精简在输入大型语言模型中文本信息的长度,能够让大型语言模型能够根据更全面的文本信息来回答问题,解决大型语言模型输入受限于知识库中拼接文本影响回答问题准确性的问题。
-
公开(公告)号:CN116881774A
公开(公告)日:2023-10-13
申请号:CN202310847832.6
申请日:2023-07-11
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Inventor: 石丽娟
IPC: G06F18/24 , G06F18/214 , G06N3/04 , G06N3/094
Abstract: 本公开涉及机器学习技术领域,具体涉及一种文本判别模型的训练方法及装置、计算机可读存储介质及电子设备,方法包括:获取训练数据集,训练数据集包括基础文本数据、基础文本数据对应的参考文本数据,以及参考文本数据对应的第一标签;通过生成器对基础文本数据进行转换得到目标文本数据;将目标文本数据和参考文本数据作为第一判别器的输入数据得到第一判别结果;将目标文本数据输入至初始模型得到第二标签,并将第一标签和第二标签作为第二判别器的输入得到第二判别结果;基于第一判别结果和第二判别结果对生成器、第一判别器和第二判别器进行更新,并基于更新后的生成器和训练数据更新初始模型,以得到文本判别模型。
-
公开(公告)号:CN115392243B
公开(公告)日:2025-02-18
申请号:CN202211055505.9
申请日:2022-08-29
Applicant: 中国电信股份有限公司
IPC: G06F40/289 , G06F18/23 , G10L15/26
Abstract: 本公开提供了一种热词确定方法、热词确定装置、存储介质和电子设备,涉及语音识别技术领域。该热词确定方法包括:获取当前帧语音数据,将当前帧语音数据转化为当前帧文本;利用当前帧文本以及与当前帧对应的邻近帧文本确定候选热词;确定候选热词的至少一个特征表达,并利用候选热词的至少一个特征表达对候选热词进行聚类,根据聚类结果确定出热词。本公开可以提高生成热词的效率。
-
公开(公告)号:CN115392243A
公开(公告)日:2022-11-25
申请号:CN202211055505.9
申请日:2022-08-29
Applicant: 中国电信股份有限公司
IPC: G06F40/289 , G06K9/62 , G10L15/26
Abstract: 本公开提供了一种热词确定方法、热词确定装置、存储介质和电子设备,涉及语音识别技术领域。该热词确定方法包括:获取当前帧语音数据,将当前帧语音数据转化为当前帧文本;利用当前帧文本以及与当前帧对应的邻近帧文本确定候选热词;确定候选热词的至少一个特征表达,并利用候选热词的至少一个特征表达对候选热词进行聚类,根据聚类结果确定出热词。本公开可以提高生成热词的效率。
-
-
-
-
-
-
-
-
-