-
公开(公告)号:CN119005135A
公开(公告)日:2024-11-22
申请号:CN202411481072.2
申请日:2024-10-23
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F40/16 , G06F40/284 , G06N3/044
Abstract: 本发明提供一种文本生成方法、装置、主机设备、系统、程序产品和介质,涉及人工智能领域,方法包括:获取输入文本;输入文本包括内容概述文本和词语参考文本,词语参考文本包含指定词语;利用预训练语言模型根据输入文本执行文本生成操作,得到与生成式文本中的单词对应的逻辑矩阵;预训练语言模型具有包含候选单词的词表,逻辑矩阵用于确定候选单词的选择概率,选择概率为候选单词被选为生成式文本中的单词的概率;利用预训练概率转移模型中的神经网络层对逻辑矩阵进行处理,以增大候选单词中的指定候选单词的选择概率,得到已调整逻辑矩阵;指定词语由至少一个指定候选单词组成;利用已调整逻辑矩阵确定生成式文本;可优化文本生成效果。
-
公开(公告)号:CN118410854B
公开(公告)日:2024-09-13
申请号:CN202410882270.3
申请日:2024-07-03
Applicant: 浪潮电子信息产业股份有限公司
Inventor: 申冲
IPC: G06N3/088 , G06F16/35 , G06N3/0499
Abstract: 本发明公开了模型训练及文本处理方法、计算机程序产品、设备、介质,涉及人工智能技术领域,获取有标签的第一文本,第一文本的长度大于设定长度值,标签用于标记文本中相似的句子;将第一文本切分成文本块;确定文本块对应的文本向量值;对文本向量值进行聚类,得到聚类结果;基于第一文本和聚类结果对文本处理模型进行训练,且文本处理模型用于将文本转换为对应的向量。由于聚类是将相似的对象聚合在一起,所以聚类结果反映了文本向量值间的相似关系,相当于应用第一文本、文本向量值和文本向量值间的相似关系对文本处理模型进行训练,可以避免模型训练时不相干内容的噪音干扰,提高向量空间表征范围,提高文本处理模型对长文本的处理准确性。
-
公开(公告)号:CN118410854A
公开(公告)日:2024-07-30
申请号:CN202410882270.3
申请日:2024-07-03
Applicant: 浪潮电子信息产业股份有限公司
Inventor: 申冲
IPC: G06N3/088 , G06F16/35 , G06N3/0499
Abstract: 本发明公开了模型训练及文本处理方法、计算机程序产品、设备、介质,涉及人工智能技术领域,获取有标签的第一文本,第一文本的长度大于设定长度值,标签用于标记文本中相似的句子;将第一文本切分成文本块;确定文本块对应的文本向量值;对文本向量值进行聚类,得到聚类结果;基于第一文本和聚类结果对文本处理模型进行训练,且文本处理模型用于将文本转换为对应的向量。由于聚类是将相似的对象聚合在一起,所以聚类结果反映了文本向量值间的相似关系,相当于应用第一文本、文本向量值和文本向量值间的相似关系对文本处理模型进行训练,可以避免模型训练时不相干内容的噪音干扰,提高向量空间表征范围,提高文本处理模型对长文本的处理准确性。
-
公开(公告)号:CN119005135B
公开(公告)日:2025-01-24
申请号:CN202411481072.2
申请日:2024-10-23
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F40/16 , G06F40/284 , G06N3/044
Abstract: 本发明提供一种文本生成方法、装置、主机设备、系统、程序产品和介质,涉及人工智能领域,方法包括:获取输入文本;输入文本包括内容概述文本和词语参考文本,词语参考文本包含指定词语;利用预训练语言模型根据输入文本执行文本生成操作,得到与生成式文本中的单词对应的逻辑矩阵;预训练语言模型具有包含候选单词的词表,逻辑矩阵用于确定候选单词的选择概率,选择概率为候选单词被选为生成式文本中的单词的概率;利用预训练概率转移模型中的神经网络层对逻辑矩阵进行处理,以增大候选单词中的指定候选单词的选择概率,得到已调整逻辑矩阵;指定词语由至少一个指定候选单词组成;利用已调整逻辑矩阵确定生成式文本;可优化文本生成效果。
-
-
-