-
公开(公告)号:CN119938831A
公开(公告)日:2025-05-06
申请号:CN202411978617.0
申请日:2024-12-30
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F16/3329 , G06F16/3332 , G06F16/334 , G06F40/30 , G06F40/284
Abstract: 本申请的实施例揭示了文档检索方法及装置、电子设备、计算机可读存储介质。该方法包括:将用于指示检索文档的查询语句转换为查询向量;将所述查询向量输入策略网络中,以获得所述策略网络输出的检索策略,所述检索策略中包含查询关键词向量;若所述检测策略指示针对所述查询语句直接生成答案,则直接生成所述查询语句对应的回答;若所述检索策略指示继续执行深度信息检索,将所述查询关键词向量输入至高级语义执行网络中,以得到所述高级语义执行网络输出的与所述查询语句相匹配的目标文档。本申请的实施例能够实现对于不同的文档检索需求的精准响应,提高了文档检索的准确性和个性化水平。
-
公开(公告)号:CN118966220A
公开(公告)日:2024-11-15
申请号:CN202411009113.8
申请日:2024-07-25
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F40/295 , G06F40/284 , G06F40/30 , G06F16/35 , G06F18/213 , G06F18/241 , G06F18/25 , G06N3/0455 , G06N3/0464
Abstract: 本公开是关于一种命名实体的识别方法及装置、存储介质、电子设备,涉及机器学习技术领域,该方法包括:基于特征编码层对待识别文本进行特征编码,得到文本序列的词嵌入,并基于双仿射层对文本序列的词嵌入进行仿射处理,得到待识别文本中的文本跨度的初始分数矩阵;基于语义交互感知层确定对文本序列的词嵌入进行语义交互处理,得到待识别文本的语义交互特征矩阵;基于空间感知层对初始分数矩阵进行三维卷积处理,得到文本跨度的空间感知特征矩阵;根据语义交互特征矩阵以及空间感知特征矩阵,得到文本跨度的目标分数矩阵,并根据目标分数矩阵,确定文本跨度所属的命名实体类别。本公开提高了命名实体类别的准确率。
-
公开(公告)号:CN118821971A
公开(公告)日:2024-10-22
申请号:CN202410911003.4
申请日:2024-07-08
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06N20/00 , G06N3/098 , G06N3/0455 , G06N3/0475 , G06N3/047 , G06F18/2321
Abstract: 本公开提供了一种用于强化学习的模型训练方法、用于强化学习的模型训练装置、电子设备及计算机可读存储介质,属于人工智能技术领域。该方法包括:获取样本库;样本库至少包括多个连续的样本状态信息;从样本库获取第一样本状态信息并输入第一预测模型,得到第一样本预测值,根据第一样本预测值和第一样本状态信息对应的标签信息确定第一损失值;从样本库获取第二样本状态信息和/或第三样本状态信息,根据第二样本状态信息和/或第三样本状态信息确定第二损失值;基于第一损失值和第二损失值更新第一预测模型的参数。本公开可以提高强化学习的模型训练的准确性和有效性。
-
公开(公告)号:CN118378723B
公开(公告)日:2024-09-13
申请号:CN202410813561.7
申请日:2024-06-21
Applicant: 中国电信股份有限公司 , 中国电信股份有限公司技术创新中心
IPC: G06N20/00 , G06F40/284 , G06F40/216 , G06F18/24 , G06F18/22
Abstract: 本公开提供一种模型训练数据处理方法、装置与电子设备,涉及数据处理技术领域。模型训练数据处理方法包括:获取包括多个训练文本的待处理模型训练数据,对每个所述训练文本进行分词预处理,以得到与每个训练文本对应的词汇集合;根据所述词汇集合提取每个所述训练文本的K个关键词,根据所述K个关键词将所述多个训练文本分为多组,K≥1;生成每个所述词汇集合内每个词汇的词向量;对每个训练文本,根据一个所述词汇与所述关键词的距离确定该词汇的权值,根据所述训练文本对应的多个词汇的词向量以及所述权值确定所述训练文本的文本向量;在同组内对所述文本向量的相似度大于预设阈值的训练文本进行去重。本公开实施例可以提高模型训练效率。
-
公开(公告)号:CN119621890A
公开(公告)日:2025-03-14
申请号:CN202411668376.X
申请日:2024-11-20
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F16/3329 , G06F16/334 , G06F16/338 , G06F16/31 , G06F16/353 , G06F16/3332 , G06F16/36 , G06N5/022 , G06N3/0464 , G06N5/04
Abstract: 本公开实施例是关于一种基于大模型的检索问答方法及装置、存储介质、设备,涉及自然语言处理技术领域,该方法包括:对目标查询问题进行思维链拆分,得到多个子问题拆分结果,并根据所述多个子问题拆分结果确定模型提示信息;基于所述多个子问题拆分结果在预设的索引知识库中进行检索召回,得到多个不同维度的检索结果;根据所述多个不同维度的检索结果以及所述模型提示信息生成上下文内容生成文本;将所述上下文内容生成文本输入至预设的内容生成大模型中,得到初步检索结果,并对所述初步检索结果进行事实校验,得到目标检索结果。本公开提高了目标检索结果的准确率。
-
公开(公告)号:CN119848242A
公开(公告)日:2025-04-18
申请号:CN202411910379.X
申请日:2024-12-23
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F16/335 , G06F16/334
Abstract: 本公开涉及一种文本的生成方法、装置、电子设备及计算机程序产品,属于自然语言处理技术领域。该方法包括:获取用户的输入文本,并根据所述输入文本得到与所述输入文本相关的候选文本;将所述输入文本和所述候选文本输入文本过滤模型中,其中,所述文本过滤模型中包括字符匹配子模型、相似度匹配子模型和互依性度量子模型;通过所述文本过滤模型中的子模型对所述候选文本进行过滤,得到所述子模型对应的过滤结果;根据各个所述子模型的过滤结果得到所述输入文本对应的目标匹配文本,并根据所述目标匹配文本生成所述输入文本对应的输出文本。本公开通过精确过滤不相关信息,可以减少信息过载和干扰,从而大幅提升文本生成质量。
-
公开(公告)号:CN118378723A
公开(公告)日:2024-07-23
申请号:CN202410813561.7
申请日:2024-06-21
Applicant: 中国电信股份有限公司 , 中国电信股份有限公司技术创新中心
IPC: G06N20/00 , G06F40/284 , G06F40/216 , G06F18/24 , G06F18/22
Abstract: 本公开提供一种模型训练数据处理方法、装置与电子设备,涉及数据处理技术领域。模型训练数据处理方法包括:获取包括多个训练文本的待处理模型训练数据,对每个所述训练文本进行分词预处理,以得到与每个训练文本对应的词汇集合;根据所述词汇集合提取每个所述训练文本的K个关键词,根据所述K个关键词将所述多个训练文本分为多组,K≥1;生成每个所述词汇集合内每个词汇的词向量;对每个训练文本,根据一个所述词汇与所述关键词的距离确定该词汇的权值,根据所述训练文本对应的多个词汇的词向量以及所述权值确定所述训练文本的文本向量;在同组内对所述文本向量的相似度大于预设阈值的训练文本进行去重。本公开实施例可以提高模型训练效率。
-
公开(公告)号:CN116894996A
公开(公告)日:2023-10-17
申请号:CN202310833232.4
申请日:2023-07-07
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06V10/774 , G06V10/80 , G06F18/25 , G06F18/214 , G06N20/00
Abstract: 本公开涉及机器学习技术领域,涉及一种视觉问答模型的训练方法及装置、视觉问答任务处理方法及装置、计算机可读存储介质及电子设备,视觉问答模型的训练方法包括:获取初始训练数据,初始训练数据包括图文输入数据以及图文输入数据对应的真值答案,其中,图文输入数据包括图像特征数据和文本特征数据;将图文输入数据输入至第一初始模型得到第一参考答案;基于第一参考答案和真值答案对初始训练数据进行筛选得到第一目标训练数据;利用第一目标训练数据的第一参考答案以及对应的真值答案更新第二初始模型得到视觉问答模型;其中,第一初始模型和第二初始模型的模型架构一致。本公开实施例的技术方案提高了得到视觉问答模型的处理精度。
-
公开(公告)号:CN117093721A
公开(公告)日:2023-11-21
申请号:CN202310854563.6
申请日:2023-07-12
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Abstract: 本公开提供一种场景图谱生成方法、装置、存储介质与电子设备,涉及计算机技术领域。所述场景图谱生成方法包括:获取待处理图像;对所述待处理图像进行目标检测,得到所述待处理图像中的场景目标;确定所述场景目标的关键点,根据不同场景目标的关键点间的位置关系,得到不同场景目标间的关系;以所述场景目标的特征为节点,以不同场景目标间的关系为边,生成所述待处理图像对应的场景图谱。本公开有利于生成高质量的场景图谱。
-
公开(公告)号:CN118608854A
公开(公告)日:2024-09-06
申请号:CN202410757285.7
申请日:2024-06-12
Applicant: 中国电信股份有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/42
Abstract: 本申请公开了一种模型训练方法、装置及计算机设备。其中,该方法包括:获取多种网络设备的图像;对多种网络设备的图像进行处理,得到初始训练数据集,并采用初始模型中的多个模块依次对初始训练数据集进行特征提取,得到适配网络设备检测的全局特征,多个模块中至少包括用于采用多种方式生成全局特征中的异常特征的异常生成器,异常特征用于表征异常网络设备的图像特征;采用全局特征对初始模型中的异常评判器进行训练,得到目标模型,其中,异常评判器用于对全局特征进行分类。本申请解决了相关技术中由于异常数据较少导致网络设备检测模型的检测效果较差的技术问题。
-
-
-
-
-
-
-
-
-