-
公开(公告)号:CN116915894A
公开(公告)日:2023-10-20
申请号:CN202310188641.3
申请日:2023-03-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本公开提供一种来电身份识别方法、装置、电子设备和可读存储介质,涉及人工智能技术领域,其中,所述方法包括:获取来电方的目标对话文本信息;将所述目标对话文本信息与预设的来电文本库中的至少一个对话文本信息进行文本匹配和/或语义匹配,得到匹配结果;根据所述匹配结果,确定所述来电方是机器人或自然人。通过获取来电方的目标对话文本信息,并根据预设的来电文本库中的至少一个对话文本信息,对所述目标对话文本信息进行文本匹配和/或语义匹配,得到用于指示来电方身份的匹配结果,进而根据匹配结果,确定来电方是机器人或自然人,以完成对来电方的自然人身份或机器人身份的识别。
-
公开(公告)号:CN119539058A
公开(公告)日:2025-02-28
申请号:CN202411689955.2
申请日:2024-11-25
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 中国移动通信集团江苏有限公司 , 南京大学
Abstract: 本发明提供一种基于均衡求解的大模型对齐方法,涉及数据处理技术领域,该方法包括:获取问题数据集和预测模型,所述问题数据集包括多个问题,所述预测模型用于在不同场景下判断回应的回应效果;基于预设语言模型对所述多个问题中每个问题进行回应,得到所述每个问题对应的两个回应文本;基于所述预测模型将所述每个问题对应的两个回应文本划分为第一文本和第二文本,所述第一文本的回应效果好于所述第二文本的回应效果;基于所述每个问题对应的第一文本和第二文本构建训练数据集;基于所述训练数据集对所述预设语言模型进行训练,得到目标模型,所述目标模型用于对问题进行回应。本发明能提高语言模型输出的回应效果。
-
公开(公告)号:CN118798207A
公开(公告)日:2024-10-18
申请号:CN202410276456.4
申请日:2024-03-11
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F40/30 , G06F18/22 , G06F16/33 , G06F40/242 , G06F40/247
Abstract: 本申请公开了一种术语标准化方法,所述方法包括:基于第一待标准化术语进行标准术语召回,以及基于第一待标准化术语进行编码规则召回,得到召回的候选标准术语集合和编码规则;基于第一待标准化术语、编码规则和候选标准术语集合,确定语言大模型的第一输入提示语;将第一输入提示语输入语言大模型,得到语言大模型输出的第一待标准化术语对应的标准术语;语言大模型用于基于编码规则,从候选标准术语集合中确定第一待标准化术语的标准术语。
-
公开(公告)号:CN118797464A
公开(公告)日:2024-10-18
申请号:CN202310994307.7
申请日:2023-08-08
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 北京邮电大学
IPC: G06F18/2415 , G06N5/04 , G06F18/214 , G06N3/045 , G06N3/08 , G10L15/18
Abstract: 本发明提供一种模型训练方法、设备以及介质,涉及人工智能领域,其中,所述模型训练方法包括:利用第一训练数据集,对初始模型进行训练,得到第一模型;在需要利用第二数据集对所述第一模型进行更新的情况下,利用所述第一模型对所述第二数据集进行筛选,得到目标数据集,所述目标数据集包括所述第二数据集中的部分第二数据;获取所述目标数据集中每个目标数据的数据标签,得到所述目标数据集对应的目标训练数据集;利用所述目标训练数据集,对所述第一模型进行训练,得到第二模型。本发明实施例,利用机器模型实现数据筛选,基于机器模型的筛选结果进行数据标记,能够减少监督学习过程中的数据标记需求,提高模型训练效率。
-
公开(公告)号:CN116910191A
公开(公告)日:2023-10-20
申请号:CN202310273772.1
申请日:2023-03-17
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F16/35 , G06F16/36 , G06F40/30
Abstract: 本申请公开了一种多轮对话的预训练方法、装置、设备及存储介质,涉及通信技术领域,以解决现有技术无法全面、准确地获取多轮对话中的特征信息的问题。轮对话的预训练方法,包括:对多轮对话文本进行基于对话语义的预训练,获取第一预训练结果;对所述多轮对话文本进行基于对话结构的预训练,获取第二预训练结果,所述第二预训练结果为图形结构。
-
公开(公告)号:CN116910054A
公开(公告)日:2023-10-20
申请号:CN202310559630.1
申请日:2023-05-18
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/22 , G06F40/289 , G06F16/28
Abstract: 本申请公开了一种数据处理方法、装置、电子设备及计算机可读存储介质,涉及互联网技术领域,以解决现有数据匹配方法匹配准确率较低的问题。该方法包括:获取用户输入的描述语句;从预先建立的场景数据库中,确定所述描述语句所属的目标场景类型对应的目标子库;从目标子库中查找与描述语句匹配的M条第一场景数据;针对每条所述第一场景数据,计算所述第一场景数据与描述语句的文本相似度;显示所述M条第一场景数据中与所述描述语句的文本相似度最大的前N条第一场景数据。本申请实施例通过场景数据类型锁定匹配的子库,并采用双重检索机制确定匹配的场景数据,能够提升匹配精确度。
-
公开(公告)号:CN119560134A
公开(公告)日:2025-03-04
申请号:CN202411691097.5
申请日:2024-11-25
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 中国移动通信集团江苏有限公司 , 南京大学
Abstract: 本申请提供一种基于多智能体和大语言模型的自进化医疗会诊系统,包括:获取模块,用于从共享对话样本池中获取目标信息集,所述目标信息集中包括M个样本信息组合,所述样本信息组合包括N轮问诊信息,每个样本信息组合包括的N轮问诊信息均为同一个智能体与目标患者的问诊信息,且不同样本信息组合对应的智能体不同,M和N均为大于1的整数;输出模块,用于根据所述目标信息集输出所述目标患者的诊断信息。这样,提升了目标患者的诊断信息输出效率和输出结果的准确度。
-
公开(公告)号:CN116911298A
公开(公告)日:2023-10-20
申请号:CN202310176881.1
申请日:2023-02-28
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F40/295 , G06F40/284 , G06F16/35 , G06F40/242
Abstract: 一种文本数据的增强方法及装置,该方法包括:获取针对目标任务的文本语料,所述文本语料包括标注语料;根据所述目标任务,确定第一标注语料中的待替换文本;利用第一语义特征模型选择所述待替换文本相近似的多个候选文本,利用第二语义特征模型从所述多个候选文本中选择与所述待替换文本最近似的目标文本,将所述第一标注语料中的待替换文本替换为所述目标文本,获得中间语料;对所述中间语料进行回译操作,得到第二标注语料,其中,所述第二标注语料的标签信息与所述第一标注语料的标签信息相同。本申请能够提高新增标注语料的质量,为基于标注语料训练后续的自然语言处理任务模型提供支持,改善训练得到的模型质量,提高模型的推理效果。
-
公开(公告)号:CN116562369A
公开(公告)日:2023-08-08
申请号:CN202210093575.7
申请日:2022-01-26
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06N5/02 , G06F40/247 , G06F18/22 , G06N20/20
Abstract: 本申请提供一种问答知识库扩充方法、问答方法及相关设备,所述问答知识库扩充方法包括:使用第一模型对第一问题进行相似问题预测,以得到第一问题的相似问题;基于所述相似问题,扩充问答知识库,所述问答知识库包括第一问题。本申请可以提高问答知识库扩充的效率。
-
公开(公告)号:CN116414940A
公开(公告)日:2023-07-11
申请号:CN202111622357.X
申请日:2021-12-28
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F40/30 , G06F18/22
Abstract: 本发明公开了一种标准问题的确定方法、装置及相关设备。该方法包括:在接收到待检索问题的情况下,确定与待检索问题对应的标准问题候选集;基于每条候选标准问题与待检索问题之间的相似度值,以及每条候选标准问题对应的权重值,对N条候选标准问题进行排序;按照N条候选标准问题的排列顺序,将N条候选标准问题中的前M条或后M条候选标准问题确定为目标标准问题。本发明实施例中,基于相似度值和权重值建立候选标准问题与待检索问题之间的关联关系,进而提高智能问答系统检索标准问题的准确率。
-
-
-
-
-
-
-
-
-