-
公开(公告)号:CN118798155A
公开(公告)日:2024-10-18
申请号:CN202410522464.2
申请日:2024-04-28
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
Inventor: 张建强 , 宋功鹏 , 王方旭 , 马超 , 张熙 , 陈彬 , 杜飞 , 马福坛 , 赵洁 , 韩鑫鑫 , 姜彤彤 , 张波 , 张梦 , 王见雷 , 杨合林 , 王星 , 刘泽宇
IPC: G06F40/194 , G06F16/35
Abstract: 本公开涉及文本查重方法、装置、电子设备和计算机程序产品。该文本查重方法包括:获取文本样本数据,从文本样本数据中提取多种初始词汇,并获取多种初始词汇分别对应的词汇数量和空间分布数据;对多种初始词汇进行聚类处理,得到多个初始词汇聚簇;基于各初始词汇聚簇中每种初始词汇对应的词汇数量和空间分布数据,对多个初始词汇聚簇进行调整,得到多个目标词汇聚簇;利用基于多个目标词汇聚簇确定的多个目标词汇,对待测文本进行查重。本公开能够在对多种初始词汇进行聚类处理时,考虑多种初始词汇分别对应的词汇数量和空间分布数据,提高了聚类结果的准确性,进而提高文本查重结果的准确性。
-
公开(公告)号:CN119005355A
公开(公告)日:2024-11-22
申请号:CN202410948334.5
申请日:2024-07-16
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: G06N20/00
Abstract: 本公开涉及通信技术领域,尤其是提供一种联邦训练方法、装置、设备、介质及产品,包括:在确定第一联邦客户端退出联邦学习任务的当前训练轮次的情况下,获取所述第一联邦客户端和第二联邦客户端在历史训练轮次训练得到的历史模型参数;其中,所述第二联邦客户端为当前训练轮次未退出的客户端;基于所述历史模型参数,计算所述第一联邦客户端和所述第二联邦客户端之间在历史训练轮次所训练得到的目标模型的相似度;基于所述相似度在所述第二联邦客户端中确定所述第一联邦客户端的替代联邦客户端,并通过所述替代联邦客户端执行所述第一联邦客户端针对当前训练轮次的训练任务,从而节省联邦训练过程中的通信资源,提高联邦学习效率。
-