-
公开(公告)号:CN119025674A
公开(公告)日:2024-11-26
申请号:CN202410994764.0
申请日:2024-07-24
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F18/24 , G06F18/22 , G06N3/0455 , G06N3/08
Abstract: 本申请提供一种文本分类模型的训练方法、文本分类方法及相关设备,所述文本分类模型包括编码器和解码器,所述方法包括:获取训练数据集,所述训练数据集包括训练文本、所述训练文本对应的第一标签和所述第一标签对应的标签扩充信息,所述标签扩充信息为对所述第一标签内容的描述信息;对所述文本分类模型进行训练,得到目标文本分类模型。本申请通过对文本分类模型中的编码器和解码器利用训练文本、训练文本对应的第一标签和第一标签对应的标签扩充信息进行训练,得到目标文本分类模型,从而提高了对文本的分类效率。
-
公开(公告)号:CN116795977A
公开(公告)日:2023-09-22
申请号:CN202211035755.6
申请日:2022-08-26
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明实施例公开了一种数据处理方法、装置、设备和计算机可读存储介质。该方法包括:获取日志数据集;将日志数据集与预设日志模板库进行匹配,得到匹配度;根据匹配度,确定日志聚类结果。通过构建日志模板库对大规模数据进行聚合操作,得到匹配度,提高了日志聚类结果的准确性和灵活性。在收到报警信息之后,根据日志聚类结果和预设多标签分类模型,确定日志聚类结果对应的故障预测信息,无需运维人员根据自身技术和业务进行经验化的问题估计,提高了故障定位的效率。
-
公开(公告)号:CN112836516B
公开(公告)日:2023-09-08
申请号:CN201911168156.X
申请日:2019-11-25
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/30 , G06F40/211 , G06F16/901 , G06F18/214
Abstract: 本发明实施例公开了一种语义分析方法,该方法包括:对预设树库中的树结构进行标记处理,获得带有长距离投射标记树结构的第一待训练语料;采用句子成分分析法对所述第一待训练语料进行建模,获得成分句法分析模型;所述成分句法分析模型用于获得第二待训练语料;采用依存句法分析法对所述第二待训练语料进行建模,获得依存句法分析模型;基于所述成分句法分析模型和所述依存句法分析模型对输入语句进行分析,获得所述输入语句的语义分析结果。通过该方法,避免了无法实现精准的语义分析的问题,有效提升了语义分析的准确率。本发明实施例还公开了一种语义分析装置、终端及存储介质。
-
公开(公告)号:CN109408795A
公开(公告)日:2019-03-01
申请号:CN201710708318.9
申请日:2017-08-17
Applicant: 中国移动通信集团公司 , 中移(苏州)软件技术有限公司
Abstract: 本发明实施例公开了一种文本识别方法,所述方法包括:获取待识别文本,并对所述待识别文本进行编码处理,得到第一文本指纹;识别所述第一文本指纹所属的类别得到识别结果;若所述识别结果为可识别类别,对所述待识别文本进行类别分析得到所述待识别文本的反馈类别;根据所述识别结果与所述反馈类别,更新所述第一文本指纹对应的预设文本指纹库。本发明实施例同时还公开了一种文本识别设备、计算机可读存储介质和装置。
-
公开(公告)号:CN109408795B
公开(公告)日:2022-04-15
申请号:CN201710708318.9
申请日:2017-08-17
Applicant: 中国移动通信集团公司 , 中移(苏州)软件技术有限公司
IPC: G06F40/279 , H04W4/14
Abstract: 本发明实施例公开了一种文本识别方法,所述方法包括:获取待识别文本,并对所述待识别文本进行编码处理,得到第一文本指纹;识别所述第一文本指纹所属的类别得到识别结果;若所述识别结果为可识别类别,对所述待识别文本进行类别分析得到所述待识别文本的反馈类别;根据所述识别结果与所述反馈类别,更新所述第一文本指纹对应的预设文本指纹库。本发明实施例同时还公开了一种文本识别设备、计算机可读存储介质和装置。
-
公开(公告)号:CN108062300A
公开(公告)日:2018-05-22
申请号:CN201610981654.6
申请日:2016-11-08
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团公司
IPC: G06F17/27
Abstract: 本发明公开了一种基于中文文本进行情感倾向分析的方法,包括:获取待测的中文本文,对所述中文文本中进行文本预处理得到所述中文文本中的指定文本;根据情感词典对所述指定文本进行情感分析得到第一情感特征值,并根据训练模型中的语料特征词典对所述指定文本进行情感分析得到第二情感特征值;根据所述第一情感特征值和所述第二情感特征值得到特征集合,将所述特征集合作为随机森林RF训练模型的输入特征向量进行情感预测,得到所述中文文本的情感倾向。本发明公开了一种基于中文文本进行情感倾向分析的装置。
-
公开(公告)号:CN119539058A
公开(公告)日:2025-02-28
申请号:CN202411689955.2
申请日:2024-11-25
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 中国移动通信集团江苏有限公司 , 南京大学
Abstract: 本发明提供一种基于均衡求解的大模型对齐方法,涉及数据处理技术领域,该方法包括:获取问题数据集和预测模型,所述问题数据集包括多个问题,所述预测模型用于在不同场景下判断回应的回应效果;基于预设语言模型对所述多个问题中每个问题进行回应,得到所述每个问题对应的两个回应文本;基于所述预测模型将所述每个问题对应的两个回应文本划分为第一文本和第二文本,所述第一文本的回应效果好于所述第二文本的回应效果;基于所述每个问题对应的第一文本和第二文本构建训练数据集;基于所述训练数据集对所述预设语言模型进行训练,得到目标模型,所述目标模型用于对问题进行回应。本发明能提高语言模型输出的回应效果。
-
公开(公告)号:CN114971105A
公开(公告)日:2022-08-30
申请号:CN202110209597.0
申请日:2021-02-24
Applicant: 中国移动通信集团江苏有限公司 , 中国移动通信集团有限公司
Abstract: 本发明提供一种密码探测行为监控方法、装置、电子设备及存储介质,所述方法包括:获取营业员在预设时间段内的密码探测认证失败的数据记录;采用BK树算法对所有的数据记录进行探测行为的数据提取,确定不同营业员的探测行为数据集;对所述探测行为数据集中的数据进行聚类分析,确定不同营业员的探测行为探测规律。本发明提供的密码探测行为监控方法、装置、电子设备及存储介质,通过利用BK‑Tree算法对营业员违规密码探测行为数据的提取,以及利用聚类算法得到探测行为的规律,可以对营业员的探测行为进行系统的分析,能有效地发现密码探测行为,提高了网络的可靠性,并且节省了人力,提升了效率。
-
公开(公告)号:CN119539057A
公开(公告)日:2025-02-28
申请号:CN202411688975.8
申请日:2024-11-25
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 中国移动通信集团江苏有限公司 , 南京大学
Abstract: 本申请提供一种基于动态约束强化学习的大模型安全对齐方法,所述方法包括:构建对话偏好数据集;基于所述对话偏好数据集分别对初始奖励模型和初始成本模型进行训练,得到训练好的奖励模型和训练好的成本模型;基于所述训练好的奖励模型和所述训练好的成本模型生成第一微调策略和第二微调策略;根据所述第一微调策略和/或第二微调策略对所述初始大语言模型进行更新,得到更新后的大语言模型。本申请通过构建好的对话偏好数据集分别对奖励模型和成本模型进行训练,通过训练好的奖励模型和成本模型生成第一微调策略和第二微调策略,从而对大语言模型进行更新,提高了大语言模型在安全性和有用性之间的平衡性。
-
公开(公告)号:CN118400144A
公开(公告)日:2024-07-26
申请号:CN202410484638.0
申请日:2024-04-19
Applicant: 中国移动通信集团江苏有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种主机安全认证登录方法,涉及网络安全技术领域,公开了主机安全认证登录方法,包括:获取待认证用户信息;基于所述待认证用户信息,确定授权主机资源以及所述授权主机资源对应的私钥文件密码;基于所述私钥文件密码,对所述公钥文件进行解密,得到私钥文件明文,并基于所述私钥文件明文,对所述授权主机资源进行认证,得到认证结果,以实现从所述堡垒机登录至所述授权主机资源。本申请通过堡垒机模块在待认证用户的各授权主机资源分发公钥文件,实现各授权主机资源对堡垒机的信任,再通过堡垒机登录主机资源则无需再输入密码,经密钥认证后即可直接登入主机,以此实现主机无密码认证登录,进而提高主机安全认证登录的安全性。
-
-
-
-
-
-
-
-
-