-
公开(公告)号:CN119721013A
公开(公告)日:2025-03-28
申请号:CN202411542679.7
申请日:2024-10-31
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F40/237 , G06F40/253
Abstract: 本申请涉及数据处理技术领域,公开了一种精简提示词集合的方法、装置及存储介质,该方法应用于服务器,包括:将预先设置的初始提示词集合输入大语言模型中进行学习,每轮迭代过程中,根据本轮的第一得分值和/或第二得分值确定初始输入数据的个数是否发生变化,每轮迭代过程如下:采用预设的第一算法分别对各第一合成数据进行打分,得到第一得分值;和/或,采用预设的第二算法分别对各第二合成数据进行打分,得到第二得分值,其中,第二合成数据是运用添加场景约束条件后的大语言模型对初始提示词集合包括的各初始输入数据进行学习后得到的,上述方法提升了提示词的质量,使得提示词更加符合当前的应用场景,进而提升了生成合成数据的质量。
-
公开(公告)号:CN118921223A
公开(公告)日:2024-11-08
申请号:CN202411178168.1
申请日:2024-08-26
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: H04L9/40 , H04L41/147 , H04L43/0876
Abstract: 本申请公开了一种流量基线预测方法、装置及电子设备,涉及网络安全技术领域,用以提高对非线性网络流量数据的流量基线的预测准确性,该方法包括:首先,基于历史周期内的网络流量数据,按照预设时间窗口,获得各个流量峰值数据;然后,根据各个流量峰值数据,获得网络流量数据对应的时域特征;进一步,将时域特征转化为多个模态对应的频域特征;最后,基于多个频域特征各自对应的流量贡献值,获得流量基线预测值。通过上述的方法,根据网络流量的时域特征,自适应的确定模态分解阶数,能够根据网络流量的实施变化更为准确的预测流量基线。
-
公开(公告)号:CN116846649A
公开(公告)日:2023-10-03
申请号:CN202310836435.9
申请日:2023-07-07
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: H04L9/40
Abstract: 本申请提供了一种网络入侵检测方法、装置、设备及介质,识别待检测的流量请求中包含预设符号的字符组,并根据每个字符组中包含的预设符号或预设符号对,以及预设符号或预设符号对对应的语句类型,确定每个字符组对应的目标语句类型,提高了网络入侵检测的效率;针对每个目标语句类型的字符组,根据该字符组中包含的字符以及预先保存的该目标语句类型对应的恶意字符,确定该字符组中是否包含恶意字符;若任一字符组包含恶意字符,则确定该流量请求为网络入侵请求,从而提高了网络入侵检测的效率和准确率。
-
公开(公告)号:CN118607587A
公开(公告)日:2024-09-06
申请号:CN202410612237.9
申请日:2024-05-16
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06N3/045 , G06N3/094 , G06N3/0475 , G06F40/16 , G06F40/30
Abstract: 本发明公开了一种数据处理方法及装置,包括:接收用于进行对话的第一文本。在确定第一文本中存在关键词时,对第一文本进行语义识别,得到第一文本的识别结果。其中,识别结果用于指示第一文本是否具有提示注入攻击的行为。若识别结果指示第一文本具有提示注入攻击的行为,则结束对话。若识别结果指示第一文本不具有提示注入攻击的行为,则将第一文本输入大语言模型,得到大语言模型输出的用于应答第一文本的第二文本。因为仅将不具有恶意行为的输入文本输入大语言模型,而不是将所有输入文本输入大语言模型,以此降低资源消耗。
-
公开(公告)号:CN117081844A
公开(公告)日:2023-11-17
申请号:CN202311255684.5
申请日:2023-09-26
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: H04L9/40
Abstract: 本申请实施例提供一种网络攻击检测方法、装置、设备及介质,该方法中确定接收到待检测请求的第一时间,及待检测请求对应的源IP地址,获取该第一时间之前预设时间长度的目标时间段内,接收到的该源IP地址的历史请求,根据获取到的历史请求及待检测请求,确定该源IP地址的至少一个统计参数的第一统计值,根据确定的第一统计值,以及与目标时间段相同的历史时间段对应的该至少一个统计参数的第二统计值,确定待检测请求是否为异常请求,将与接收到待检测请求的目标时间段相同的历史时间段对应的第二统计值,作为检测待检测请求的阈值,可以动态的确定阈值,避免了对人工经验要求较高的问题,有效的提高了网络攻击检测的准确率。
-
公开(公告)号:CN119740656A
公开(公告)日:2025-04-01
申请号:CN202411579479.9
申请日:2024-11-06
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Abstract: 本申请涉及人工智能技术领域,尤其涉及一种比例确定方法、装置、电子设备及存储介质,以准确地确定出最佳数据混合比例,提升大模型的效果。该方法包括:基于大模型在垂直领域下的各目标领域任务的任务类型,对领域数据集进行归类,得到各子领域数据集;获取多组关系对,并基于多组关系对,训练初始预测模型,得到目标预测模型,其中,每组关系对由各子领域数据集和各通用数据集的训练数据混合比例,以及训练数据混合比例对应的模型性能分数组成;将各待预测数据混合比例,输入至目标预测模型中,获得各待预测数据混合比例各自对应的模型性能分数,并从各待预测数据混合比例中,选取出模型性能分数满足预设性能条件的目标数据混合比例。
-
公开(公告)号:CN117749494A
公开(公告)日:2024-03-22
申请号:CN202311767168.0
申请日:2023-12-20
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Abstract: 本公开涉及计算机技术领域,提供了一种异常邮件检测方法、异常邮件检测装置、计算机存储介质、电子设备,其中,异常邮件检测方法包括:获取待检测邮件对应的密文向量,所述密文向量是将所述待检测邮件的明文向量输入训练好的加密模型中进行不可逆加密得到的;所述待检测邮件的明文向量是对所述待检测邮件的特征信息进行词向量转换得到的;将所述密文向量输入训练好的异常邮件检测模型中,通过所述异常邮件检测模型输出针对所述密文向量的检测结果;所述检测结果用于表征所述待检测邮件是否为所述异常邮件。本公开中的方法能够在不泄露用户信息的前提下实现异常邮件的检测。
-
公开(公告)号:CN119623631A
公开(公告)日:2025-03-14
申请号:CN202411686713.8
申请日:2024-11-22
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06N5/04 , G06F16/3329
Abstract: 本申请涉及计算机技术领域,尤其涉及一种请求处理方法、装置、电子设备及存储介质,用于防止大模型因高并发出现幻觉,提升大模型的可用性。该方法包括:获取待处理请求,并从令牌桶中初次获取待处理请求对应的令牌,以及将当前滑动时间窗口的并发总数加1;若初次获取令牌失败,则基于并发总数,以及大模型的吞吐量、平均时延和最大可接受时延,确定重新获取令牌的重试次数和重试间隔时长;基于重试次数和重试间隔时长,从令牌桶中重新获取令牌,当重新获取令牌成功时,基于大模型对待处理请求进行推理,生成并返回答案。这样,根据实时的并发总量,动态调整重试次数和重试间隔时长,请求被分散的到达大模型,提升了响应成功率和可用性。
-
公开(公告)号:CN119066454A
公开(公告)日:2024-12-03
申请号:CN202411231179.1
申请日:2024-09-03
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Abstract: 本申请涉及人工智能技术领域,具体涉及一种日志分类方法、装置、设备、介质及程序产品。该方法包括:针对当前生成的任意一条告警日志,利用相似度模型分别确定任意一条告警日志与预先构建的真实告警日志集合中每条真实告警日志的第一相似度;若真实告警日志集合中存在第一相似度大于预设相似度的真实告警日志,则确定任意一条告警日志为真实告警日志,否则,利用相似度模型分别确定任意一条告警日志与预先构建的虚假告警日志集合中每条虚假告警日志的第二相似度;若虚假告警日志集合中存在第二相似度大于预设相似度的虚假告警日志,则确定任意一条告警日志为虚假告警日志。通过上述方法,能够得到准确的分类结果。
-
公开(公告)号:CN117172305A
公开(公告)日:2023-12-05
申请号:CN202310834187.4
申请日:2023-07-07
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06N3/096 , G06N3/09 , G06N3/045 , G06N3/0495
Abstract: 本申请实施例提供了一种学生模型训练方法、装置、设备及介质,用以解决现有技术中训练完成的学生模型的输出结果不够准确的问题。获取训练集中任一训练数据以及训练数据所属的原始标签;将训练数据输入到教师模型中,获取教师模型的第一预测标签;将训练数据输入到学生模型中,获取学生模型的第二预测标签;若原始标签和第一预测标签不同,则采用根据原始标签和第二预测标签确定的目标损失值,对学生模型进行训练。由于当训练数据的原始标签和教师模型的第一预测标签不同时,即当教师模型出现错判时,根据原始标签和第二预测标签对学生模型进行训练,可以减小教师模型错误的输出结果对学生模型带来的影响,提高了学生模型的准确性。
-
-
-
-
-
-
-
-
-