-
公开(公告)号:CN118798156A
公开(公告)日:2024-10-18
申请号:CN202411012024.9
申请日:2024-07-26
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06F40/194 , G06F40/30 , G06F18/213 , G06F18/214 , G06F18/25
Abstract: 本发明提供一种二进制文件相似检测方法、装置、设备、介质及程序产品,方法包括:对待检测二进制文件包含的函数进行划分得到基本块,对基本块内的指令序列进行语义提取,得到基本块的语义特征;基于结构特征和语义特征构建函数的控制流程图CFG;将函数的控制流程图输入图嵌入自动编码器GAE改进模型,得到待检测二进制文件的相似度;GAE改进模型是基于具有结构特征和语义特征的CFG矩阵训练得到的。通过准确获取待检测二进制文件的语义特征和结构特征,将语义特征和结构特征融合构建的控制流程图输入改进后的图嵌入自动编码器模型。从多种特征中综合评估二进制文件的相似度,提高了二进制文件相似度检测的准确性。
-
公开(公告)号:CN118797328A
公开(公告)日:2024-10-18
申请号:CN202311378094.1
申请日:2023-10-23
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
IPC: G06F18/214 , H04M3/22 , G06N3/045 , G06N3/0442 , G06N3/0475 , G06N3/088 , G06N3/09 , G06F123/02
Abstract: 本申请涉及机器学习技术领域,提供一种基于时间序列的模型训练方法及装置。方法包括:基于预先获取的路测语音数据和XDR语音数据,以第一阈值为时间划分粒度,构建出时间序列语音数据集;基于所述时间序列语音数据集,得到第一训练数据集;基于所述第一训练数据集训练预先设置的候选模型,得到训练后的语音质量评估模型。本申请提供的方法引入时序这一概念作为隐含的时间特征,具体以第一阈值为时间划分粒度对数据进行划分,构建出时间序列语音数据集,进而利用基于该时间序列语音数据集得到的第一训练数据集训练模型,可以使模型参考时间特征更好地学习语音质量评估,进而可以有效提高最终训练得到的语音质量评估模型的评估准确性。
-