基于数据源重要程度的样本确定方法及装置、设备及介质
摘要:
本发明提供了一种基于数据源重要程度的样本确定方法及装置、设备及介质,涉及数据处理领域,包括:响应于接收到目标恶意文件,获取每一目标数据源对目标恶意文件设置的名称字符串,得到目标名称字符串列表;对每一名称字符串进行字符串拆分,得到目标候选字符串列表集;根据目标候选字符串列表集,确定每一目标数据源的重要程度;确定与目标恶意文件对应的目标相似样本文件。本发明通过每一目标数据源对目标恶意文件的名称字符串进行拆分,得到每一目标数据源的文件特征分析用的字符串数量,进而通过拆分得到的字符串数量确定对应的重要程度,通过每一重要程度,确定相似样本文件,使得到的相似样本文件与目标恶意文件之间的相似准确度更高。
0/0