-
公开(公告)号:CN116414976A
公开(公告)日:2023-07-11
申请号:CN202111659483.2
申请日:2021-12-30
Applicant: 中国科学院信息工程研究所
IPC: G06F16/35 , G06F40/284 , G06F40/216 , G06F21/56
Abstract: 本发明提供一种文档检测方法、装置及电子设备,包括:对待检测文档进行动态分析,得到文档分析报告;依次将所述文档分析报告中的各个单词与目标单词列表中的单词进行匹配,获取匹配成功的目标单词序列,其中,所述目标单词列表是基于历史文档分析报告集合中的各个单词确定的;将所述匹配成功的目标单词序列输入分类模型,得到所述待检测文档的分类结果。本发明通过从历史文档分析报告中确定目标单词列表,将文档分析报告中的各个单词与目标单词列表中的单词进行匹配,获取匹配成功的目标单词序列,并结合分类模型,实现对待检测文档的分类,能有效提高检测出恶意文档的准确率。