勒索软件检测的方法
    1.
    发明公开

    公开(公告)号:CN107273747A

    公开(公告)日:2017-10-20

    申请号:CN201710365035.9

    申请日:2017-05-22

    CPC classification number: G06F21/566 G06F21/53 H04L63/145

    Abstract: 一种勒索软件检测的方法,所述勒索软件检测的方法分为先后顺序执行的两个部分,勒索软件的检测模型训练:首先,需要确定训练勒索软件检测模型的训练集,训练集分为2个子集:①勒索软件样本集合;②正常样本集合;利用分布式沙箱对训练集合中样本进行动态分析,提取沙箱分析后的报告;2)勒索软件的检测模型的测试;根据特征构造算法建立特征集,采用五折交叉法进行模型的训练与测试,使用准确率这样的指标衡量模型性能。有效避免了现有技术中难以检测勒索软件、对不同类型的勒索软件的特征研究不深入、检测的结果受到的干扰越严重以及构建的算法维度与复杂度高的缺陷。

    基于改进LDA主题模型的文本相似度计算方法及系统

    公开(公告)号:CN108829799A

    公开(公告)日:2018-11-16

    申请号:CN201810571074.9

    申请日:2018-06-05

    Abstract: 一种基于改进LDA主题模型的文本相似度计算方法及系统,在WMF_LDA主题模型中获取若干文本集;通过word2vec词向量模型对预处理词语集中的词语进行相似度计算并生成若干词语相似度值;按照其词语之间相似度生成领域主题词语集;并将进行过词语语义合并的文档通过LDA主题模型得出其在不同主题上的概率分布;确定任意两个文本之间主题分布相似度得到本发明相似度。先进行筛选减少主题词语集中词语的数量,并将同义词、近义词、同领域词进行统一化映射,再通过建模获得文本的概率分布并进一步判断文本之间的相似程度,使得在计算两个文本的相似度的过程中,使得计算时维度小、减少浪费空间并且解决了过多集中于词语层面、未能充分挖掘和利用不同类型文本的问题。

Patent Agency Ranking