一种面向微博的突发事件触发词识别方法

    公开(公告)号:CN110222250B

    公开(公告)日:2021-07-27

    申请号:CN201910411868.3

    申请日:2019-05-16

    Abstract: 本发明提出一种面向微博的突发事件触发词识别方法,将待分析的微博数据构成预料库的预料,其包括如下步骤:1)对突发事件语料库进行原始触发词统计,记录统计特征;2)对所述语料进行分词、分句等数据预处理,对所述分句后的语料数据按照分句进行依存句法分析,整理凝练出词对间依存关系,建立模式匹配规则;3)对所述预处理后的文本数据逐一进行模式规则匹配和潜在语义分析,进一步抽取分句语义信息,选取同时满足二者条件的词作为候选触发词,得到候选触发词集;4)计算所述候选触发词集与基于扩展触发词表的触发词识别出触发词进行相似度分析,将满足相似度要求的触发词确定为微博突发事件触发词。本发明避免了传统模式识别中效率偏低的缺点,同时遵循了机器学习中模型训练快速简单的优点。

    一种基于卷积神经网络CNN的恶意软件检测方法

    公开(公告)号:CN110704840A

    公开(公告)日:2020-01-17

    申请号:CN201910854560.6

    申请日:2019-09-10

    Abstract: 本发明提出一种基于卷积神经网络CNN的恶意软件检测方法,包括:步骤1:收集训练集并进行分析,通过Cuckoo沙箱生成json格式的报告文件;步骤2:对所述json格式的报告进行向量化的处理,得到特征向量;步骤3:将所述步骤2处理后的所述特征向量作为输入传入到未训练的CNN中进行训练学习,得到训练CNN;步骤4:将待测试的软件经过和所述步骤1和所述步骤2相同的处理后,得到待测试软件的特征向量,投入所述步骤3训练好的CNN中,通过CNN模型检测,判断所述待测试软件为恶意软件或者正常软件。本申请的方法相较与其他机器学习算法和杀毒软件在检测率和精确度上都能获得更好的技术效果。

    一种面向微博的突发事件触发词识别方法

    公开(公告)号:CN110222250A

    公开(公告)日:2019-09-10

    申请号:CN201910411868.3

    申请日:2019-05-16

    Abstract: 本发明提出一种面向微博的突发事件触发词识别方法,将待分析的微博数据构成预料库的预料,其包括如下步骤:1)对突发事件语料库进行原始触发词统计,记录统计特征;2)对所述语料进行分词、分句等数据预处理,对所述分句后的语料数据按照分句进行依存句法分析,整理凝练出词对间依存关系,建立模式匹配规则;3)对所述预处理后的文本数据逐一进行模式规则匹配和潜在语义分析,进一步抽取分句语义信息,选取同时满足二者条件的词作为候选触发词,得到候选触发词集;4)计算所述候选触发词集与基于扩展触发词表的触发词识别出触发词进行相似度分析,将满足相似度要求的触发词确定为微博突发事件触发词。本发明避免了传统模式识别中效率偏低的缺点,同时遵循了机器学习中模型训练快速简单的优点。

Patent Agency Ranking