基于潜在语义索引的上网行为分析方法、系统和介质

    公开(公告)号:CN112686050A

    公开(公告)日:2021-04-20

    申请号:CN202011571954.X

    申请日:2020-12-27

    摘要: 本发明提供一种基于潜在语义索引的上网行为分析方法、系统和介质。所述方法包括:步骤S1、基于用户历史上网日志来确定所述用户的上网行为的潜在语义特征矩阵;步骤S2、利用所述潜在语义特征矩阵来计算所述用户的上网行为的行为链;以及步骤S3、根据所述行为链构建LSTM深度神经网络模型,以检测所述用户的异常上网行为。该方法能够有效对上网日志数据进行分析,对网址的特征进行相关性计算,刻画用户上网行为画像,构建上网异常行为链,并采用机器学习深度挖掘潜在特征,识别出数据中的异常行为,并能够不断迭代、优化和持续改进,从而实现了及时应急响应和处置。

    异常行为检测方法、装置、电子设备及可读存储介质

    公开(公告)号:CN112149749B

    公开(公告)日:2024-03-19

    申请号:CN202011053576.6

    申请日:2020-09-29

    摘要: 本发明实施例提供一种异常行为检测方法、装置、电子设备及可读存储介质,方法包括:获取至少两个用户在包括至少两个时间窗口的预设时间序列内分别对应的行为日志;针对每个行为日志,在各时间窗口内分别构建包括N个特征维度的特征值的特征向量,以获取特征向量集合;根据特征向量集合生成包括至少一个类别的行为基线向量的基线组,每个类别对应不同的特征标签;针对每个类别的行为基线向量,计算特征向量集合与行为基线向量的偏差获取偏差量集合;采用RNN深度学习算法,基于至少一个偏差量集合构建至少一个异常行为检测模型;根据异常行为检测模型对目标用户进行异常行为检测,可以从日志数据中高效抽取出异常数据,提升异常行为检测精度。

    文本语料的处理方法和装置
    3.
    发明公开

    公开(公告)号:CN111160035A

    公开(公告)日:2020-05-15

    申请号:CN201911419932.9

    申请日:2019-12-31

    IPC分类号: G06F40/295 G06F16/35 G06N3/04

    摘要: 本发明公开了一种文本语料的处理方法和装置。其中,该方法包括:识别文本语料中的多个实体,以及多个实体关系;基于多个实体和多个实体关系,构建结构化矩阵,其中,结构化矩阵中的每个实体标注了对应的实体标签,每个实体关系标注了对应的关系标签;使用神经网络模型中的反向传播算法来更新神经网络模型的模型参数;使用更新了模型参数的神经网络模型来训练结构化矩阵中的数据,训练得到联合抽取模型,其中,联合抽取模型用于对文本语句进行预测。本发明解决了相关技术中联合抽取方式采用神经网络来建立实体和关系之间的模型,由于预测实体时只能抽取单一实体之间的对应关系,导致无法解决多实体之间的关系抽取的技术问题。

    基于迭代膨胀卷积神经网络的公安笔录命名实体识别方法

    公开(公告)号:CN109740151A

    公开(公告)日:2019-05-10

    申请号:CN201811576729.8

    申请日:2018-12-23

    IPC分类号: G06F17/27 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于迭代膨胀卷积神经网络的公安笔录命名实体识别方法,包括如下步骤:对数据进行预处理;将原始语料数据分为训练集、测试集和验证集;统计训练集的字符个数,得到字符数据集,按字符出现频率降序进行编码,得到字符对应编号数据集Char_ID;将每条原始语料进行分词并编码,生成分词数据集Segs;统计训练集的所有字符的标签,并对标签按出现频次降序编号,得到标签数据Tags_ID;将训练集按组划分以生成批量数据集Butch_Data;建立基于IDCNN的深度学习模型,随机抽取Butch_Data进行参数训练;将膨胀算子计算的卷积矩阵组合,并进行dropout计算,得到每个字符对应的Logits值;以及将上层产生的Logits值经过softmax计算,并与labels的概率分布进行交叉熵计算,最终得到该字符的类别标签。

    基于潜在语义索引的上网行为分析方法、系统和介质

    公开(公告)号:CN112686050B

    公开(公告)日:2023-12-05

    申请号:CN202011571954.X

    申请日:2020-12-27

    摘要: 本发明提供一种基于潜在语义索引的上网行为分析方法、系统和介质。所述方法包括:步骤S1、基于用户历史上网日志来确定所述用户的上网行为的潜在语义特征矩阵;步骤S2、利用所述潜在语义特征矩阵来计算所述用户的上网行为的行为链;以及步骤S3、根据所述行为链构建LSTM深度神经网络模型,以检测所述用户的异常上网行为。该方法能够有效对上网日志数据进行分析,对网址的特征进行相关性计算,刻画用户上网行为画像,构建上网异常行为链,并采用机器学习深度挖掘潜在特征,识别出数据中的异常行为,并能够不断迭代、优化和持续改进,从而实现了及时应急响应和处置。

    案件的笔录文本的处理方法、装置、存储介质和处理器

    公开(公告)号:CN111581975B

    公开(公告)日:2023-06-20

    申请号:CN202010388115.8

    申请日:2020-05-09

    摘要: 本发明公开了一种案件的笔录文本的处理方法、装置、存储介质和处理器。其中,该方法包括:获取目标案件的目标笔录文本;基于第一命名实体识别模型对目标笔录文本进行识别,得到目标笔录文本中的多个目标实体,其中,第一命名实体识别模型为使用多组样本数据通过迁移学习训练出的,多组样本数据中的每组数据均包括:目标笔录文本样本、目标笔录文本样本中的实体的标签,以及目标笔录文本样本与标签之间的对应关系,实体用于表征目标笔录文本样本的质量;输出通过多个目标实体生成的目标数值,其中,目标数值用于指示目标笔录文本的质量。本发明解决了对案件的笔录文本的处理效率低的技术问题。

    文本语料的处理方法和装置

    公开(公告)号:CN111160035B

    公开(公告)日:2023-06-20

    申请号:CN201911419932.9

    申请日:2019-12-31

    摘要: 本发明公开了一种文本语料的处理方法和装置。其中,该方法包括:识别文本语料中的多个实体,以及多个实体关系;基于多个实体和多个实体关系,构建结构化矩阵,其中,结构化矩阵中的每个实体标注了对应的实体标签,每个实体关系标注了对应的关系标签;使用神经网络模型中的反向传播算法来更新神经网络模型的模型参数;使用更新了模型参数的神经网络模型来训练结构化矩阵中的数据,训练得到联合抽取模型,其中,联合抽取模型用于对文本语句进行预测。本发明解决了相关技术中联合抽取方式采用神经网络来建立实体和关系之间的模型,由于预测实体时只能抽取单一实体之间的对应关系,导致无法解决多实体之间的关系抽取的技术问题。

    异常行为检测方法、装置、电子设备及可读存储介质

    公开(公告)号:CN112149749A

    公开(公告)日:2020-12-29

    申请号:CN202011053576.6

    申请日:2020-09-29

    IPC分类号: G06K9/62 G06N3/08

    摘要: 本发明实施例提供一种异常行为检测方法、装置、电子设备及可读存储介质,方法包括:获取至少两个用户在包括至少两个时间窗口的预设时间序列内分别对应的行为日志;针对每个行为日志,在各时间窗口内分别构建包括N个特征维度的特征值的特征向量,以获取特征向量集合;根据特征向量集合生成包括至少一个类别的行为基线向量的基线组,每个类别对应不同的特征标签;针对每个类别的行为基线向量,计算特征向量集合与行为基线向量的偏差获取偏差量集合;采用RNN深度学习算法,基于至少一个偏差量集合构建至少一个异常行为检测模型;根据异常行为检测模型对目标用户进行异常行为检测,可以从日志数据中高效抽取出异常数据,提升异常行为检测精度。

    案件的笔录文本的处理方法、装置、存储介质和处理器

    公开(公告)号:CN111581975A

    公开(公告)日:2020-08-25

    申请号:CN202010388115.8

    申请日:2020-05-09

    IPC分类号: G06F40/295 G06N3/04

    摘要: 本发明公开了一种案件的笔录文本的处理方法、装置、存储介质和处理器。其中,该方法包括:获取目标案件的目标笔录文本;基于第一命名实体识别模型对目标笔录文本进行识别,得到目标笔录文本中的多个目标实体,其中,第一命名实体识别模型为使用多组样本数据通过迁移学习训练出的,多组样本数据中的每组数据均包括:目标笔录文本样本、目标笔录文本样本中的实体的标签,以及目标笔录文本样本与标签之间的对应关系,实体用于表征目标笔录文本样本的质量;输出通过多个目标实体生成的目标数值,其中,目标数值用于指示目标笔录文本的质量。本发明解决了对案件的笔录文本的处理效率低的技术问题。