一种基于关键词特征嵌入语言模型的意图识别方法及系统

    公开(公告)号:CN112989839A

    公开(公告)日:2021-06-18

    申请号:CN201911309397.1

    申请日:2019-12-18

    Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于关键词特征嵌入语言模型的意图识别方法,包括:采用前后向最大分词算法,对提取的有效文本的语言信息进行分词,获得不同类别的分词结果;针对获得的不同类别的分词结果,获得不同类别的分词结果对应的候选意图相关的关键词列表;剔除每一种类别的分词结果对应的候选意图相关的关键词列表中的通用高频词和领域无关词,获得每一种类别的分词结果对应的最终关键词表,进而获得不同的关键词特征向量;将获得的每一个关键词特征向量嵌入至预先训练好的语言模型,获得带有关键词特征的有效文本的语音信息;并对其进行编码和分类,获得该有效文本的语言信息的意图识别结果。

    一种基于时空图的诈骗号码识别方法

    公开(公告)号:CN111726460B

    公开(公告)日:2021-04-20

    申请号:CN202010542365.2

    申请日:2020-06-15

    Abstract: 一种基于时空图的诈骗号码识别方法,包括:由全量通话记录生成电信通联网络,并构建识别诈骗号码的时空图,使用Snapshot方法按时间间隔T、从图中连续截取出多张时空子图;基于用户在每张时空子图对应时间周期下的通话记录,计算每个用户在每张时空子图对应时间周期下的通话特征指标向量,同时,为每个用户从时空子图中提取和其有相同被叫的邻居用户;构建、并训练识别诈骗号码的时空图神经网络;将待识别目标用户和其所有邻居用户在所有时空子图中的通话特征指标向量输入时空图神经网络,并根据输出判断待识别目标用户号码是否是疑似诈骗号码。本发明属于信息技术领域,能动态的捕获到号码呼叫行为的变化,从而实现诈骗号码的精准识别。

    一种VoIP网络流量所属平台的识别方法

    公开(公告)号:CN111641599A

    公开(公告)日:2020-09-08

    申请号:CN202010394712.1

    申请日:2020-05-11

    Abstract: 一种VoIP网络流量所属平台的识别方法,包括:根据流量特征从流量数据中过滤出VoIP流量,并根据五元组信息对VoIP流量进行拆分,生成新的流量文件;识别每个流量文件中的上下行流量,提取和计算上行、下行、合并流量的特征指标,并构成每个流量文件的特征向量;使用随机森林模型进行建模,构建VoIP平台识别模型,输入是由多个流量文件的特征向量构成的特征向量矩阵,输出是多个流量文件分别对应的VoIP平台标签;将待识别的多个流量文件的特征向量构成的特征向量矩阵输入至VoIP平台识别模型,并获得每个待识别的流量文件分别对应的VoIP平台标签。本发明属于信息技术领域,能有效识别加密后的VoIP流量及其平台归属。

Patent Agency Ranking