一种针对海量文本数据的定向筛选装置及方法

    公开(公告)号:CN113742478B

    公开(公告)日:2023-09-05

    申请号:CN202010474192.5

    申请日:2020-05-29

    Abstract: 本发明公开了一种针对海量文本数据的定向筛选架构及方法。本方法步骤包括:1)使用关键词匹配方法从待筛选文本中获取疑似目标文本;2)从已标注的目标文本中提取常用句式,并分为与业务强相关句式、与业务弱相关句式;对待筛选文本进行模糊句式匹配,如果与业务强相关句式匹配,则将文本判断为目标文本,否则为疑似目标文本;3)对每一疑似目标文本进行分类;4)根据疑似目标文本匹配上的关键词的个数确定文本的评估值E1;根据分类判别结果,确定文本的评估值E2;基于文本与外部辅助语料的信息匹配结果确定文本的评估值E3;然后基于评估值E1~E3,计算得到文本最终评分反馈给研判层;5)研判层确定反馈的文本是否为目标文本。

    一种基于时空图的诈骗号码识别方法

    公开(公告)号:CN111726460A

    公开(公告)日:2020-09-29

    申请号:CN202010542365.2

    申请日:2020-06-15

    Abstract: 一种基于时空图的诈骗号码识别方法,包括:由全量通话记录生成电信通联网络,并构建识别诈骗号码的时空图,使用Snapshot方法按时间间隔T、从图中连续截取出多张时空子图;基于用户在每张时空子图对应时间周期下的通话记录,计算每个用户在每张时空子图对应时间周期下的通话特征指标向量,同时,为每个用户从时空子图中提取和其有相同被叫的邻居用户;构建、并训练识别诈骗号码的时空图神经网络;将待识别目标用户和其所有邻居用户在所有时空子图中的通话特征指标向量输入时空图神经网络,并根据输出判断待识别目标用户号码是否是疑似诈骗号码。本发明属于信息技术领域,能动态的捕获到号码呼叫行为的变化,从而实现诈骗号码的精准识别。

    网络类型识别方法及装置
    20.
    发明授权

    公开(公告)号:CN110111814B

    公开(公告)日:2021-09-21

    申请号:CN201910419117.6

    申请日:2019-05-20

    Abstract: 本发明实施例提供一种网络类型识别方法及装置。所述方法包括:获取待识别语音;将待识别语音输入至预设的网络识别模型,得到识别结果;其中,所述网络识别模型为通过样本数据对随机森林模型以及支持向量机模型进行预设数据训练得到的。本发明实施例将网络类型识别的过程自动化实现,效率较高,可有效降低人工成本;且网络识别通过机器学习的方式建立,满足精确度需求;预先通过大量样本数据建立网络识别模型,适用于VoIP通话;本发明实施例解决了现有技术中,VoIP电话的出现使得难以准确地根据号码判断主叫方网络类型的问题。

Patent Agency Ranking