自然语言处理方法、电子设备、存储介质

    公开(公告)号:CN114510932A

    公开(公告)日:2022-05-17

    申请号:CN202210110831.9

    申请日:2022-01-29

    Abstract: 本发明提出一种自然语言处理方法、电子设备、存储介质,能够提升处理模型对多模态自然语言的处理效率,其中方法包括:获取待识别数据;解析待识别数据,生成数据识别元素与元素位置信息;将数据识别元素、元素位置信息、与待识别数据对应的模态类型嵌入向量进行整合,形成组合识别序列;通过自然语言识别模型对组合识别序列进行识别,得到识别结果。本发明中的自然语言处理方法,将最初获取的待识别数据解析转化为易于处理的数据识别元素与元素位置信息,再将数据识别元素、元素位置信息、与待识别数据对应的模态类型嵌入向量进行整合生成组合识别序列供自然语言识别模型进行识别,进一步提升了对多模态自然语言的处理识别效率。

    基于流数据图谱的个人有害呼叫检测方法、装置及可读介质

    公开(公告)号:CN111131627A

    公开(公告)日:2020-05-08

    申请号:CN201911323561.4

    申请日:2019-12-20

    Abstract: 本发明提供了基于流数据图谱的个人有害呼叫检测方法、装置及可读介质,包括:采集多个用户的CDR数据,将CDR数据进行分解得到通讯数据并存入图形数据库,得到通讯图谱;对通讯图谱基于深度图谱提取通信节点统计及子图的相关属性和表征;将相关属性和表征进行预处理,进而作为机器学习模型参数进行训练,得到第一分析结果,并对第一分析结果中可疑呼叫群组进行分类;将可疑呼叫群组存入图形数据库,并进行第二次分析,得到有害呼叫的号码。本发明的有益效果为实时性及准确性上具有较大程度提升,并能实时查看呼叫当前及结合历史的图谱特征及记录溯源,重复听取通话的方式进行认为确认,增加分析成功率。

    一种数据质量检测方法、装置和存储介质

    公开(公告)号:CN115827615A

    公开(公告)日:2023-03-21

    申请号:CN202211570760.7

    申请日:2022-12-08

    Abstract: 本申请公开了一种数据质量检测方法、装置和存储介质,本申请的方法包括构建Vision Transformer预训练模型;通过所述Vision Transformer预训练模型对Vocs质谱监测数据进行调整,得到质谱图图片的特征信息;使所述Vocs质谱监测数据经过一个多层感知机和Softmax激活函数,得到预测正负类别的概率;根据所述正负类别的概率得到并输出对所述Vocs质谱监测数据的质量分析结果。本申请通过基于迁移学习的深度分类模型,解决Vocs监测数据质量监测问题,能够在数据质量监测方面取得良好的效果。

    基于多模态模型5G有害消息分析方法、装置和存储介质

    公开(公告)号:CN115618298A

    公开(公告)日:2023-01-17

    申请号:CN202211179220.6

    申请日:2022-09-27

    Abstract: 本申请公开了基于多模态模型5G有害消息分析方法、装置和存储介质,其中方法包括提取5G消息的文本特征、语音特征和图片特征;基于LSTM模型推理未知的5G信息的文本特征,得到所述文本特征向量;基于openSMILE提取5G声音特征,得到所述声音特征向量;基于CNN模型推理5G图片的图像特征,得到所述图像特征向量;将所述文本特征向量、声音特征向量和所述图像特征向量融合后推理有害消息。本申请通过使用SVM算法来融合5G消息中文本、图片和声音模态数据特征,使用新的基于多模态深度学习的网络来提取5G消息文本、语音和视觉数据特征,并通过多模态特征融合算法构造有效的5G有害消息深层网络分析模型,其表现优于其他单个模态数据的5G消息处理方式。

    基于深度学习的自然语言情感处理方法、装置和存储介质

    公开(公告)号:CN115422943A

    公开(公告)日:2022-12-02

    申请号:CN202210938216.7

    申请日:2022-08-05

    Abstract: 本申请公开了基于深度学习的自然语言情感处理方法、装置和存储介质,本申请对原始通信文本进行预处理,得不同中文语料对应的不同序列;采用BERT‑MLF模型对预处理后的中文语料序列进行特征提取,获得隐藏层输出,隐藏层输出包括每个序列对应的语义特征和最大池化后的方面特征;利用语义特征和方面特征进行BERT‑MLF模型的训练和测试;采用LSTM网络对语义特征和方面特征进行深度特征提取,获得每个序列的深层语义特征;将深层语义特征经过全连接层,再进入Softmax分类器进行分类,进行模型的训练和测试。本申请减少了模型训练所需的有标签的数据量、所需时间和计算资源,具有更好的适应性,能在短时间内生成可靠的深度学习模型,提高了系统的实用价值。

    基于深度卷积网络的有害网址分析方法、装置和介质

    公开(公告)号:CN115101089A

    公开(公告)日:2022-09-23

    申请号:CN202210484544.4

    申请日:2022-05-06

    Abstract: 本申请公开了基于深度卷积网络的有害网址分析方法、装置和介质,方法包括:对小样本语音进行预处理;使用预训练好的语音模型对所述小样本语音进行特征提取,得到隐藏层输出的特征向量;对所述特征向量进行深度特征提取,得到深层语义特征;将所述深层语义特征经过所述语音模型的全连接层并分类,进行语音模型的训练和测试。本申请的模型训练基于网址训练,训练所需要的时间和计算资源较少,且面对新的网址检测任务提高了系统的实用价值和处理效率。

    基于流数据图谱的个人有害呼叫检测方法、装置及可读介质

    公开(公告)号:CN111131627B

    公开(公告)日:2021-12-07

    申请号:CN201911323561.4

    申请日:2019-12-20

    Abstract: 本发明提供了基于流数据图谱的个人有害呼叫检测方法、装置及可读介质,包括:采集多个用户的CDR数据,将CDR数据进行分解得到通讯数据并存入图形数据库,得到通讯图谱;对通讯图谱基于深度图谱提取通信节点统计及子图的相关属性和表征;将相关属性和表征进行预处理,进而作为机器学习模型参数进行训练,得到第一分析结果,并对第一分析结果中可疑呼叫群组进行分类;将可疑呼叫群组存入图形数据库,并进行第二次分析,得到有害呼叫的号码。本发明的有益效果为实时性及准确性上具有较大程度提升,并能实时查看呼叫当前及结合历史的图谱特征及记录溯源,重复听取通话的方式进行认为确认,增加分析成功率。

    互联网有害事件的检测方法、装置和存储介质

    公开(公告)号:CN116304071A

    公开(公告)日:2023-06-23

    申请号:CN202211323446.9

    申请日:2022-10-27

    Abstract: 本申请公开了互联网有害事件的检测方法、装置和存储介质,本申请构造或更新关键词知识图谱,并将知识图谱划分为若干子图;利用聚类算法将文档聚类到有害事件中;通过更新每个有害事件,将每个有害事件插入到有害故事树中,或者根据有害事件创建一个新的有害故事树,实现了移动互联网和互联网中的有害内容检测和分类,目的是从海量的网页及文档数据中发现有害事件,以在线方式以合理的有害故事树组织有害事件;提出了一种基于知识图谱的两层网页文档聚类算法,从大量的网页文本或网页相关新闻中提取有害事件,在新的网页及文档数据到达后,使用在线算法将事件组织成故事树,在有害事件提取方面比传统基于关键词的恶算法更有效。

Patent Agency Ranking