-
公开(公告)号:CN116776833A
公开(公告)日:2023-09-19
申请号:CN202210233431.7
申请日:2022-03-09
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: G06F40/151 , G06F40/205
Abstract: 本发明公开了变体文本转译方法、处理设备及计算机可读存储介质,该方法包括:获取组成待译文本的每一的拼音集合,所述拼音集合包括所述组成汉字对应的第一拼音以及所述组成汉字的形近字对应的第二拼音;根据所述组成汉字的拼音集合,确定所述待译文本对应的拼音集合序列;将所述拼音集合序列作为预先训练的网络模型的输入参数,通过所述网络模型确定所述拼音集合序列对应的目标文本,并将所述目标文本作为所述待译文本的译文文本。达到了提取将变体文本转译为便于识别的文本的效果。
-
公开(公告)号:CN116738012A
公开(公告)日:2023-09-12
申请号:CN202210214487.8
申请日:2022-03-04
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: G06F16/903 , G06F16/33 , G06F16/335
Abstract: 本发明实施例涉及计算机数据处理技术领域,公开了一种不良消息识别方法,该方法包括:确定目标用户组对应的至少一条待识别消息;根据至少一条待识别消息按照消息发送顺序依次输入多模匹配模型,得到目标用户组对应的关键词匹配结果;其中,多模匹配模型根据预设的关键词集合构建;关键词匹配结果包括匹配关键词以及对应的匹配位置信息;每一条消息输入前,多模匹配模型的状态以及关键词匹配结果根据上一次输入的消息进行更新;根据关键词匹配结果以及关键词集合对应的至少一个关键词匹配策略确定至少一条待识别消息对应的消息识别结果。通过上述方式,本发明实施例提高了不良消息识别的准确率和效率。
-
公开(公告)号:CN115329066A
公开(公告)日:2022-11-11
申请号:CN202110448692.6
申请日:2021-04-25
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F16/31 , G06F16/383 , G06F40/194 , G06F40/216 , G06F40/284 , G06K9/62
Abstract: 本发明公开了一种文本匹配方法、装置、计算设备及计算机存储介质,方法包括:匹配文本中的待审核关键词及其位置信息,查询包含待审核关键词的策略,将策略包含的逻辑运算符作为分支结点、关键词作为叶子结点,构建得到二叉树;针对叶子结点,若存在待审核关键词与其对应的关键词一致,则确定叶子结点的布尔值为真,在叶子结点保存一致的待审核关键词的位置信息;针对分支结点,根据逻辑运算符及两个子结点的布尔值进行运算得到该分支结点的布尔值,基于此确定保存在该分支结点的位置信息;若根结点的布尔值为真,则确定待审核文本命中关键词组合策略,并根据根结点保存的位置信息,输出待审核文本片段。该方式能够提高文本匹配的准确率和效率。
-
公开(公告)号:CN113869041A
公开(公告)日:2021-12-31
申请号:CN202010619049.0
申请日:2020-06-30
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: G06F40/279 , G06F40/289 , G06F16/35
Abstract: 本发明实施例提供一种关键词组合提取方法、装置和电子设备,其中方法包括:确定待识别文本;对所述待识别文本进行分词,对分词结果进行循环移位,得到所述待识别文本的二维增广矩阵;基于所述待识别文本的二维增广矩阵,确定所述待识别文本的关键词组合。本发明实施例提供的方法、装置和电子设备,提取得到的关键词组合能够全面地反映待识别文本的内容特征,提高了对垃圾信息的识别准确率。
-
公开(公告)号:CN110830664B
公开(公告)日:2021-03-05
申请号:CN201810920834.2
申请日:2018-08-14
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: H04M3/436
Abstract: 本发明实施例提供一种识别电信诈骗潜在受害用户的方法和装置。所述方法包括:获取社交簇中关键被叫的社会身份信息,以及获取社交簇中主叫的受害信息,所述社交簇包括关键被叫以及与所述关键被叫具有稳定通话关系的多个主叫;根据所述社交簇中主叫的受害信息识别所述社交簇中的潜在受害用户,根据所述社交簇中关键被叫的社会身份信息以及各社交簇之间的关系识别其他社交簇中的潜在受害用户。本发明实施例通过获取社交簇中关键被叫的社会身份信息以及主叫的受诈骗信息,能够有效识别出基于信任关系的电信诈骗潜在受害用户,进一步识别出某种诈骗类型的潜在受害用户。
-
公开(公告)号:CN108154080B
公开(公告)日:2020-09-01
申请号:CN201711205432.6
申请日:2017-11-27
Applicant: 北京交通大学 , 中国移动通信集团设计院有限公司
IPC: G06K9/00
Abstract: 本发明提供了一种视频设备快速溯源的方法,该方法通过获取每个设备相机的一段视频,通过处理视频并且计算视频的相机指纹特征的方式计算出相机特征,建立数据库,每一部设备有自己独立的相机特征。同样方式计算待测视频的相机特征值,通过计算这个值与相机特征数据库中的特征值相关性来判断这个视频来自于哪部设备。本发明利用了相机指纹这种难以被修改和伪造的设备物理硬件特征在计算过程中以迭代处理,采用多种高效的识别方法实现设备高效溯源。
-
公开(公告)号:CN108154080A
公开(公告)日:2018-06-12
申请号:CN201711205432.6
申请日:2017-11-27
Applicant: 北京交通大学 , 中国移动通信集团设计院有限公司
IPC: G06K9/00
Abstract: 本发明提供了一种视频设备快速溯源的方法,该方法通过获取每个设备相机的一段视频,通过处理视频并且计算视频的相机指纹特征的方式计算出相机特征,建立数据库,每一部设备有自己独立的相机特征。同样方式计算待测视频的相机特征值,通过计算这个值与相机特征数据库中的特征值相关性来判断这个视频来自于哪部设备。本发明利用了相机指纹这种难以被修改和伪造的设备物理硬件特征在计算过程中以迭代处理,采用多种高效的识别方法实现设备高效溯源。
-
公开(公告)号:CN105975478A
公开(公告)日:2016-09-28
申请号:CN201610218382.4
申请日:2016-04-09
Applicant: 北京交通大学 , 中国移动通信集团设计院有限公司
Abstract: 本发明实施例提供了一种基于词向量分析的网络文章所属事件的检测方法和装置。该方法主要包括:建立典型训练集;对典型训练集中的每一条网络文章样本进行分词,去无用词预处理,得到规范化的网络文章样本文本;将每一条规范化的网络文章样本文本分别用word2vec算法和LDA算法提取特征,得到每一条网络文章样本文对应的多维词向量;将每一条网络文章样本文本对应的多维词向量和事件标签输入到随机森林算法,该随机森林算法输出事件的分类模型,利用所述事件的分类模型对待识别的网络文章文本进行识别,判断出所述待识别的网络文章文本所属的事件。本发明实施例充分利用了网络文本样本的信息,提高了网络文本样本所属事件分类的准确度。
-
公开(公告)号:CN105704093A
公开(公告)日:2016-06-22
申请号:CN201410690385.9
申请日:2014-11-25
Applicant: 中国移动通信集团设计院有限公司
IPC: H04L29/06
Abstract: 本发明公开了一种防火墙访问控制策略查错方法,装置及系统,接收采集端发送的防火墙访问控制策略;所述防火墙访问控制策略中包括至少一条防火墙策略;获取第X防火墙访问控制策略,确定所述第X防火墙自身的防火墙策略异常权重;获取所述第X防火墙的紧邻防火墙的防火墙访问控制策略,根据所述第X防火墙的防火墙策略与所述紧邻防火墙的防火墙策略,确定防火墙间的防火墙策略异常权重;根据所述第X防火墙自身的防火墙策略异常权重及所述防火墙间的防火墙策略异常权重确定所述第X防火墙访问控制策略的异常程度以供查错。采用该技术方案,能够有效的提高防火墙访问控制策略的分析效率,并且包括向管理员指出最优先解决的防火墙设备。
-
公开(公告)号:CN118964634A
公开(公告)日:2024-11-15
申请号:CN202411061910.0
申请日:2024-08-05
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: G06F16/36 , G06F40/289 , G06F16/35
Abstract: 本发明提供一种违规信息识别方法、装置、电子设备及存储介质,该方法通过在目标知识图谱中对目标违规信息拦截策略中的词语实体进行检索,可以将目标知识图谱中目标违规信息拦截策略中词语实体的俗称、简称、缩写等其他内容意义相同的词语实体、相同类别的词语实体以及与目标违规信息拦截策略中词语实体从属关系的词语实体,与目标违规信息拦截策略中词语实体进行结合,能提高目标违规信息拦截策略的更新效率,进而能有效增大违规信息拦截策略的拦截覆盖面,能提高违规信息的识别准确率和识别效率,还能在有效扩展目标违规信息拦截策略的同时确保目标违规信息拦截策略不会因为引入过多的词语实体,从而有效地减少对非违规信息的误识别。
-
-
-
-
-
-
-
-
-