-
公开(公告)号:CN104915333A
公开(公告)日:2015-09-16
申请号:CN201410085899.1
申请日:2014-03-10
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团公司
Abstract: 本发明提供一种生成关键字组合策略的方法及装置,其中,该方法包括:对信息进行切词处理,得到多个第一元素词组合;获得第一元素词组合的垃圾属性值和正常属性值;第一元素词组合的垃圾属性值大于第一预设值且正常属性值小于第二预设值时,确定该第一元素词组合为第一元素关键词组合;将第一元素关键词组合集中至少两个不同的第一元素关键词组合进行组合,得到第N元素词组合;当第N元素词组合的垃圾属性值大于第三预设值且正常属性值小于第四预设值时,确定该第N元素词组合为第N元素关键词组合,当N值大于或者等于一阈值时,确定N元素关键词组合集为策略集。该方法综合考虑关键字的垃圾和正常属性生成一组策略集,提高了策略集的拦截效果。
-
公开(公告)号:CN104915333B
公开(公告)日:2017-11-28
申请号:CN201410085899.1
申请日:2014-03-10
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团公司
Abstract: 本发明提供一种生成关键字组合策略的方法及装置,其中,该方法包括:对信息进行切词处理,得到多个第一元素词组合;获得第一元素词组合的垃圾属性值和正常属性值;第一元素词组合的垃圾属性值大于第一预设值且正常属性值小于第二预设值时,确定该第一元素词组合为第一元素关键词组合;将第一元素关键词组合集中至少两个不同的第一元素关键词组合进行组合,得到第N元素词组合;当第N元素词组合的垃圾属性值大于第三预设值且正常属性值小于第四预设值时,确定该第N元素词组合为第N元素关键词组合,当N值大于或者等于一阈值时,确定第N元素关键词组合集为策略集。该方法综合考虑关键字的垃圾和正常属性生成一组策略集,提高了策略集的拦截效果。
-
公开(公告)号:CN117992616A
公开(公告)日:2024-05-07
申请号:CN202211372801.1
申请日:2022-11-01
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: G06F16/36 , G06F16/33 , G06F40/194 , G06F40/30
Abstract: 本申请实施例公开了一种不良关键词知识图谱的构建方法及相关设备,解决了关键词策略难以被算法利用且无法对外共享的问题。该方法包括:根据关键词策略集合构建基础知识图谱,所述关键词策略中每个关键词策略包括N个关键词,所述N个关键词之间为布尔逻辑关系,其中,N为大于或等于1的整数;根据所述基础知识图谱以及所述关键词策略集合确定所述关键词策略集合中每个关键词策略所对应的替代关系和引申关系;将所述替代关系和所述引申关系融入所述基础知识图谱,以得到所述不良关键词知识图谱。
-
公开(公告)号:CN115204152A
公开(公告)日:2022-10-18
申请号:CN202110382534.5
申请日:2021-04-09
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: G06F40/242 , G06F40/284 , G06F16/33 , G06F16/36
Abstract: 本发明公开一种关键词变体的匹配方法,包括:合并第一待测文本中的拆分字;合并后的第一待测文本与关键词库中的关键词匹配,若其中不包含与关键词完全匹配的目标词,则获取其中每个目标字的头N笔和末M笔的笔画序列;在关键词库中查找各个目标字对应的疑似匹配关键词,确定各个目标字的匹配标识符;上述匹配标识符组成第1层匹配标识符序列,n赋值为2;计算第n‑1层相邻的匹配标识符的交集,得到第n层匹配标识符序列,判断第n层的匹配标识符对应的疑似匹配关键词的字数是否为n,若是,则输出匹配结果;若否,n赋值为n+1,重复执行本步骤,直至第n层匹配标识符序列不存在与关键词库中的疑似匹配关键词对应的标识符,该方法提高了匹配效率。
-
公开(公告)号:CN114255739B
公开(公告)日:2025-05-06
申请号:CN202010996191.7
申请日:2020-09-21
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
Abstract: 本发明实施例提供一种识别语音中关键词的方法及装置,其中,该方法包括:将待识别语音输入至语音识别模型,输出待识别语音对应的模糊发音空间;根据模糊发音空间,对关键词集进行搜索,获取待识别语音对应的关键词的识别结果;其中,模糊发音空间,用于表示待识别语音对应的多种语音识别结果。本发明实施例提供的识别语音中关键词的方法及装置,通过语音识别模型对待识别语音进行识别,获取多种可能的语音识别结果,组成模糊发音空间,将模糊发音空间和预先建立的关键词集进行匹配搜索,输出匹配到的关键词,使用模糊发音空间搜索的方法,能够成功处理语音的相似表达、语音中的吞字现象和语音中的发音不准确现象,能提高语音匹配的查全率。
-
公开(公告)号:CN118803604A
公开(公告)日:2024-10-18
申请号:CN202311546858.3
申请日:2023-11-20
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: H04W4/14 , H04W12/128 , G06N5/025 , G06F16/36 , G06F16/903
Abstract: 本申请涉及数据处理技术领域,提供一种短信管理策略生成方法、装置、电子设备及存储介质,方法包括:获取待处理短信;基于所述待处理短信进行字符子串提取,得到子串集;基于所述子串集与关键词知识图谱进行关键词匹配,得到目标关键词;所述关键词知识图谱是基于预设关键词及其变体、引申、替代的关联词构建的;基于所述目标关键词与所述关键词知识图谱确定短信拦截策略,以基于所述短信拦截策略进行短信拦截。本申请可以快速、准确地识别出待处理短信中,由关键词进行变体、引申或替代形成的新的关键词,进而快速、准确地确定出短信拦截策略,便于相关人员参考短信拦截策略进行垃圾短信拦截,因此可以提高垃圾短信拦截的准确性。
-
公开(公告)号:CN118797111A
公开(公告)日:2024-10-18
申请号:CN202410215600.3
申请日:2024-02-27
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC: G06F16/903 , G06F18/22 , G06Q50/50
Abstract: 本发明提供一种隐私信息泄露情况检测方法、设备及存储介质,涉及信息安全技术领域,所述方法包括:获取已泄露信息以及自有隐私信息;根据已泄露信息以及自有隐私信息,获取第一预设字符长度的第一字符串组以及第二字符串组;将第一字符串组与第二字符串组对比,获取第三字符串组,进而获取最大公共序列字符串生成第一泄露情况信息。基于第一预设字符长度为单位获取字符串,避免格式限制从已泄露信息中提取与自有隐私信息一致的关键字符串,通过连续相同字符重合的方式扩展字符串,找出最大公共序列字符串,适应提取长度存在变化、结构复杂的信息,对于部分信息泄露的情况,亦能够准确发现泄露部分的信息,提高对隐私泄露情况判断的准确性。
-
公开(公告)号:CN114255739A
公开(公告)日:2022-03-29
申请号:CN202010996191.7
申请日:2020-09-21
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
Abstract: 本发明实施例提供一种识别语音中关键词的方法及装置,其中,该方法包括:将待识别语音输入至语音识别模型,输出待识别语音对应的模糊发音空间;根据模糊发音空间,对关键词集进行搜索,获取待识别语音对应的关键词的识别结果;其中,模糊发音空间,用于表示待识别语音对应的多种语音识别结果。本发明实施例提供的识别语音中关键词的方法及装置,通过语音识别模型对待识别语音进行识别,获取多种可能的语音识别结果,组成模糊发音空间,将模糊发音空间和预先建立的关键词集进行匹配搜索,输出匹配到的关键词,使用模糊发音空间搜索的方法,能够成功处理语音的相似表达、语音中的吞字现象和语音中的发音不准确现象,能提高语音匹配的查全率。
-
公开(公告)号:CN103179530A
公开(公告)日:2013-06-26
申请号:CN201110442349.7
申请日:2011-12-26
Applicant: 中国移动通信集团设计院有限公司
Abstract: 本发明公开了一种短信拦截方法及装置,用以解决现有技术对垃圾短信进行拦截的准确性低的问题。该方法网络侧设备在采用设定格式配置的各策略集中,查找当前有效的策略集,并对短信监控,当根据当前有效的策略集中包含的关键字策略和流量策略,确定短信满足设定的拦截条件时,对该短信以及发送端发送的其他短信进行拦截。由于本发明实施例中采用统一的设定格式配置各策略集,每个策略集中包含策略,从而保证了各网络侧设备中的安全策略的组织形式是相同的,并可以根据策略集中包含的各种策略对短信进行拦截处理,无需使用特定的某个网络侧设备,也无需使用软件对安全策略进行组织形式的转换,因此提高了拦截垃圾短信的准确性。
-
公开(公告)号:CN118798335A
公开(公告)日:2024-10-18
申请号:CN202311541088.3
申请日:2023-11-17
Applicant: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
Abstract: 本申请涉及知识图谱构建领域,提供一种知识图谱构建方法、装置、设备及可读存储介质。知识图谱构建方法包括:对待处理新闻数据进行文本预处理得到词语序列;基于词语序列对待处理新闻进行分类和提取,得到目标知识元;基于目标知识元以及预设构建方式,构建目标知识三元组;基于目标知识三元组生成目标知识图谱。本申请通过从新闻文本中获取最新的反欺诈知识,提取出用于识别欺诈内容的关键词实体至知识图谱中,确保在反欺诈内容识别环节能够及时针对新型欺诈要素进行响应,解决涉诈关键词库缺乏时效性的问题。
-
-
-
-
-
-
-
-
-