-
公开(公告)号:CN113591464B
公开(公告)日:2022-06-10
申请号:CN202110860112.4
申请日:2021-07-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/279 , G06F16/332 , G06F40/30
Abstract: 本公开提供了一种变体文本检测方法、模型训练方法、装置及电子设备,涉及人工智能技术领域,尤其涉及文本处理领域。该方法包括:将多个文本分别输入变体文本检测模型,得到多个文本中每个文本的变体分数,变体文本检测模型是采用变体文本样本对文本识别模型进行训练得到的;根据每个文本的变体分数确定多个文本中的第一变体文本,并确定第一变体文本对应的第一账户;确定与第一账户相关的可疑账户;对可疑账户提交的文本进行内容特征检测,并根据内容特征检测的结果,确定可疑账户提交的文本中的第二变体文本,实现了对变体文本及时主动地挖掘。
-
公开(公告)号:CN113591440B
公开(公告)日:2023-08-01
申请号:CN202110866740.3
申请日:2021-07-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/166
Abstract: 本公开提供了一种文本处理方法、装置及电子设备,涉及数据处理技术领域,尤其涉及人工智能安全技术领域。具体实现方案为:先确定待处理文本中的异常字符;提取异常字符的字符特征,字符特征包括以下特征中的一个或多个特征:用于表示字符发音的发音特征、用于表示字符形状的形状特征、用于表示字符语义的语义特征;根据异常字符的字符特征,确定字符特征与异常字符的字符特征相匹配的原始字符;在待处理文本中,将异常字符编辑为原始字符,得到修复文本。采用本公开的上述方案可以消除待处理文本的错误,得到修复文本,以便于对待处理文本的理解。
-
公开(公告)号:CN113591464A
公开(公告)日:2021-11-02
申请号:CN202110860112.4
申请日:2021-07-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/279 , G06F16/332 , G06F40/30
Abstract: 本公开提供了一种变体文本检测方法、模型训练方法、装置及电子设备,涉及人工智能技术领域,尤其涉及文本处理领域。该方法包括:将多个文本分别输入变体文本检测模型,得到多个文本中每个文本的变体分数,变体文本检测模型是采用变体文本样本对文本识别模型进行训练得到的;根据每个文本的变体分数确定多个文本中的第一变体文本,并确定第一变体文本对应的第一账户;确定与第一账户相关的可疑账户;对可疑账户提交的文本进行内容特征检测,并根据内容特征检测的结果,确定可疑账户提交的文本中的第二变体文本,实现了对变体文本及时主动地挖掘。
-
公开(公告)号:CN113312560A
公开(公告)日:2021-08-27
申请号:CN202110664861.X
申请日:2021-06-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9536 , G06Q50/00
Abstract: 本公开提供了群组检测方法、装置及电子设备,涉及网络安全技术领域。具体实现方案为:获取第一群组,第一群组包括关联的N个异常账号;获取第一群组所使用的目标网络地址,目标网络地址为N个异常账号所使用的网络地址中满足第一预设条件的网络地址,第一预设条件包括:N个异常账号所使用的频次大于第一阈值,和/或,所使用的异常账号的数量大于第二阈值;获取与第一群组共享目标网络地址的目标账号;确定目标账号与第一群组的第一关系;在第一关系表征目标账号与第一群组存在关联关系的情况下,生成第二群组。本公开解决了群组检测技术存在的对黑产团伙的检测效果较差的问题,提高了对黑产团伙的检测效果。
-
公开(公告)号:CN113312560B
公开(公告)日:2023-07-25
申请号:CN202110664861.X
申请日:2021-06-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9536 , G06Q50/00
Abstract: 本公开提供了群组检测方法、装置及电子设备,涉及网络安全技术领域。具体实现方案为:获取第一群组,第一群组包括关联的N个异常账号;获取第一群组所使用的目标网络地址,目标网络地址为N个异常账号所使用的网络地址中满足第一预设条件的网络地址,第一预设条件包括:N个异常账号所使用的频次大于第一阈值,和/或,所使用的异常账号的数量大于第二阈值;获取与第一群组共享目标网络地址的目标账号;确定目标账号与第一群组的第一关系;在第一关系表征目标账号与第一群组存在关联关系的情况下,生成第二群组。本公开解决了群组检测技术存在的对黑产团伙的检测效果较差的问题,提高了对黑产团伙的检测效果。
-
公开(公告)号:CN113591440A
公开(公告)日:2021-11-02
申请号:CN202110866740.3
申请日:2021-07-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/166
Abstract: 本公开提供了一种文本处理方法、装置及电子设备,涉及数据处理技术领域,尤其涉及人工智能安全技术领域。具体实现方案为:先确定待处理文本中的异常字符;提取异常字符的字符特征,字符特征包括以下特征中的一个或多个特征:用于表示字符发音的发音特征、用于表示字符形状的形状特征、用于表示字符语义的语义特征;根据异常字符的字符特征,确定字符特征与异常字符的字符特征相匹配的原始字符;在待处理文本中,将异常字符编辑为原始字符,得到修复文本。采用本公开的上述方案可以消除待处理文本的错误,得到修复文本,以便于对待处理文本的理解。
-
公开(公告)号:CN103631861A
公开(公告)日:2014-03-12
申请号:CN201310517209.0
申请日:2013-10-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06Q10/10 , G06Q10/04 , G06Q30/00 , G06F17/30864
Abstract: 本发明的目的是提供一种用于处理并提供评测信息的方法与设备。具体地,获取来自一个或多个数据源的多个评测初始信息;对多个评测初始信息进行处理,以获得包括与评测初始信息相对应的评测记录信息的评测数据集,其中,评测记录信息包括根据评测初始信息并结合关于评测对象的参考评测初始信息所确定的、评测对象的评测维度信息。与现有技术相比,本发明通过与现有技术相比,本发明通过对来自一个或多个数据源的多个评测初始信息进行处理,以获得包括与评测初始信息相对应的评测记录信息的评测数据集,丰富了评测初始信息的来源,得到的评测数据集不仅提升了用户需求满意度,也提高了用户获取信息的效率,相应地,也提升了用户的搜索体验。
-
-
-
-
-
-