异常话题检测方法、装置
    1.
    发明公开

    公开(公告)号:CN117235640A

    公开(公告)日:2023-12-15

    申请号:CN202311067335.0

    申请日:2023-08-23

    Abstract: 本发明提出一种异常话题检测方法、装置,方法包含:采集社交媒体平台的热搜榜单话题数据作为样本数据,对所述榜单话题数据进行特征表达,确定话题特征,构造特征判定规则模型;对所有话题特征进行聚类,划分自然话题群体、异常话题群体;识别不属于所述自然话题群体和所述异常话题群体的离群异常话题,动态调整话题归属,构造话题归属模型;将待检测话题依次输入至所述特征判定规则模型与话题归属模型,判定是否为异常话题。该方法有效提高了社交媒体平台榜单异常话题的识别精度,进而有效对抗社交媒体中的操纵和攻击。

    一种推荐系统评论区的群体极化问题检测方法和装置

    公开(公告)号:CN119089890A

    公开(公告)日:2024-12-06

    申请号:CN202410585948.1

    申请日:2024-05-13

    Abstract: 本发明提出一种推荐系统评论区的群体极化问题检测方法和装置,包括:对推荐系统指定的评论主帖进行话题观点提取,得到主帖观点;对评论主帖的评论区进行立场检测,得到评论区各条评论相对主帖观点的立场类别;通过提取各条评论的关键词,得到各条评论的立场类别对应的强烈程度;按照评论时间将评论区的评论排序,统计评论初始时间段内各立场类别的评论数量,并根据初始时间段内各条评论的强烈程度,得到各立场类别的平均极化程度,作为基准;持续抽取与初始时间段相同长度但时间靠后的后续时间段,计算后续时间段各立场类别的平均极化程度,并与基准进行对比,得到立场的极化偏离程度,当极化偏离程度超出阈值时进行报警。

    一种面向大模型安全评测的评测样本自动生成方法及装置

    公开(公告)号:CN119004104A

    公开(公告)日:2024-11-22

    申请号:CN202411083246.X

    申请日:2024-08-08

    Abstract: 本发明提出一种面向大模型安全评测的评测样本自动生成方法和装置,包括:测评问题集包含多个用于测试大语言模型安全性的评测样本,以具有诱导内容的任务提示为输入,以该任务提示对应的该评测样本标签,微调训练大语言模型输出评测样本,得到评测样本生成模型;根据评测样本的安全风险类别,构建检索问句,检索互联网中属于该安全风险类别的数据资料;根据该安全风险类别以及该数据资料,合成提示文本;从该测评问题集中抽取属于该安全风险类别的评测样本填充至该提示文本后作为任务提示输入该评测样本生成模型,生成用于测试大语言模型的测试样本。

    一种基于类别的社交机器人检测方法及检测系统

    公开(公告)号:CN118014752A

    公开(公告)日:2024-05-10

    申请号:CN202410245083.4

    申请日:2024-03-04

    Abstract: 本发明提供一种基于类别的社交机器人检测方法及检测系统,该检测方法包括以下步骤:依据行为模式和目的将社交机器人分成n个类别,其中n为正整数;基于所述类别构建通用模型加专用模型的集成学习检测框架;获取社交平台的用户数据作为样本,将所述样本输入所述集成学习检测框架并依据一投票模式判定所述样本是否为社交机器人。本发明的检测方法形成了行为模式更加鲜明的社交机器人分类,在将社交机器人归类的同时辅以相应的集成学习检测框架,识别泛化性和准确性均有提升。

    一种基于微博平台文本特征的社交机器人检测系统及方法

    公开(公告)号:CN116991973A

    公开(公告)日:2023-11-03

    申请号:CN202311091925.7

    申请日:2023-08-29

    Abstract: 本发明提供一种基于微博平台文本特征的社交机器人检测系统,所述系统包括:显式文本特征提取模块,用于提取微博平台账号对应的账号元信息文本与原发评论转发文本对应的显式文本特征;隐式文本特征提取模块,用于提取微博平台账号对应的账号元信息文本与原发评论转发文本对应的隐式文本特征;深层文本语义特征提取模块,用于对微博平台账号对应的账号元信息文本与原发评论转发文本进行情感检测、立场检测、垃圾内容检测、昵称检测和文本生成检测以获取对应的深度文本语义特征;社交机器人判定模块,用于将显式文本特征、隐式文本特征、深度文本语义特征拼接以得到融合特征,并根据融合特征判断微胖平台账号是否是社交机器人。

    文本检测方法、装置、介质
    8.
    发明公开

    公开(公告)号:CN119068503A

    公开(公告)日:2024-12-03

    申请号:CN202411015967.7

    申请日:2024-07-26

    Abstract: 本发明提出一种文本检测方法、装置、介质,该方法包含:对待测文本进行扰动处理,得到扰动文本;对该扰动文本进行语法树分析,识别文本的若干词语及词语间的语法结构,生成语法树;遍历该语法树,将该语法树中的每一个词语构建为图神经网络训练所需的节点,并将词语间的语法结构编码为邻接矩阵;对该扰动文本进行向量化处理,得到文本的高维向量表示;融合该高维向量表示和该邻接矩阵,通过图卷积神经网络进行训练,以预测该待测文本的类别标签。该方法实现了对扰动后生成文本的高精准度检测,同时使检测方法具有很强的鲁棒性。

Patent Agency Ranking