-
公开(公告)号:CN119990203A
公开(公告)日:2025-05-13
申请号:CN202411812196.4
申请日:2024-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
IPC: G06N3/06 , G06F18/2431
Abstract: 本发明提供一种大模型安全神经元筛选方法和装置,方法包括:对基础大模型进行安全对齐,得到安全对齐模型;计算所述安全对齐模型和所述基础大模型的神经元激活差异;基于所述神经元激活差异,确定对所述基础大模型进行安全对齐时的安全神经元。本发明从模型自身内部的性质出发,不受任务形式限制,容易扩展,适用于大模型中的安全神经元发现,为进一步研究大模型的安全机理提供方案。
-
公开(公告)号:CN119990134A
公开(公告)日:2025-05-13
申请号:CN202411808989.9
申请日:2024-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
IPC: G06F40/30 , G06F40/284 , G06F40/237
Abstract: 本发明提供一种使用自述式提示与集成梯度的语义贡献识别方法及系统,包括:获取输入数据并编写特定的问题提示;将所述问题提示多次输入至预设的大语言模型,引导大语言模型自动识别并报告在决策过程中起到关键作用的词汇,生成关键词提议集合;基于所述关键词提议集合抽取关键词,生成第一语义贡献度列表;基于所述输入数据通过预设的公式进行集成梯度计算,生成第二语义贡献度列表;将所述第一语义贡献度列表和第二语义贡献度列表进行整合分析,确定对大语言模型决策有重大影响的词汇。本发明解决了现有技术中大语言模型行为解释单一方法的局限性问题,提高了模型解释的全面性和准确性,满足了在多种自然语言处理应用中对可解释性的要求。
-
公开(公告)号:CN118657148A
公开(公告)日:2024-09-17
申请号:CN202410681340.9
申请日:2024-05-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/205 , G06F40/126 , G06F16/33
Abstract: 本发明提供一种实体关系抽取方法、装置、电子设备以及存储介质,涉及人工智能技术领域。实体关系抽取方法包括:利用注意力模型,处理待处理文本以及目标实体关系词,得到实体关系判别信息;利用实体关系判别信息,得到目标第一命名实体与候选第二命名实体在待处理文本中的第一关联度、目标第一命名实体与目标实体关系词在待处理文本中的第二关联度,以及候选第二命名实体与目标实体关系词在待处理文本中的第三关联度;响应于第一关联度、第二关联度以及第三关联度均大于各自对应的预设阈值,从待处理文本中抽取出目标第一命名实体和候选第二命名实体之间的待抽取的实体关系。本发明可以准确、高效地执行实体关系抽取任务。
-
公开(公告)号:CN118626223A
公开(公告)日:2024-09-10
申请号:CN202410705471.6
申请日:2024-06-03
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于自动化驱动工具的社交网络数据采集方法,包括:获取输入的调度任务,将调度任务转化为结构化数据,并持久化到任务存储器;基于预设的优先级策略自动调整调度任务的执行顺序和执行频率;请求获取调度任务,根据与分配的调度任务匹配的预先配置的模板,采用自动化驱动工具于社交平台上自动采集分配的调度任务所需的数据;收集分配的调度任务的状态变化,待分配的调度任务完成后将采集到的数据上报,并修改分配的调度任务的下次执行时间。本发明可通过自动化驱动技术采集获取社交网络平台数据,可完成系统内持续任务的分类定级,根据各任务执行主体的状态动态分配任务以及资源回收。
-
公开(公告)号:CN116467454A
公开(公告)日:2023-07-21
申请号:CN202310504562.9
申请日:2023-05-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/9537 , G06F40/194
Abstract: 本发明公开了一种综合多模型的网络热点话题传播模式分类方法,其包括以下步骤:步骤一、收集平台t时间段内的目标热点话题的帖子数据;步骤二、基于帖子数据计算帖子基本维度信息;步骤三、绘制关于时间‑帖子数量的话题热度变化曲线;步骤四、提取目标热点话题的竞争性话题,并计算竞争性话题数量;步骤五、基于帖子数据,量化目标热点话题的传播角色的信息;步骤六、通过漏斗模型和网络模型,进行目标热点话题的传播模式识别分类。本发明构建了一种普适的网络热点话题传播模式识别分类方法,能够有效地判断话题的传播类型,即使在话题部分维度数据缺失的情况下仍然具有较好的分类结果。
-
公开(公告)号:CN113946734A
公开(公告)日:2022-01-18
申请号:CN202110978180.0
申请日:2021-08-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/955 , G06F9/54
Abstract: 本发明公开了基于爬虫的数据采集系统,包括:URL管理器,用于获取URL链接;HTML下载器,用于根据所述URL链接下载HTML网页;HTML解析器,用于解析所述HTML网页的源代码,获得网页数据;数据存储器,用于存储所述网页数据。本发明使用方便,用户体验好。
-
公开(公告)号:CN113688310A
公开(公告)日:2021-11-23
申请号:CN202110839324.4
申请日:2021-07-23
Applicant: 北京中科闻歌科技股份有限公司 , 国家计算机网络与信息安全管理中心 , 国科智安(北京)科技有限公司
IPC: G06F16/9535 , G06Q50/00
Abstract: 本公开涉及一种内容推荐方法、装置、设备及存储介质。该方法包括:获取多媒体内容,确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度,基于推荐度影响参数,确定多媒体内容的目标推荐度,在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至目标用户。根据本公开实施例,提高目标用户对所推荐的多媒体内容感兴趣的可能性,从而提高内容推荐的准确性。
-
公开(公告)号:CN110287314B
公开(公告)日:2021-08-06
申请号:CN201910418900.0
申请日:2019-05-20
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明涉及一种基于无监督聚类的长文本可信度评估方法,包括:以已知长文本获取训练数据,提取该训练数据的训练特征以构建训练特征向量集,对该训练特征向量集进行无监督聚类,得到多个训练类心;以待评估长文本获取评估数据,提取该评估数据的评估特征向量;获取该评估特征向量相对该训练类心的评估值,并以该评估值得到该待评估长文本的可信度。本发明通过无监督聚类对长文本进行可信度评估,在实施过程中不需要标注数据,节省了人力、物力与时间,避免了数据中标签稀疏带来的困扰;提取了长文本的文本特征,对于可信度评估任务更加适用,使用该模型得到的文本的可信度更具有可解释性,同时在平台之间可以迁移。
-
公开(公告)号:CN113190765A
公开(公告)日:2021-07-30
申请号:CN202110443387.8
申请日:2021-04-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明公开了基于社交网络重构的意见领袖识别方法和装置。所述方法包括:获取多个用户的行为数据;根据多个用户的行为数据,构建社交网络;根据各用户的行为数据,确定各用户对于目标话题领域的关注度;基于预设的规则,根据各用户对于所述目标话题领域的关注度,重构所述社交网络;基于重构的社交网络,选择所述目标话题领域的意见领袖。基于该方法及装置,可以实现对于目标话题领域的意见领袖的准确识别。
-
公开(公告)号:CN109829089B
公开(公告)日:2021-03-05
申请号:CN201811516557.5
申请日:2018-12-12
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/906 , G06F16/958 , G06Q50/00
Abstract: 本发明涉及一种基于关联图谱的社交网络用户异常检测方法和系统,针对现有事件可视化展示技术的不足以及事件、用户、事件主题等多种实体关联性较弱不易于进行用户异常检测,提出一种基于微博平台的事件可视化方法以及事件、用户、事件主题等多种实体构建异构关联网络图谱进行用户异常检测;在不缺失事件信息的同时,让使用者更加全面、深入地了解整个事件的发展演变过程,并根据已有的异构关联网络图谱更加直观的进行用户异常检测。
-
-
-
-
-
-
-
-
-