-
公开(公告)号:CN118657148A
公开(公告)日:2024-09-17
申请号:CN202410681340.9
申请日:2024-05-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/205 , G06F40/126 , G06F16/33
Abstract: 本发明提供一种实体关系抽取方法、装置、电子设备以及存储介质,涉及人工智能技术领域。实体关系抽取方法包括:利用注意力模型,处理待处理文本以及目标实体关系词,得到实体关系判别信息;利用实体关系判别信息,得到目标第一命名实体与候选第二命名实体在待处理文本中的第一关联度、目标第一命名实体与目标实体关系词在待处理文本中的第二关联度,以及候选第二命名实体与目标实体关系词在待处理文本中的第三关联度;响应于第一关联度、第二关联度以及第三关联度均大于各自对应的预设阈值,从待处理文本中抽取出目标第一命名实体和候选第二命名实体之间的待抽取的实体关系。本发明可以准确、高效地执行实体关系抽取任务。
-
公开(公告)号:CN118626223A
公开(公告)日:2024-09-10
申请号:CN202410705471.6
申请日:2024-06-03
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于自动化驱动工具的社交网络数据采集方法,包括:获取输入的调度任务,将调度任务转化为结构化数据,并持久化到任务存储器;基于预设的优先级策略自动调整调度任务的执行顺序和执行频率;请求获取调度任务,根据与分配的调度任务匹配的预先配置的模板,采用自动化驱动工具于社交平台上自动采集分配的调度任务所需的数据;收集分配的调度任务的状态变化,待分配的调度任务完成后将采集到的数据上报,并修改分配的调度任务的下次执行时间。本发明可通过自动化驱动技术采集获取社交网络平台数据,可完成系统内持续任务的分类定级,根据各任务执行主体的状态动态分配任务以及资源回收。
-
公开(公告)号:CN116467454A
公开(公告)日:2023-07-21
申请号:CN202310504562.9
申请日:2023-05-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/9537 , G06F40/194
Abstract: 本发明公开了一种综合多模型的网络热点话题传播模式分类方法,其包括以下步骤:步骤一、收集平台t时间段内的目标热点话题的帖子数据;步骤二、基于帖子数据计算帖子基本维度信息;步骤三、绘制关于时间‑帖子数量的话题热度变化曲线;步骤四、提取目标热点话题的竞争性话题,并计算竞争性话题数量;步骤五、基于帖子数据,量化目标热点话题的传播角色的信息;步骤六、通过漏斗模型和网络模型,进行目标热点话题的传播模式识别分类。本发明构建了一种普适的网络热点话题传播模式识别分类方法,能够有效地判断话题的传播类型,即使在话题部分维度数据缺失的情况下仍然具有较好的分类结果。
-
公开(公告)号:CN113946734A
公开(公告)日:2022-01-18
申请号:CN202110978180.0
申请日:2021-08-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/955 , G06F9/54
Abstract: 本发明公开了基于爬虫的数据采集系统,包括:URL管理器,用于获取URL链接;HTML下载器,用于根据所述URL链接下载HTML网页;HTML解析器,用于解析所述HTML网页的源代码,获得网页数据;数据存储器,用于存储所述网页数据。本发明使用方便,用户体验好。
-
公开(公告)号:CN113688310A
公开(公告)日:2021-11-23
申请号:CN202110839324.4
申请日:2021-07-23
Applicant: 北京中科闻歌科技股份有限公司 , 国家计算机网络与信息安全管理中心 , 国科智安(北京)科技有限公司
IPC: G06F16/9535 , G06Q50/00
Abstract: 本公开涉及一种内容推荐方法、装置、设备及存储介质。该方法包括:获取多媒体内容,确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度,基于推荐度影响参数,确定多媒体内容的目标推荐度,在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至目标用户。根据本公开实施例,提高目标用户对所推荐的多媒体内容感兴趣的可能性,从而提高内容推荐的准确性。
-
公开(公告)号:CN110287314B
公开(公告)日:2021-08-06
申请号:CN201910418900.0
申请日:2019-05-20
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明涉及一种基于无监督聚类的长文本可信度评估方法,包括:以已知长文本获取训练数据,提取该训练数据的训练特征以构建训练特征向量集,对该训练特征向量集进行无监督聚类,得到多个训练类心;以待评估长文本获取评估数据,提取该评估数据的评估特征向量;获取该评估特征向量相对该训练类心的评估值,并以该评估值得到该待评估长文本的可信度。本发明通过无监督聚类对长文本进行可信度评估,在实施过程中不需要标注数据,节省了人力、物力与时间,避免了数据中标签稀疏带来的困扰;提取了长文本的文本特征,对于可信度评估任务更加适用,使用该模型得到的文本的可信度更具有可解释性,同时在平台之间可以迁移。
-
公开(公告)号:CN113190765A
公开(公告)日:2021-07-30
申请号:CN202110443387.8
申请日:2021-04-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明公开了基于社交网络重构的意见领袖识别方法和装置。所述方法包括:获取多个用户的行为数据;根据多个用户的行为数据,构建社交网络;根据各用户的行为数据,确定各用户对于目标话题领域的关注度;基于预设的规则,根据各用户对于所述目标话题领域的关注度,重构所述社交网络;基于重构的社交网络,选择所述目标话题领域的意见领袖。基于该方法及装置,可以实现对于目标话题领域的意见领袖的准确识别。
-
公开(公告)号:CN109829089B
公开(公告)日:2021-03-05
申请号:CN201811516557.5
申请日:2018-12-12
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/906 , G06F16/958 , G06Q50/00
Abstract: 本发明涉及一种基于关联图谱的社交网络用户异常检测方法和系统,针对现有事件可视化展示技术的不足以及事件、用户、事件主题等多种实体关联性较弱不易于进行用户异常检测,提出一种基于微博平台的事件可视化方法以及事件、用户、事件主题等多种实体构建异构关联网络图谱进行用户异常检测;在不缺失事件信息的同时,让使用者更加全面、深入地了解整个事件的发展演变过程,并根据已有的异构关联网络图谱更加直观的进行用户异常检测。
-
公开(公告)号:CN111859979A
公开(公告)日:2020-10-30
申请号:CN202010549940.1
申请日:2020-06-16
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/953 , G06N3/04
Abstract: 本申请涉及一种讽刺文本协同识别方法、装置、设备及计算机可读介质。该方法包括:获取待处理文本,待处理文本来自于社交媒体网络平台;提取待处理文本的语义特征信息和主题特征信息,语义特征信息用于表征待处理文本与讽刺类型的关联关系,主题特征信息用于表征待处理文本体现的讽刺主题;根据第一神经网络模型对语义特征信息和主题特征信息的识别结果确定待处理文本的文本类型,并确定待处理文本的主题标签。本申请利用表征语义情感的特征和表征讽刺主题的特征对待处理文本进行协同识别,既确定是否带有讽刺含义,在具备讽刺含义的情况下还同时识别出体现讽刺的主题,实现有主题区分度的文本语义表示,有效提高了讽刺识别的准确率和解释性。
-
公开(公告)号:CN111047448A
公开(公告)日:2020-04-21
申请号:CN201911392756.4
申请日:2019-12-30
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了多通道数据融合的分析方法,包括:根据恶意数字货币地址为种子,从暗网中爬取交易数据,所述交易数据包括交易地址及交易内容;将具有相同身份标识的交易地址的交易内容合并;结合区块链交易流分析和明网数据分析,对交易地址的身份标识进行信息补充。本发明还提供了多通道数据融合的分析装置。本发明通过对互联网和暗网信息进行关联分析,能有效弥补主被动分析方法的问题。
-
-
-
-
-
-
-
-
-