-
公开(公告)号:CN111859979A
公开(公告)日:2020-10-30
申请号:CN202010549940.1
申请日:2020-06-16
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/953 , G06N3/04
Abstract: 本申请涉及一种讽刺文本协同识别方法、装置、设备及计算机可读介质。该方法包括:获取待处理文本,待处理文本来自于社交媒体网络平台;提取待处理文本的语义特征信息和主题特征信息,语义特征信息用于表征待处理文本与讽刺类型的关联关系,主题特征信息用于表征待处理文本体现的讽刺主题;根据第一神经网络模型对语义特征信息和主题特征信息的识别结果确定待处理文本的文本类型,并确定待处理文本的主题标签。本申请利用表征语义情感的特征和表征讽刺主题的特征对待处理文本进行协同识别,既确定是否带有讽刺含义,在具备讽刺含义的情况下还同时识别出体现讽刺的主题,实现有主题区分度的文本语义表示,有效提高了讽刺识别的准确率和解释性。
-
公开(公告)号:CN111859980B
公开(公告)日:2024-04-09
申请号:CN202010549951.X
申请日:2020-06-16
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/9536 , G06N3/0442 , G06N3/0464 , G06N3/084
Abstract: 本申请涉及一种讽刺类型的文本识别方法、装置、设备及计算机可读介质。该方法包括:获取待处理文本,待处理文本来自于社交媒体网络平台;采用多种方式提取待处理文本的目标特征信息,目标特征信息为从特征集合中选择出来的多个特征信息的加权和表示;根据第一神经网络模型对目标特征信息的识别结果确定待处理文本的文本类型,第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,标记信息用于标记训练数据是否为目标类型。本申请从多个维度捕获词间关联特征,并从讽刺文本的情感倾向转换出发,挖掘词语间的冲突性,进而充分体现句子中地所蕴含的讽刺含义,最终准确、合理地识别讽刺文本。
-
公开(公告)号:CN109800431A
公开(公告)日:2019-05-24
申请号:CN201910062802.8
申请日:2019-01-23
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于计算机科学技术领域,尤其是涉及一种事件信息关键词提取方法、监控方法、及其系统和装置,旨在为了解决解决无监督方法提取关键词效果不稳定的问题。本发明提取方法对于获取的待监控的事件信息,基于多种关键词提取技术提取并优选一组相关性很强的关键词作为第一关键词组,而后基于关键词在时域的发展演化选出最新的热点词汇作为第二关键词组,再后对同一时间段内的同一事件的不同报道进行聚类,提取各聚类的关键词合并后作为第三关键字组,最后合并三个关键词组并选定最终的关键词组合。本发明提高了系统的稳定性,同时兼顾了时域及同一事件不同侧面的发展方向。
-
公开(公告)号:CN111859980A
公开(公告)日:2020-10-30
申请号:CN202010549951.X
申请日:2020-06-16
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/9536 , G06N3/04 , G06N3/08
Abstract: 本申请涉及一种讽刺类型的文本识别方法、装置、设备及计算机可读介质。该方法包括:获取待处理文本,待处理文本来自于社交媒体网络平台;采用多种方式提取待处理文本的目标特征信息,目标特征信息为从特征集合中选择出来的多个特征信息的加权和表示;根据第一神经网络模型对目标特征信息的识别结果确定待处理文本的文本类型,第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,标记信息用于标记训练数据是否为目标类型。本申请从多个维度捕获词间关联特征,并从讽刺文本的情感倾向转换出发,挖掘词语间的冲突性,进而充分体现句子中地所蕴含的讽刺含义,最终准确、合理地识别讽刺文本。
-
公开(公告)号:CN109800431B
公开(公告)日:2020-07-28
申请号:CN201910062802.8
申请日:2019-01-23
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06F16/35
Abstract: 本发明属于计算机科学技术领域,尤其是涉及一种事件信息关键词提取、监控方法及系统及存储和处理装置,旨在为了解决解决无监督方法提取关键词效果不稳定的问题。本发明提取方法对于获取的待监控的事件信息,基于多种关键词提取技术提取并优选一组相关性很强的关键词作为第一关键词组,而后基于关键词在时域的发展演化选出最新的热点词汇作为第二关键词组,再后对同一时间段内的同一事件的不同报道进行聚类,提取各聚类的关键词合并后作为第三关键字组,最后合并三个关键词组并选定最终的关键词组合。本发明提高了系统的稳定性,同时兼顾了时域及同一事件不同侧面的发展方向。
-
公开(公告)号:CN118657148A
公开(公告)日:2024-09-17
申请号:CN202410681340.9
申请日:2024-05-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/205 , G06F40/126 , G06F16/33
Abstract: 本发明提供一种实体关系抽取方法、装置、电子设备以及存储介质,涉及人工智能技术领域。实体关系抽取方法包括:利用注意力模型,处理待处理文本以及目标实体关系词,得到实体关系判别信息;利用实体关系判别信息,得到目标第一命名实体与候选第二命名实体在待处理文本中的第一关联度、目标第一命名实体与目标实体关系词在待处理文本中的第二关联度,以及候选第二命名实体与目标实体关系词在待处理文本中的第三关联度;响应于第一关联度、第二关联度以及第三关联度均大于各自对应的预设阈值,从待处理文本中抽取出目标第一命名实体和候选第二命名实体之间的待抽取的实体关系。本发明可以准确、高效地执行实体关系抽取任务。
-
公开(公告)号:CN118643380A
公开(公告)日:2024-09-13
申请号:CN202410654369.8
申请日:2024-05-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/241 , G06F18/214 , G06F18/22 , G06F16/35 , G06F40/30 , G06N3/045 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本公开涉及一种水军识别模型生成方法、水军账号识别方法、装置、设备;方法包括:构建水军账号样本集;所述水军账号样本集包括:多个普通账号在预设时间内的多条动态发文信息以及每条动态发文信息对应的静态账号信息,多个水军账号在预设时间内的多条动态发文信息以及每条动态发文信息对应的静态账号信息;对所述水军账号样本集中的数据进行预处理,得到训练数据集;将所述训练数据集输入预设水军识别模型中进行训练,得到目标水军识别模型。本方法能够高效准确地识别水军账号。
-
公开(公告)号:CN114861029B
公开(公告)日:2024-09-13
申请号:CN202210411631.7
申请日:2022-04-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/953 , G06Q10/0639 , G06Q50/00
Abstract: 本发明实施例公开了舆情塑造过程分析方法、装置、电子设备以及存储介质。该方法包括:获取目标舆情事件的舆情数据以及目标舆情事件的舆情数据的发布方;根据舆情数据,确定舆情主题;根据舆情数据随时间的变化情况,将目标舆情事件划分为多个发展阶段;根据目标舆情事件在每个发展阶段的舆情数据,确定在相应发展阶段的核心议题;从在每个发展阶段的舆情数据的发布方中,识别在相应发展阶段的舆情塑造主体;根据在每个发展阶段的核心议题与舆情主题的匹配情况,对目标舆情事件在多个发展阶段的舆情塑造主体对于目标舆情事件的舆情塑造效果进行评估。基于该方法,可以实现对于舆情塑造过程的全面分析,并实现对于舆情塑造效果进行准确评估。
-
公开(公告)号:CN118626223A
公开(公告)日:2024-09-10
申请号:CN202410705471.6
申请日:2024-06-03
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于自动化驱动工具的社交网络数据采集方法,包括:获取输入的调度任务,将调度任务转化为结构化数据,并持久化到任务存储器;基于预设的优先级策略自动调整调度任务的执行顺序和执行频率;请求获取调度任务,根据与分配的调度任务匹配的预先配置的模板,采用自动化驱动工具于社交平台上自动采集分配的调度任务所需的数据;收集分配的调度任务的状态变化,待分配的调度任务完成后将采集到的数据上报,并修改分配的调度任务的下次执行时间。本发明可通过自动化驱动技术采集获取社交网络平台数据,可完成系统内持续任务的分类定级,根据各任务执行主体的状态动态分配任务以及资源回收。
-
公开(公告)号:CN118608308A
公开(公告)日:2024-09-06
申请号:CN202410676682.1
申请日:2024-05-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q50/00 , G06F18/213 , G06F18/214 , G06F18/2415 , G06N3/042 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种社交账号社区发现方法、装置、设备、存储介质及产品,包括:获取待处理社交账号的账号信息;对待处理社交账号的账号信息进行特征提取,获得待处理社交账号对应的特征数据;将待处理社交账号对应的特征数据输入至社区发现模型,获得社区发现模型输出的待处理社交账号的所属社区;其中,社区发现模型为预先训练得到的关系图卷积神经网络和分类器的组合网络。本发明的方案,能够准确地确定社交账号所属的社区,提高了社交账号管理的效率和准确性。
-
-
-
-
-
-
-
-
-