-
公开(公告)号:CN111859980A
公开(公告)日:2020-10-30
申请号:CN202010549951.X
申请日:2020-06-16
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/9536 , G06N3/04 , G06N3/08
Abstract: 本申请涉及一种讽刺类型的文本识别方法、装置、设备及计算机可读介质。该方法包括:获取待处理文本,待处理文本来自于社交媒体网络平台;采用多种方式提取待处理文本的目标特征信息,目标特征信息为从特征集合中选择出来的多个特征信息的加权和表示;根据第一神经网络模型对目标特征信息的识别结果确定待处理文本的文本类型,第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,标记信息用于标记训练数据是否为目标类型。本申请从多个维度捕获词间关联特征,并从讽刺文本的情感倾向转换出发,挖掘词语间的冲突性,进而充分体现句子中地所蕴含的讽刺含义,最终准确、合理地识别讽刺文本。
-
公开(公告)号:CN111859980B
公开(公告)日:2024-04-09
申请号:CN202010549951.X
申请日:2020-06-16
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/9536 , G06N3/0442 , G06N3/0464 , G06N3/084
Abstract: 本申请涉及一种讽刺类型的文本识别方法、装置、设备及计算机可读介质。该方法包括:获取待处理文本,待处理文本来自于社交媒体网络平台;采用多种方式提取待处理文本的目标特征信息,目标特征信息为从特征集合中选择出来的多个特征信息的加权和表示;根据第一神经网络模型对目标特征信息的识别结果确定待处理文本的文本类型,第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,标记信息用于标记训练数据是否为目标类型。本申请从多个维度捕获词间关联特征,并从讽刺文本的情感倾向转换出发,挖掘词语间的冲突性,进而充分体现句子中地所蕴含的讽刺含义,最终准确、合理地识别讽刺文本。
-
公开(公告)号:CN114330321A
公开(公告)日:2022-04-12
申请号:CN202111666897.8
申请日:2021-12-31
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/279 , G06K9/62 , G06N3/04 , G06N3/08 , G06N5/02
Abstract: 本发明公开了一种用户先验知识增强的文本风格迁移方法、装置及电子设备,所述方法包括:获取用户先验知识数据,并基于所述用户先验知识数据构建预设神经网络模型;获取用户输入数据,并将所述用户输入数据映射至所述预设神经网络模型中,生成与所述用户输入数据的表达方式不同的目标文本内容表示;获取用户关注领域表示,并结合所述目标文本内容表示和用户关注领域表示,生成目标文本内容。本发明不仅可以实现文本风格的转换,还提升了转换文本内容与用户要求的相关性。
-
公开(公告)号:CN114330321B
公开(公告)日:2025-01-03
申请号:CN202111666897.8
申请日:2021-12-31
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: G06F40/279 , G06N5/02 , G06N3/042 , G06N3/08 , G06N3/0442 , G06F18/22
Abstract: 本发明公开了一种用户先验知识增强的文本风格迁移方法、装置及电子设备,所述方法包括:获取用户先验知识数据,并基于所述用户先验知识数据构建预设神经网络模型;获取用户输入数据,并将所述用户输入数据映射至所述预设神经网络模型中,生成与所述用户输入数据的表达方式不同的目标文本内容表示;获取用户关注领域表示,并结合所述目标文本内容表示和用户关注领域表示,生成目标文本内容。本发明不仅可以实现文本风格的转换,还提升了转换文本内容与用户要求的相关性。
-
公开(公告)号:CN114912434A
公开(公告)日:2022-08-16
申请号:CN202210495306.3
申请日:2022-05-07
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: G06F40/211 , G06F40/253 , G06F40/268 , G06N3/04 , G06N3/08 , G06N5/02 , G06K9/62
Abstract: 本发明公开了一种风格文本的生成方法及装置、存储介质、电子设备,其中,该方法包括:根据特征词和观点词构建句法模板;根据所述句法模板提取文本特征标签组合;确定目标风格文本的目标写作风格,将所述目标写作风格的风格参数作为生成条件嵌入Bert生成模型中,生成目标Bert语言表征模型;以所述文本特征标签组合为所述目标Bert语言表征模型的输入,生成与所述目标写作风格对应的条件文本。通过本发明,解决了相关技术采用网络模型生成的文本风格单一的技术问题,本方案可用于在信息传播过程中生成更多优质内容和个性化内容,提高文本的丰富度,提升传播影响力。
-
公开(公告)号:CN111859979A
公开(公告)日:2020-10-30
申请号:CN202010549940.1
申请日:2020-06-16
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/953 , G06N3/04
Abstract: 本申请涉及一种讽刺文本协同识别方法、装置、设备及计算机可读介质。该方法包括:获取待处理文本,待处理文本来自于社交媒体网络平台;提取待处理文本的语义特征信息和主题特征信息,语义特征信息用于表征待处理文本与讽刺类型的关联关系,主题特征信息用于表征待处理文本体现的讽刺主题;根据第一神经网络模型对语义特征信息和主题特征信息的识别结果确定待处理文本的文本类型,并确定待处理文本的主题标签。本申请利用表征语义情感的特征和表征讽刺主题的特征对待处理文本进行协同识别,既确定是否带有讽刺含义,在具备讽刺含义的情况下还同时识别出体现讽刺的主题,实现有主题区分度的文本语义表示,有效提高了讽刺识别的准确率和解释性。
-
公开(公告)号:CN117574892A
公开(公告)日:2024-02-20
申请号:CN202311492828.9
申请日:2023-11-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06F40/30 , G06F40/216 , G06F16/35 , G06N3/0455 , G06N3/09 , G06N3/044
Abstract: 本公开涉及一种文本立场分析方法、装置、设备及存储介质,该方法包括:获取待分析文本和所述待分析文本对应的主题短语;对所述待分析文本与所述主题短语进行特征提取,得到文本向量和主题向量;将所述文本向量和所述主题向量输入预训练的分层胶囊模型,得到所述分层胶囊模型输出的根据所述主题短语对所述待分析文本进行立场分析的分析结果,所述分层胶囊模型包括词胶囊层、句子胶囊层和类别胶囊层,所述词胶囊层、句子胶囊层和类别胶囊层分别用于提取所述待分析文本的词级特征、句子级特征和类别特征。本公开通过设置分层胶囊模型,能够提取文本的不同层级的特征信息,从而挖掘文本的深层信息,提升对文本进行立场判断的准确度。
-
公开(公告)号:CN113300939A
公开(公告)日:2021-08-24
申请号:CN202110452378.5
申请日:2021-04-26
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
IPC: H04L12/58
Abstract: 本发明公开了一种即时通讯软件交互机器人的开发方法,包括以下步骤:步骤一、构建机器人架构,机器人架构包括:服务器模块,其与客户端连接;模型模块,其用于建立机器人模型,所述模型模块与所述服务器模块连接以使模型模块与客户端建立连接;通用模块,其与所述模型模块连接,所述通用模块用于监测机器人的运行状态;步骤二、基于机器人架构,生成交互机器人。在构建机器人架构之间,先选择开发语言。开发语言为python语言。本发明通过设置服务器模块与客户端连接、模型模块与服务器模块连接实现机器人模型与客户端的连接,开发方法较为简单。
-
公开(公告)号:CN106227766A
公开(公告)日:2016-12-14
申请号:CN201610559551.0
申请日:2016-07-15
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F16/951
Abstract: 本发明公开了一种大数据驱动的选举舆情预测方法,属于数据挖掘领域。具体为:首先,根据选举国家或地区的互联网网路使用报告和地区网站排名,挑选出大数据信息源;再对每一类信息源进行分析,构建民意预测指标;然后融合提取出的多源预测指标,形成当前互联网民众支持率;进而收集民调报告,融合报告中各年龄段人群对候选人的支持率,形成线下民调支持率值;考虑选举国家或地区人口结构构成和网民年龄分布,融合候选人互联网支持率值与线下民调支持率值,运用移动平均方法,预测下一时间节点候选人支持率值,预测结果以日频度更新。本发明具有数据源广泛、预测周期短、实时性强等特点,在舆情监控和观点分析等领域有重要的应用价值。
-
公开(公告)号:CN119719797A
公开(公告)日:2025-03-28
申请号:CN202411760482.0
申请日:2024-12-03
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/22 , G06Q50/00 , G06F18/213 , G06V30/148
Abstract: 本发明公开了社交网络相似账号识别方法,包括:S1:获取至少两个待识别账号的言论数据;S2:提取所述言论数据的语义特征,计算内容相似度;S3:提取所述言论数据的位置信息,计算位置相似度;S4:提取所述言论数据的发布时间信息,计算时间相似度;S5:计算至少两个所述待识别账号的基本信息相似度;S6:根据所述内容相似度、所述位置相似度、所述时间相似度和所述基本信息相似度判断至少两个所述待识别账号是否为相似账号。本发明还提供了识别装置。本发明能够较准确地识别社交网络上的相似账号。
-
-
-
-
-
-
-
-
-