-
公开(公告)号:CN113536760B
公开(公告)日:2023-09-26
申请号:CN202110761419.9
申请日:2021-07-06
Applicant: 中国科学院计算技术研究所
IPC: G06F40/194 , G06F40/30 , G06F16/35 , G06F18/23213 , G06F18/214 , G06N3/04 , G06N3/084
Abstract: 本发明提出一种引述句和辟谣模式句引导的“谣言‑辟谣文章”匹配方法及系统。通过引导模型行为,使其更加关注辟谣文章中带有“引述”和“辟谣模式”成分的句子,实现考虑到辟谣文章特点的“谣言‑辟谣文章”匹配程度评分。具体地,本发明通过使用文字相似度指标精调神经网络模型增强引述句的发现能力,通过引入模式向量增强辟谣模式句的发现能力,从而使模型关注到含有引述成分和辟谣模式的关键句子,过滤掉辟谣文章中大部分无关句子,最终实现高效准确的“谣言‑辟谣文章”匹配。
-
公开(公告)号:CN111639359B
公开(公告)日:2023-09-12
申请号:CN202010323133.8
申请日:2020-04-22
Applicant: 中国科学院计算技术研究所
IPC: G06F21/62 , G06F16/9536 , G06N3/0464 , G06N3/08 , G06N3/06
Abstract: 一种用于社交网络图片隐私风险检测与预警的方法,包括:步骤一:利用目标检测框架提取图片中关键元素并获得关键元素的信息;步骤二:收集图片隐私与否的数据集,对数据集中的每张图片进行步骤一的操作,然后在整个数据集上进行统计,得出在各类关键元素与隐私、公开图片的关联度,并依此来构建知识图谱;步骤三:利用神经网络提取图片整体、图片关键元素的特征,并利用步骤二中的知识图谱来构建图神经网络,用于融合图片整体、图片关键元素的特征,并得到图片的最终表达;以及步骤四:基于步骤三中图片的最终表达,利用神经网络预测图片的隐私风险。
-
公开(公告)号:CN111797326B
公开(公告)日:2023-05-12
申请号:CN202010459132.6
申请日:2020-05-27
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9536 , G06V10/82 , G06V10/80 , G06V10/764 , G06N3/0464 , G06N3/08
Abstract: 本发明提出一种融合多尺度视觉信息的虚假新闻检测方法,包括:频域特征获取步骤,以卷积神经网络构建频域子网络模型,通过该频域子网络模型获得输入图像的频域特征表示;语义特征获取步骤,以卷积神经网络构建像素域子网络模型,通过该像素域子网络模型获得该输入图像的语义特征表示;图像检测步骤,将该频域特征表示与该语义特征表示进行融合,得到该输入图像的图像表示,并根据该图像表示获得该输入图像为虚假新闻图片的预测概率。本发明还提出一种融合多尺度视觉信息的虚假新闻检测系统,以及一种计算机可读存储介质和包括该计算机可读存储介质的数据处理装置。
-
公开(公告)号:CN115775406A
公开(公告)日:2023-03-10
申请号:CN202211477245.4
申请日:2022-11-23
Applicant: 中国科学院计算技术研究所
IPC: G06V40/16 , G06V10/774 , G06V10/26 , G06V10/764 , G06F21/32 , G06F21/56 , G06T1/00 , G06N3/0464 , G06N3/08
Abstract: 本发明提出一种基于属性编辑的人脸对抗攻击样本生成方法和系统,针对输入的真实人脸图以及需要被识别成的目标图进行隐空间映射到低维的流形内表示,同时通过特征层融合的方法提升人脸身份信息的相似性。属性编辑步骤通过设计一组属性编辑参数,针对属性选择步骤得到的最佳编辑属性进行编辑强度的优化,同时引入了多种优化图像生成效果的控制,在达到最佳的模型攻击成功率的同时保持编辑后的图像效果以及肉眼识别的身份信息不变。以检测人脸识别模型的鲁棒性以及微调人脸识别模型,以提高其识别准确性。
-
公开(公告)号:CN111832406B
公开(公告)日:2022-12-06
申请号:CN202010508103.4
申请日:2020-06-05
Applicant: 中国科学院计算技术研究所
IPC: G06V20/40 , G06V10/26 , G06V10/774 , G06V10/764
Abstract: 本发明提出的基于平衡分组Softmax的长尾目标检测方法与系统,该方法在网络结构上,改变网络的最后一个全连接层,对拥有不同训练样本数量的类别进行分组,将背景类别单独分为一组,在每组中都加入其它类别;在训练过程中,按照组内普通类别训练样本数量采样一定数量的其它类别样本进行训练,并在每个组内分别用Softmax函数激活并计算交叉熵损失;在测试过程中,在每个组内分别用Softmax函数激活,去掉组内其它类别,仅保留正常类别得分,用背景组的“其它”类别得分为所有正常类别加权,组成最终得分,用于后处理。该发明提升了在大规模长尾目标数据集上的目标检测以及实例分割性能。
-
公开(公告)号:CN108681749B
公开(公告)日:2021-11-23
申请号:CN201810486787.5
申请日:2018-05-21
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种基于网络社交平台构建隐私信息甄别模型的方法。该方法包括以下步骤:根据网络社交平台上已发布的问题及相关答案之间的结构特征构建由多组分析数据构成的训练样本集,其中,每组分析数据包括问题信息、相关的答案列表信息以及对应的隐私性标签;以所述训练样本集中的问题信息、相关的答案列表信息为输入,以对应的隐私性标签为输出训练深度学习模型,以获得基于所述深度学习模型的隐私信息甄别模型。本发明的隐私信息甄别方法能够对用户在网络社交平台上发布的内容有效地甄别其是否属于隐私信息。
-
公开(公告)号:CN109977393B
公开(公告)日:2021-09-03
申请号:CN201711464946.3
申请日:2017-12-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于内容争议性的流行新闻预测方法,包括:争议性模式挖掘步骤,构建多任务学习的卷积神经网络模型,以对历史流行新闻进行模式的挖掘,得到该历史流行新闻的内容争议性模式的特征;流行新闻预测步骤,将新生新闻转化为词语字符的合集C,并将该合集C与该内容争议性模式进行匹配,得到该新生新闻的争议度得分P,以判断该新生新闻是否属于流行新闻;预测结果验证步骤,通过该新生新闻的实际流行性对该卷积神经网络模型进行验证,并使用验证结果对该卷积神经网络模型进行训练。本发明从争议性新闻本质的内容模式出发,能够实时准确地预测出潜在的流行新闻。
-
公开(公告)号:CN110019812B
公开(公告)日:2021-08-20
申请号:CN201810164771.2
申请日:2018-02-27
Applicant: 中国科学院计算技术研究所
IPC: G06F40/289 , G06F40/30 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种用户自生产内容检测方法和系统,包括:获取社交媒体中用户自生产内容的文本内容、图像内容和社交属性,并从文本内容中抽取词向量特征,从社交属性中抽取社交属性特征以及从图像内容中抽取图像特征;通过递归神经网络融合词向量特征和社交属性特征,得到文本、社交融合特征;根据递归神经网络得到注意力向量,并通过注意力机制将图像特征处理为注意力融合特征,将注意力融合特征与文本、社交融合特征相融合,生成多模态融合特征;利用多模态融合特征训练分类器,以检测社交媒体中指定的用户自生产内容。本发明通过深度神经网络,融合内容检测涉及的多种模态内容,能够全面地进行用户自生产内容检测,得到更加准确的检测结果。
-
公开(公告)号:CN112632998A
公开(公告)日:2021-04-09
申请号:CN202011498810.6
申请日:2020-12-17
Applicant: 中国科学院计算技术研究所数字经济产业研究院 , 杭州中科睿鉴科技有限公司
IPC: G06F40/295 , G06F40/242 , G06F16/35 , G06F16/953
Abstract: 本发明涉及一种基于微博平台的事件关键人物提取方法。本发明的目的是提供一种基于微博平台的事件关键人物提取方法。本发明的技术方案是:一种基于微博平台的事件关键人物提取方法,其特征在于:所述事件关键人物包括事件中的关键人名,以及事件传播过程中的关键微博用户和信息源头用户,所述关键微博用户包括重要传播用户、事件发展节点用户、公众指向用户。本发明适用于信息抽取技术领域。
-
公开(公告)号:CN112597405A
公开(公告)日:2021-04-02
申请号:CN202011494253.0
申请日:2020-12-17
Applicant: 中国科学院计算技术研究所数字经济产业研究院 , 杭州中科睿鉴科技有限公司
IPC: G06F16/955 , G06F16/332 , G06F16/36
Abstract: 本发明涉及一种基于微博平台的事件外部信息源提取方法。本发明的目的是提供一种基于微博平台的事件外部信息源提取方法。本发明的技术方案是:S01、获取事件相关微博中的外部信息源URL,并统计不同外部信息源URL的出现频率;S02、将外部信息源URL转换为长链接形式;S03、将长链接形式的外部信息源URL与垃圾URL词典逐一过滤,保留非垃圾的外部信息源URL;S04、将步骤S03保留的外部信息源URL与权威URL词典逐一比对;S05、对步骤S03保留的外部信息源URL逐一模拟点击访问,过滤无效地址;S06、对步骤S05保留的外部信息源URL依据步骤S04确定的权值进行排名,选取权值高的前N个外部信息源URL作为关键外部信息源。本发明适用于信息抽取技术领域。
-
-
-
-
-
-
-
-
-