-
公开(公告)号:CN104504024B
公开(公告)日:2018-09-07
申请号:CN201410768704.3
申请日:2014-12-11
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种基于微博内容的关键词挖掘方法,对于所有微博文本经分词得到的所有词的集合中的每个词,基于该词在每个微博文本中出现的次数及该微博文本被转发的次数来计算该词的权重;并选取其权重大于预定阈值的词作为从该微博数据集中挖掘的关键词。该方法即考虑了词语在各个微博文本中出现的频率,又考虑了同一微博文本在微博数据集中转发情况对挖掘关键词的准确性的影响,因此提高了获取微博文本关键词的精确度。
-
公开(公告)号:CN107886441A
公开(公告)日:2018-04-06
申请号:CN201710970005.0
申请日:2017-10-18
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种社交网络脆弱性评估的方法,包括:采集社交网络中某用户的相关信息,计算得到该用户的档案信息量和博文信息量;以该档案信息量和该博文信息量,得到该用户的个人信息量;以该用户在该社交网络中的朋友数量,及该用户所发布博文信息在该社交网络中的转发次数,得到该用户的信息传播量;以该用户的个人信息量和信息传播量,得到该用户的个人脆弱性评估值;以该个人脆弱性评估值对该用户的个人脆弱性进行评估;以该用户的个人脆弱性评估值,及该用户在该社交网络中的朋友的个人脆弱性评估值,得到该用户的社交网络脆弱性评估值;以该绝对脆弱性评估值对该用户的该社交网络脆弱性进行评估。
-
公开(公告)号:CN104615627B
公开(公告)日:2018-03-30
申请号:CN201410490602.X
申请日:2014-09-23
Applicant: 中国科学院计算技术研究所 , 新华通讯社
IPC: G06F17/30
Abstract: 本发明涉及舆情事件提取技术,本发明公开了一种基于微博平台的事件舆情信息提取方法及系统,该方法包括:获取所述事件的关键词、起始时间、截止时间,并根据所述微博平台搜索服务的链接格式,构造待采样页面的页面链接;根据所述页面链接进行微博采样,生成样本微博,根据所述样本微博,计算所述事件的事件热度,并根据所述事件热度计算微博抓取周期;根据所述微博抓取周期,结合所述页面链接,获取与所述事件相关的微博页面。提取所述微博页面的微博信息,以完成提取所述事件的所述舆情信息。本发明获取事件舆情信息更全面而高效,能采集到实时的舆情信息。
-
公开(公告)号:CN106708796A
公开(公告)日:2017-05-24
申请号:CN201510416419.X
申请日:2015-07-15
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种基于文本的关键人名的提取方法及系统,该方法包括:步骤1,对目标文本执行一分词操作,提取出其中词性为人名的目标词语;步骤2,统计每个目标词语在该目标文本中的出现频率,根据该出现频率设置该目标词语的权重;步骤3,根据一歧义人名先验概率辞典所记载的该目标词语作为人名的出现概率,调整该目标词语的权重;步骤4,选取权重大的目标词语作为关键人名。通过本发明的上述方法,可实现与特定事件相关的人物提取,还可实现对文本中的关键人名提取,以及重要传播用户、事件发展节点用户、公众指向用户、信息源头用户的提取,且能够提高人物提取的准确性和有效性。
-
公开(公告)号:CN106445894A
公开(公告)日:2017-02-22
申请号:CN201510497127.3
申请日:2015-08-13
Applicant: 中国科学院计算技术研究所
IPC: G06F17/24
Abstract: 本发明公开了一种新媒体智能在线编辑方法、装置及网络信息发布平台,所述新媒体智能在线编辑方法包括:步骤1,采集网络信息发布平台上发布的普通用户制作的信息;步骤2,挖掘所述普通用户制作的信息中的各类新闻要素;步骤3,将所述各类信息要素导入素材库,所述素材库以类目列表的形式组织所述新闻要素,且所述素材库与富文本编辑器实现交互,通过所述富文本编辑器进行在线新闻编辑与发布。由此,能够自动从互联的网普通用户制作的信息内容采集信息素材,自动挖掘组织原始素材形成各类信息要素,将信息编辑与素材搜集结合在一起,通过在线的智能编辑器的良好的交互方式,实现信息稿件的高效编写与发布。
-
公开(公告)号:CN104636408A
公开(公告)日:2015-05-20
申请号:CN201410414956.6
申请日:2014-08-21
Applicant: 中国科学院计算技术研究所 , 新华通讯社
IPC: G06F17/30
CPC classification number: G06F17/3089 , G06F17/30705
Abstract: 本发明公开了一种基于用户生成内容的新闻认证预警方法及系统,其中该方法包括,通过对新闻线索进行语义扩展,获得参考数据,将该参考数据进行定向采集,获取该新闻线索相关的信息内容、传输模式、用户群体、用户群体的行为信息和属性信息等,对信息内容进行语义知识提取,将该语义知识进行进行聚类和相似度计算,识别与历史新闻线索数据库不匹配的新闻线索,并从语义知识对比、用户群体、传播模式和信息内容等方面对其进行可信度评估。最终形成UGC新闻真实性的分级度量和预警,为该新闻是否为真实信息提供决策支持。
-
公开(公告)号:CN101887459A
公开(公告)日:2010-11-17
申请号:CN201010221077.3
申请日:2010-06-28
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明一种网络视频话题检测的方法及系统,方法包括:步骤1,将视频的标签词表示为时间轴上的词频变化轨迹,根据该词频变化轨迹提取每个时间单元内的显著词;步骤2,将每个时间单元内的显著词表示为所述时间单元内上传的所有视频的倒排索引,并对所述显著词进行聚类,一个类为所述时间单元的一个事件;步骤3,计算各个事件之间相似度,建立事件之间的连接,形成事件发展轨迹图,事件发展轨迹图中的点为事件,按两个事件之间的相似度连接点生成边;步骤4,将事件发展轨迹图分割为多个连通子图;步骤5,按预设标准从各个连通子图中查找最优路径,每条最优路径对应一个话题的轨迹,进而完成话题的检测。本发明能够从网络中检测出视频话题。
-
公开(公告)号:CN119578588A
公开(公告)日:2025-03-07
申请号:CN202411653207.9
申请日:2024-11-19
Applicant: 中国科学院计算技术研究所
IPC: G06N20/00 , G06V10/764
Abstract: 本发明提出一种自监督对抗训练方法,包括:构建第一阶段初始模型,获取第一阶段训练样本,对该第一阶段初始模型进行自监督训练,获得干净模型;构建第二阶段初始模型,获取第二阶段训练样本,生成该第二阶段训练样本的增强样本,以该干净模型对该增强样本的输出特征为伪监督信号;生成该增强样本的对抗样本,以该伪监督信号、该增强样本和该对抗样本对该第二阶段初始模型进行自监督对抗训练,获得鲁棒模型;以该鲁棒模型进行图像分类任务。本发明还提出一种自监督对抗训练装置,以及一种计算机可读存储介质和一种电子设备。本发明的训练方法能与不同的自监督学习框架无缝结合,提升其对抗及干净样本分类准确率并减小与监督对抗学习的性能差距。
-
公开(公告)号:CN119169120A
公开(公告)日:2024-12-20
申请号:CN202410417957.X
申请日:2024-04-08
Applicant: 中国科学院计算技术研究所
IPC: G06T11/00 , G06T7/10 , G06N3/094 , G06N3/045 , G06N3/0475 , G06V10/764 , G06N3/084
Abstract: 本发明提出一种基于对抗攻击的图像反生成方法,包括:对目标图像进行分割,获取该目标图像的关键掩码;在该关键掩码上添加对抗性扰动,得到该目标图像的反生成保护图像。本发明的方法使用较少难以察觉的对抗噪声来反生成保护用户重要的概念,如人类图像中的面部区域,能有效地防止了恶意的个性化,与MIST等针对整个图像的反生成保护方法相比,它在安全性和噪声的视觉质量之间提供了更好的平衡。本发明还提出一种基于对抗攻击的图像反生成装置,以及一种计算机可读存储介质和一种电子设备。
-
公开(公告)号:CN117690005A
公开(公告)日:2024-03-12
申请号:CN202311576310.3
申请日:2023-11-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种面向生成式模型图像编辑的图像篡改检测方法,包括:对真实图像进行语义分割,获取该真实图像的至少一个对象;基于对该对象的编辑目标,使用生成式模型生成编辑图像;以该真实图像和该编辑图像为训练集对检测模型进行训练;通过该检测模型对目标图像进行图像篡改检测。本发明还提出一种面向生成式模型图像编辑的图像篡改检测系统,以及一种用于实现面向生成式模型图像编辑的图像篡改检测的数据处理装置。
-
-
-
-
-
-
-
-
-