-
公开(公告)号:CN110019812B
公开(公告)日:2021-08-20
申请号:CN201810164771.2
申请日:2018-02-27
Applicant: 中国科学院计算技术研究所
IPC: G06F40/289 , G06F40/30 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种用户自生产内容检测方法和系统,包括:获取社交媒体中用户自生产内容的文本内容、图像内容和社交属性,并从文本内容中抽取词向量特征,从社交属性中抽取社交属性特征以及从图像内容中抽取图像特征;通过递归神经网络融合词向量特征和社交属性特征,得到文本、社交融合特征;根据递归神经网络得到注意力向量,并通过注意力机制将图像特征处理为注意力融合特征,将注意力融合特征与文本、社交融合特征相融合,生成多模态融合特征;利用多模态融合特征训练分类器,以检测社交媒体中指定的用户自生产内容。本发明通过深度神经网络,融合内容检测涉及的多种模态内容,能够全面地进行用户自生产内容检测,得到更加准确的检测结果。
-
公开(公告)号:CN112632998A
公开(公告)日:2021-04-09
申请号:CN202011498810.6
申请日:2020-12-17
Applicant: 中国科学院计算技术研究所数字经济产业研究院 , 杭州中科睿鉴科技有限公司
IPC: G06F40/295 , G06F40/242 , G06F16/35 , G06F16/953
Abstract: 本发明涉及一种基于微博平台的事件关键人物提取方法。本发明的目的是提供一种基于微博平台的事件关键人物提取方法。本发明的技术方案是:一种基于微博平台的事件关键人物提取方法,其特征在于:所述事件关键人物包括事件中的关键人名,以及事件传播过程中的关键微博用户和信息源头用户,所述关键微博用户包括重要传播用户、事件发展节点用户、公众指向用户。本发明适用于信息抽取技术领域。
-
公开(公告)号:CN112597405A
公开(公告)日:2021-04-02
申请号:CN202011494253.0
申请日:2020-12-17
Applicant: 中国科学院计算技术研究所数字经济产业研究院 , 杭州中科睿鉴科技有限公司
IPC: G06F16/955 , G06F16/332 , G06F16/36
Abstract: 本发明涉及一种基于微博平台的事件外部信息源提取方法。本发明的目的是提供一种基于微博平台的事件外部信息源提取方法。本发明的技术方案是:S01、获取事件相关微博中的外部信息源URL,并统计不同外部信息源URL的出现频率;S02、将外部信息源URL转换为长链接形式;S03、将长链接形式的外部信息源URL与垃圾URL词典逐一过滤,保留非垃圾的外部信息源URL;S04、将步骤S03保留的外部信息源URL与权威URL词典逐一比对;S05、对步骤S03保留的外部信息源URL逐一模拟点击访问,过滤无效地址;S06、对步骤S05保留的外部信息源URL依据步骤S04确定的权值进行排名,选取权值高的前N个外部信息源URL作为关键外部信息源。本发明适用于信息抽取技术领域。
-
公开(公告)号:CN107886441B
公开(公告)日:2021-01-08
申请号:CN201710970005.0
申请日:2017-10-18
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种社交网络脆弱性评估的方法,包括:采集社交网络中某用户的相关信息,计算得到该用户的档案信息量和博文信息量;以该档案信息量和该博文信息量,得到该用户的个人信息量;以该用户在该社交网络中的朋友数量,及该用户所发布博文信息在该社交网络中的转发次数,得到该用户的信息传播量;以该用户的个人信息量和信息传播量,得到该用户的个人脆弱性评估值;以该个人脆弱性评估值对该用户的个人脆弱性进行评估;以该用户的个人脆弱性评估值,及该用户在该社交网络中的朋友的个人脆弱性评估值,得到该用户的社交网络脆弱性评估值;以该绝对脆弱性评估值对该用户的该社交网络脆弱性进行评估。
-
公开(公告)号:CN111797326A
公开(公告)日:2020-10-20
申请号:CN202010459132.6
申请日:2020-05-27
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9536 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种融合多尺度视觉信息的虚假新闻检测方法,包括:频域特征获取步骤,以卷积神经网络构建频域子网络模型,通过该频域子网络模型获得输入图像的频域特征表示;语义特征获取步骤,以卷积神经网络构建像素域子网络模型,通过该像素域子网络模型获得该输入图像的语义特征表示;图像检测步骤,将该频域特征表示与该语义特征表示进行融合,得到该输入图像的图像表示,并根据该图像表示获得该输入图像为虚假新闻图片的预测概率。本发明还提出一种融合多尺度视觉信息的虚假新闻检测系统,以及一种计算机可读存储介质和包括该计算机可读存储介质的数据处理装置。
-
公开(公告)号:CN111639359A
公开(公告)日:2020-09-08
申请号:CN202010323133.8
申请日:2020-04-22
Applicant: 中国科学院计算技术研究所
IPC: G06F21/62 , G06F16/9536 , G06N3/04 , G06N3/06 , G06N3/08
Abstract: 一种用于社交网络图片隐私风险检测与预警的方法,包括:步骤一:利用目标检测框架提取图片中关键元素并获得关键元素的信息;步骤二:收集图片隐私与否的数据集,对数据集中的每张图片进行步骤一的操作,然后在整个数据集上进行统计,得出在各类关键元素与隐私、公开图片的关联度,并依此来构建知识图谱;步骤三:利用神经网络提取图片整体、图片关键元素的特征,并利用步骤二中的知识图谱来构建图神经网络,用于融合图片整体、图片关键元素的特征,并得到图片的最终表达;以及步骤四:基于步骤三中图片的最终表达,利用神经网络预测图片的隐私风险。
-
公开(公告)号:CN106372083B
公开(公告)日:2019-10-18
申请号:CN201510435105.4
申请日:2015-07-22
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种有争议性新闻线索自动发现的方法及系统,该方法包括:步骤1,利用预设的初始文本对一文本集进行检索,获得多个检索文本;步骤2,对该多个检索文本进行聚类,对每一类的检索文本分别执行摘要提取算法,以获得该类的线索文本;步骤3,利用每类的该线索文本进行检索,获得每类的多个扩充文本;步骤4,利用每类的该多个扩充文本进行特征提取,基于一预设的打分模型对提取得到的每类的特征进行打分,分数高于一阈值的类所对应的线索文本为有争议的新闻线索。本发明可从大量文本中自动发现有争议新闻线索,实现了海量信息的深层信息挖掘,且可不断完善信息挖掘的准确度、有效性。
-
公开(公告)号:CN110188284A
公开(公告)日:2019-08-30
申请号:CN201910341053.2
申请日:2019-04-25
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9536 , G06F16/35 , G06Q50/00
Abstract: 本发明提出一种基于检索辅助的谣言检测方法及系统,包括:获取待谣言检测的对象信息,并使用谣言检测算法对该对象信息进行判定,得到该对象信息的初步谣言检测结果;集合已标记谣言标签的谣言信息作为谣言库,抽取得到该对象信息的关键词,以该关键词检索该谣言库,得到该谣言库中与该对象信息相似的多条相似谣言,计算每一条该相似谣言与该对象信息之间的相似度,以为每一条该相似谣言赋予权重,并根据每一条该相似谣言的谣言标签和权重,加权求和得到该多条相似谣言的辅助谣言检测结果;根据该初步谣言检测结果和该辅助谣言检测结果,综合判定该对象信息的谣言标签。
-
公开(公告)号:CN106372083A
公开(公告)日:2017-02-01
申请号:CN201510435105.4
申请日:2015-07-22
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明公开了一种有争议性新闻线索自动发现的方法及系统,该方法包括:步骤1,利用预设的初始文本对一文本集进行检索,获得多个检索文本;步骤2,对该多个检索文本进行聚类,对每一类的检索文本分别执行摘要提取算法,以获得该类的线索文本;步骤3,利用每类的该线索文本进行检索,获得每类的多个扩充文本;步骤4,利用每类的该多个扩充文本进行特征提取,基于一预设的打分模型对提取得到的每类的特征进行打分,分数高于一阈值的类所对应的线索文本为有争议的新闻线索。本发明可从大量文本中自动发现有争议新闻线索,实现了海量信息的深层信息挖掘,且可不断完善信息挖掘的准确度、有效性。
-
公开(公告)号:CN118377928A
公开(公告)日:2024-07-23
申请号:CN202410501754.9
申请日:2024-04-25
Applicant: 中国科学院计算技术研究所
IPC: G06F16/583 , G06F16/54 , G06N5/04
Abstract: 本发明提出一种基于大型语言模型的文生图模型动态评估方法,包括:LLM根据所选的主题生成测试输入文本,待评估的文生图模型根据测试输入文本生成测试图片,记录测试图片生成的准确率,并判断准确率是否低于阈值,若是则执行文本调整步骤;调整测试输入文本,得到多个调整输入文本,文生图模型根据测试输入文本生成调整图片,将准确率低于阈值的调整图片对应的调整输入文本作为失败文本;LLM根据当前主题下所有测试输入文本和调整输入文本的图片生成的准确率,分析文生图模型的对错原因,LLM分析对错原因和当前主题,生成新的主题,再次执行文本生成步骤,直到达到用户需求,保存当前所有失败文本作为文生图模型的评估结果。
-
-
-
-
-
-
-
-
-