-
公开(公告)号:CN106708796A
公开(公告)日:2017-05-24
申请号:CN201510416419.X
申请日:2015-07-15
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种基于文本的关键人名的提取方法及系统,该方法包括:步骤1,对目标文本执行一分词操作,提取出其中词性为人名的目标词语;步骤2,统计每个目标词语在该目标文本中的出现频率,根据该出现频率设置该目标词语的权重;步骤3,根据一歧义人名先验概率辞典所记载的该目标词语作为人名的出现概率,调整该目标词语的权重;步骤4,选取权重大的目标词语作为关键人名。通过本发明的上述方法,可实现与特定事件相关的人物提取,还可实现对文本中的关键人名提取,以及重要传播用户、事件发展节点用户、公众指向用户、信息源头用户的提取,且能够提高人物提取的准确性和有效性。
-
公开(公告)号:CN106445894A
公开(公告)日:2017-02-22
申请号:CN201510497127.3
申请日:2015-08-13
Applicant: 中国科学院计算技术研究所
IPC: G06F17/24
Abstract: 本发明公开了一种新媒体智能在线编辑方法、装置及网络信息发布平台,所述新媒体智能在线编辑方法包括:步骤1,采集网络信息发布平台上发布的普通用户制作的信息;步骤2,挖掘所述普通用户制作的信息中的各类新闻要素;步骤3,将所述各类信息要素导入素材库,所述素材库以类目列表的形式组织所述新闻要素,且所述素材库与富文本编辑器实现交互,通过所述富文本编辑器进行在线新闻编辑与发布。由此,能够自动从互联的网普通用户制作的信息内容采集信息素材,自动挖掘组织原始素材形成各类信息要素,将信息编辑与素材搜集结合在一起,通过在线的智能编辑器的良好的交互方式,实现信息稿件的高效编写与发布。
-
公开(公告)号:CN104636408A
公开(公告)日:2015-05-20
申请号:CN201410414956.6
申请日:2014-08-21
Applicant: 中国科学院计算技术研究所 , 新华通讯社
IPC: G06F17/30
CPC classification number: G06F17/3089 , G06F17/30705
Abstract: 本发明公开了一种基于用户生成内容的新闻认证预警方法及系统,其中该方法包括,通过对新闻线索进行语义扩展,获得参考数据,将该参考数据进行定向采集,获取该新闻线索相关的信息内容、传输模式、用户群体、用户群体的行为信息和属性信息等,对信息内容进行语义知识提取,将该语义知识进行进行聚类和相似度计算,识别与历史新闻线索数据库不匹配的新闻线索,并从语义知识对比、用户群体、传播模式和信息内容等方面对其进行可信度评估。最终形成UGC新闻真实性的分级度量和预警,为该新闻是否为真实信息提供决策支持。
-
公开(公告)号:CN102339465B
公开(公告)日:2013-11-20
申请号:CN201110254404.X
申请日:2011-08-31
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种检测运动物体相互靠近和/或接触的方法和系统,该方法包括:1)采集运动物体的全景深度图;2)基于全景深度图进行运动物体相互靠近和/或接触检测。本发明的方法和系统无需运动物体携有任何特定设备;可以检测靠近和/或接触两种情况,具体包括靠近不接触、接触不靠近、以及靠近且接触,并且靠近和/或接触的程度可调;可以工作在任何室内光照条件下,包括夜晚无灯光的情况;可以同时处理多个运动物体的情况。
-
公开(公告)号:CN102339465A
公开(公告)日:2012-02-01
申请号:CN201110254404.X
申请日:2011-08-31
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种检测运动物体相互靠近和/或接触的方法和系统,该方法包括:1)采集运动物体的全景深度图;2)基于全景深度图进行运动物体相互靠近和/或接触检测。本发明的方法和系统无需运动物体携有任何特定设备;可以检测靠近和/或接触两种情况,具体包括靠近不接触、接触不靠近、以及靠近且接触,并且靠近和/或接触的程度可调;可以工作在任何室内光照条件下,包括夜晚无灯光的情况;可以同时处理多个运动物体的情况。
-
公开(公告)号:CN101370138B
公开(公告)日:2011-02-09
申请号:CN200710120442.X
申请日:2007-08-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种H.264上下文自适应编码残差系数的解码方法,包含以下步骤:首先根据设计的一种三维码表,解码非零系数的数目和拖尾系数数目的二元组;再解码拖尾系数的符号位;然后解码非拖尾的非零系数的幅值;最后解码最后一个非零系数前0的数目和每个非零系数前0的个数。其中的非零系数的数目和拖尾系数数目的二元组解码,根据三维码表,通过预取特定比特位数,至多进行一次比较就可以确定码字信息位长度,进而确定二元组内容。其中的非零系数的数目和拖尾系数数目的二元组解码和非拖尾的非零系数的幅值解码采用每次读取两个字节的方法取得前导0的个数。本方法可以有效提高CAVLC码流的解码速度。
-
公开(公告)号:CN101441717B
公开(公告)日:2010-12-08
申请号:CN200710177875.9
申请日:2007-11-21
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种色情视频检测方法,包括:在待检测视频的视频帧中,利用肤色模型和非肤色模型,计算视频帧的各个象素点的肤色概率值与非肤色概率值;根据视频帧中象素点的肤色概率值与非肤色概率值,为视频帧建立模版图像;根据模版图像,从视频帧中提取图像特征;将连续视频帧中的图像特征组成观测序列,将所述观测序列输入到色情镜头模型中以检测待检测视频是否为色情视频。本发明还提供了一种与色情视频检测方法相适应的检测系统。本发明在检测过程中采用了相邻视频帧的时序特性,使得整个视频检测方法的鲁棒性更强,检测准确率更高。
-
公开(公告)号:CN101887459A
公开(公告)日:2010-11-17
申请号:CN201010221077.3
申请日:2010-06-28
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明一种网络视频话题检测的方法及系统,方法包括:步骤1,将视频的标签词表示为时间轴上的词频变化轨迹,根据该词频变化轨迹提取每个时间单元内的显著词;步骤2,将每个时间单元内的显著词表示为所述时间单元内上传的所有视频的倒排索引,并对所述显著词进行聚类,一个类为所述时间单元的一个事件;步骤3,计算各个事件之间相似度,建立事件之间的连接,形成事件发展轨迹图,事件发展轨迹图中的点为事件,按两个事件之间的相似度连接点生成边;步骤4,将事件发展轨迹图分割为多个连通子图;步骤5,按预设标准从各个连通子图中查找最优路径,每条最优路径对应一个话题的轨迹,进而完成话题的检测。本发明能够从网络中检测出视频话题。
-
公开(公告)号:CN101093509B
公开(公告)日:2010-06-16
申请号:CN200710119242.2
申请日:2007-07-18
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明公开了一种查询交互系统和方法。该系统包括一实时搜索引擎平台、一互动问答平台和一查询信息处理平台,查询信息处理平台包括一收集模块、一查询信息数据库和一检索模块。收集模块用于读取实时搜索引擎平台用户和互动问答平台用户反馈的查询失败信息,将查询失败信息记录在查询信息数据库;检索模块用于根据用户查询,在所述查询信息数据库中检索相关的查询失败信息,并反馈查询失败信息。其既结合实时搜索引擎平台的实时性和互动问答平台准确性,又利用了实时搜索引擎平台的用户量巨大和互动问答平台的回答激励,提高了查询的准确率。
-
公开(公告)号:CN101316327B
公开(公告)日:2010-05-26
申请号:CN200710099725.0
申请日:2007-05-29
Applicant: 中国科学院计算技术研究所
IPC: H04N5/262
Abstract: 本发明公开了一种多模态融合的采访镜头检测方法,包括:输入未编辑的原始视频,对视频进行预处理,得到原始视频的视频流和音频流,以及视频流中的镜头、各个镜头的关键帧;根据视频预处理操作所得到的音频流建立人声模型,并依赖所建立的人声模型判断镜头是否为包含人声的镜头;根据视频预处理操作所得到的视频流建立人脸模型,并依赖人脸模型判断镜头是否为包含人脸的镜头;融合人声检测结果和人脸检测结果,如果一个镜头中同时包含人声和人脸信息,则镜头为采访镜头。本发明的优点是通过融合视频和音频信息,建立通用的基于镜头的采访检测模型,并实现了对未经编辑的原始视频的概念检测和标注。
-
-
-
-
-
-
-
-
-