-
公开(公告)号:CN101625695B
公开(公告)日:2012-07-04
申请号:CN200910091375.2
申请日:2009-08-20
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明涉及Web视频页面的复杂命名实体的抽取方法及系统,方法包括:步骤1,对于Web视频页面集合中的每个Web视频页面,从Web视频页面中抽取有效文本信息,有效文本信息组成视频文本,所有视频文本组成训练集合;步骤2,对Web视频页面进行归类,选择类别,对于每个被选的类别设置引导词,从训练集合中选择同引导词相关并且在类别内均匀分布在类别间集中分布的词为特征词;步骤3,从训练集合中提取出同特征词相关的词为候选复杂命名实体,按候选命名实体相关的特征词同类别的关联度,为各个被选类别从候选命名实体中选择对应的复杂命名实体。本发明能够不需要经过长时间的模型训练而从Web视频页面中提取复杂命名实体。
-
公开(公告)号:CN1744591A
公开(公告)日:2006-03-08
申请号:CN200410073676.X
申请日:2004-08-31
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种终端网络环境中的分布式设备重定向系统,包括虚拟驱动模块、服务代理模块和终端代理模块,通过应用→虚拟驱动模块→服务代理模块→终端代理模块→终端设备驱动→终端设备的通道,将应用对设备的访问逻辑反映到终端设备上,并按照原通道的逆返回。在这一通信过程中,虚拟驱动往往并不关心操作的细节,只是将设备访问逻辑通过网络传递至终端设备并原路返回。采用上述通信描述过程可以屏蔽不同设备访问细节的差异,具有很强的通用性;同时通过提供特定接口,对某些特殊需要的设备操作提供支持,具有较强的可扩展性。
-
公开(公告)号:CN1538707A
公开(公告)日:2004-10-20
申请号:CN200310102575.6
申请日:2003-10-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及终端应用协议中多媒体播放技术领域,提供一种在终端应用协议中播放多媒体内容的自适应方法,通过应用程序服务器和网络终端之间根据终端处理能力、应用服务器负载情况以及网络带宽状况对多媒体播放过程进行协商。通过协商,终端应用协议中多媒体播放过程的码流解析,视频解码、音频解码和同步控制过程就可以分布在应用服务器和网络终端上。这种多媒体自适应播放方法定义了网络终端和应用服务器之间针对终端处理能力、网络带宽以及应用服务器负载等进行协商的信息格式和协商过程,实现了应用服务器对多媒体播放控制窗口和终端多媒体解码之间的有机融合。
-
公开(公告)号:CN110889430A
公开(公告)日:2020-03-17
申请号:CN201911018018.3
申请日:2019-10-24
Applicant: 中国科学院计算技术研究所
IPC: G06K9/62
Abstract: 本发明涉及一种基于多域视觉特征的新闻图像检测方法,包括:提取新闻图像在各频域上的频域向量,获取该频域向量在对应频域上的频域特征,并将该频域特征拼接为该新闻图像的物理视觉特征;获取该新闻图像在各语义上的语义特征,将该语义特征的正向GRU特征序列和反向GRU特征序列,拼接为该新闻图像的语义视觉特征;将该物理视觉特征和该语义视觉特征进行融合及逻辑回归分类,以获取该新闻图像为虚假新闻图像类别的预测概率。本发明基于对虚假新闻图像特点的深入分析,设计了一个深度学习模型,能够充分建模并融合图像在频率域以及像素域的特点,从而实现利用视觉内容对虚假新闻的自动检测。
-
公开(公告)号:CN110210016A
公开(公告)日:2019-09-06
申请号:CN201910341056.6
申请日:2019-04-25
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于风格引导的双线性神经网络虚假新闻检测方法及系统,包括:获取待网络虚假新闻检测的新闻文本,通过神经网络量化该新闻文本的语言风格特征,得到该新闻文本的风格向量,将该新闻文本输入文本特征提取器,得到该新闻文本的文本向量;将该风格向量和该文本向量输入双线性神经网络,该双线性神经网络包括双线性函数,用于建模该风格向量和该文本向量之间的相关性,以得到该新闻文本的的风格-文本特征矩阵,使用该风格-文本特征矩阵中最大分数向量组成引导向量,并将该引导向量输入至全连接层,判定该新闻文本的虚假新闻标签。本发明依据虚假新闻共性的语言风格来引导深度学习模型的学习过程,提升了模型的识别准确度与泛化性能。
-
公开(公告)号:CN109739976A
公开(公告)日:2019-05-10
申请号:CN201811451898.9
申请日:2018-11-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种网络社交平台隐私甄别方法、系统、存储介质和计算机,包括:根据网络社交平台已发布的问题及相关答案之间的结构特征,构建由多组分析数据构成的训练样本集,分析数据包括:问题信息、相关的答案列表信息以及对应的隐私性标签;以训练样本集中的问题信息、相关的答案列表信息为输入,以对应的隐私性标签为输出,训练深度学习模型得到基于深度学习模型的隐私信息甄别模型;获取社交网络平台上发布的问题信息,作为待甄别信息,将待甄别信息和与待甄别信息相关的答案列表信息输入到隐私信息甄别模型,得到待甄别信息的隐私性标签作为隐私甄别结果。
-
公开(公告)号:CN104735138B
公开(公告)日:2018-01-09
申请号:CN201510102980.0
申请日:2015-03-09
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种面向用户生成内容的分布式采集方法,包括:1)根据采集页面的采集量和采集难度划分页面类型,基于页面类型构建采集任务并将其加入采集队列;其中,所述采集任务包括复合采集任务,所述复合采集任务根据采集量和采集难度将多个同类型的采集页面划入;2)并发地从所述采集任务队列取出采集任务,执行该采集任务并返回所采集的信息。本发明还提供了相应的分布式采集系统,包括主控节点和多个子节点,主控节点用于构建并维护采集任务队列;各个所述子节点用于并发地执行采集任务。本发明的采集速度快,显著地提高了UGC新闻采集的实时性;可以适用于各种不同类型页面的采集,执行多样化的采集任务;能够规避采集对象的监控措施。
-
公开(公告)号:CN101382956B
公开(公告)日:2011-11-23
申请号:CN200810223523.7
申请日:2008-10-06
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种面向主题的信息采集方法,包括下列步骤:1)根据待采集链接队列中链接的顺序,从所述待采集链接队列中获得多个链接,采集并存储所述多个链接的页面内容,提取所述页面中的新链接,判定所述页面的主题相关性,提取所述页面的相关链接集合,将所述新链接添加到所述待采集链接队列中;2)根据所述页面的相关链接集合和所述页面的主题相关性,计算所有链接的页面的主题相关性,并调整添加了所述新链接的待采集链接队列中的链接的顺序,重复步骤1)和2)直至采集结束。上述方法极大的减小了对存储空间的需求;并且提高了面向主题信息采集的有效性。
-
公开(公告)号:CN101782898A
公开(公告)日:2010-07-21
申请号:CN201010133149.9
申请日:2010-03-25
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种情感词倾向性的分析方法,包括:抓取网络上带有星级的评论信息;抽取评论信息中的情感词;通过将利用星级数值化计算得到的情感词倾向性、利用构建的种子情感词基于PMI-IR算法获取的情感词倾向性以及基于连词性质计算的情感词倾向性加权求和,获取情感词的倾向性。通过应用本方法,减轻了情感分析系统构建的工作量;利用网络上的星级评论,减少人工标注中人的主观因素对情感词的标注的影响;通过多种算法的结合,对情感词的倾向性进行加权求和,降低了种子情感词选择不当所带来的影响以及语料库质量对情感词倾向性计算的影响。
-
公开(公告)号:CN101715004A
公开(公告)日:2010-05-26
申请号:CN200910237595.1
申请日:2009-11-12
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种面向网络视频的分布式采集方法和系统。所述方法,包括下列步骤:利用预先定制的正则表达式与每一个视频网页的统一资源定位符进行匹配,识别出可能包含视频的网页;从视频网站并行下载所述可能包含视频的网页,分别对下载的所述可能包含视频的网页进行网页结构分析,识别出有效的视频网页的链接地址,并将所述网页结构分析结果合并后存储;根据所述有效的视频网页的链接地址,获取所述有效的视频网页中隐藏的视频的链接地址,并分析所述视频的链接地址以获取真实的视频的链接地址,下载并存储所述真实的视频的链接地址对应的视频。
-
-
-
-
-
-
-
-
-