-
公开(公告)号:CN107222746A
公开(公告)日:2017-09-29
申请号:CN201710271432.X
申请日:2017-04-24
Applicant: 北京拓尔思信息技术股份有限公司
IPC: H04N19/137 , H04N19/167 , H04N19/17
Abstract: 本发明的实施例提供了一种视频关键位置定位方法及装置。所述视频关键位置定位方法包括:获取视频帧序列中各相邻视频帧之间的帧差;获取视频帧序列中设定范围内的帧差的第一帧差极大值;如果第一帧差极大值位于设定范围内的第一区域范围内,则将第一帧差极大值的位置确定为视频帧序列的当前关键位置,其中,设定范围包括第一区域范围和第二区域范围,第一区域范围的长度大于第二区域范围的长度。采用本发明实施例的技术方案,可以有效地实现视频关键位置的定位,并且避免误差传递,具有较高的鲁棒性。
-
公开(公告)号:CN107193883A
公开(公告)日:2017-09-22
申请号:CN201710285832.6
申请日:2017-04-27
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06F17/30
Abstract: 本发明实施例提供了一种数据处理方法和系统,其中,所述方法包括:获取待处理的第一数据;根据自然语言处理引擎抽取所述第一数据的关键词序列;根据协同过滤引擎确定所述关键词序列的推荐数据;查询预设的数据库,得到与所述推荐数据匹配的第二数据。本发明实施例利用协同过滤引擎和第一数据的关键词序列确定第一数据的相似数据,即推荐数据,采用协同过滤技术确定第一数据的相似数据,提高了确定相似数据的准确率。当第一数据作为问题数据,第二数据作为答案数据时,本发明实施例也提高了答案推荐的准确率。
-
公开(公告)号:CN103793421B
公开(公告)日:2017-07-07
申请号:CN201210428272.2
申请日:2012-10-31
Applicant: 北京拓尔思信息技术股份有限公司
Inventor: 都云程
IPC: G06F17/30
Abstract: 本发明公开了一种基于网页结构的信息动态采集更新调度方法,该方法包括:S1,采用网页结构分析方法对每个采集后的网页进行量化打分;S2,页面分数大于一定阈值(θ)判定为Hub页面,参与更新采集调度;S3,将Hub页面分数划定等级,不同等级采用不同的调度周期实施调度;S4,每轮采集后,重新调整Hub页面调度等级,在持续调整过程中实现更新采集效果的不断优化。本发明实现了海量信息时代下,信息采集系统准确、高效的要求。
-
公开(公告)号:CN105592356A
公开(公告)日:2016-05-18
申请号:CN201410563990.X
申请日:2014-10-22
Applicant: 北京拓尔思信息技术股份有限公司
IPC: H04N21/4402 , H04N21/472
Abstract: 本发明提供一种精准的音视频在线虚拟剪辑方法,其包括:步骤S10,音视频对象获取;步骤S20,音视频对象转码;步骤S30,用户在线剪辑;步骤S40,音视频对象准确定位;步骤S50,剪辑关联。将剪辑工具嵌入浏览器,采用流媒体增强型定位技术,精准定位到帧,剪辑信息与父视频进行关联,以实现虚拟剪辑。此外,本发明还提供一种精准的音视频在线虚拟剪辑系统,包括:播放器、在线剪辑工具,流媒体服务器、音视频数据处理服务器,数据库三大模块,实现音视频的精准、高效的在线编辑和播放,同时避免音视频的重复存储,提高存储空间有效利用率。
-
公开(公告)号:CN104679482A
公开(公告)日:2015-06-03
申请号:CN201310607368.X
申请日:2013-11-27
Applicant: 北京拓尔思信息技术股份有限公司
Abstract: 本发明提供的基于OSGI的ETL处理装置,包括:流程设计器和流程执行引擎。其中,流程设计器由节点中心、控制策略和触发器模块组成,流程执行引擎由处理中心、执行策略和流程管理模块组成。任意模块基于OSGI平台,并由其为模块创建独立的运行环境。节点中心负责所有节点及其属性的预定义,控制策略定义了节点间的关系及触发方式,触发器向引擎发送任务请求。处理中心负责任务的执行及执行时的调度,执行策略有单线程串行、多线程并行以及条件判断,实现时基于缓存机制利用数据分发与复制技术。此外,本发明还提供了基于OSGI的ETL处理方法。通过本发明的技术方案,可以有效提高子任务的重用性,提高数据吞吐量及处理效率。
-
公开(公告)号:CN104375990A
公开(公告)日:2015-02-25
申请号:CN201310346542.X
申请日:2013-08-12
Applicant: 北京拓尔思信息技术股份有限公司
Inventor: 程涛
IPC: G06F17/30
Abstract: 基于SIFT特征的海量图像实时检索方法,包括图像SIFT特征抽取、SIFT基因生成、特征匹配,SIFT基因生成分为三步,依次为特征KEY生成、特征重要信息VALUE生成、特征点压缩。在从SIFT特征到SIFT基因映射过程中采用了特征降维方法,将128维的特征向量降至26维,同时在SIFT基因形成的过程中进行特征点压缩处理,大大降低了特征存储空间,特征匹配时合理地利用特征重要性程度信息进行简单的对比相加运算,将特征匹配计算复杂度降至O(n)级别,实现了海量图像实时检索需求。
-
公开(公告)号:CN107220296B
公开(公告)日:2020-01-17
申请号:CN201710295530.7
申请日:2017-04-28
Applicant: 北京拓尔思信息技术股份有限公司
Abstract: 本发明实施例提供了一种问答知识库的生成方法、神经网络的训练方法以及设备。其中,所述问答知识库的生成方法包括:对文档数据进行拆分处理,得到多个知识片段;通过神经网络对每个知识片段进行映射处理,得到与所述每个知识片段对应的问题,从而生成得到所述问答知识库。通过本发明实施例,能够有效地降低获取问答知识的难度,大大减少了人工工作量。
-
公开(公告)号:CN107247652A
公开(公告)日:2017-10-13
申请号:CN201710370462.6
申请日:2017-05-23
Applicant: 北京拓尔思信息技术股份有限公司
CPC classification number: G06F11/3068 , G06F11/324
Abstract: 本发明实施例提供了一种ETL作业的监控方法和系统,其中,所述方法包括:获取并上报ETL作业的执行元数据和日志数据;基于操作请求信息根据所述执行元数据和日志数据生成图谱数据;将所述图谱数据按照图谱形式进行展示。本发明实施例可以通过图谱的形式对ETL作业进行监控,使得ETL作业的监控更加直观。
-
公开(公告)号:CN103377207A
公开(公告)日:2013-10-30
申请号:CN201210114869.X
申请日:2012-04-17
Applicant: 北京拓尔思信息技术股份有限公司
Inventor: 都云程
IPC: G06F17/30
Abstract: 本发明涉及信息采集技术领域,公开了一种基于脚本引擎的微博用户关系采集方法,该方法包括步骤:S1,采用脚本引擎技术自动登录微博客网站;S2,采用网页采集方式对特定账户信息爬取其对应内容页面信息;S3,元数据解析,获取用户列表、用户行为机制及用户基本信息;S4,实现用户关系抽取;S5,使用广度优先遍历用户列表,丰富用户关联关系。本发明提供的采集方法克服了API访问限制问题,有利于微博客信息的规模化采集,同时也提高了信息采集的精确度。
-
公开(公告)号:CN107203509B
公开(公告)日:2023-06-20
申请号:CN201710262158.X
申请日:2017-04-20
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06F40/258 , G06F40/289 , G06F40/30
Abstract: 本发明的实施例提供了一种标题生成方法和装置。所述标题生成方法包括:获取第一新闻集合中各新闻文档的原始标题并拼接成标题文本串,其中,所述第一新闻集合包括关于同一新闻事件的至少一个新闻文档;从所述标题文本串中提取高频词串,并对提取的所述高频词串进行过滤;将经过过滤的所述高频词串中出现频次最高的词串确定为所述第一新闻集合的标题。采用本发明实施例的技术方案,可以自动为新闻文档生成了一个高质量的短标题,保证了标题的语义效果和精炼性,而且降低了短标题生成的计算难度,并具有较高的适应性。
-
-
-
-
-
-
-
-
-