-
公开(公告)号:CN112214993A
公开(公告)日:2021-01-12
申请号:CN202010916293.3
申请日:2020-09-03
Applicant: 拓尔思信息技术股份有限公司
IPC: G06F40/242 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明属于文档处理和检索技术领域,为了解决现有基于传统的关键词检索技术,无法挖掘词语、句子、文档之间的语义关系,检索效果差的技术问题;本发明一种基于图神经网络的文档处理方法、装置、电子装置和非易失性计算机存储介质,所述方法采用基于有监督学习的图神经网络技术将语义词图生成深度语义向量,应用二值化编码器技术,将语义向量转化为二进制编码形式,进而生成字符特征向量,并构建倒排索引;使得处理后的文档,在检索过程中,能够基于字符特征索引和检索技术进行高性能检索与语义匹配,有效地提升语义检索结果相关性。
-
公开(公告)号:CN105592003B
公开(公告)日:2019-08-09
申请号:CN201410563541.5
申请日:2014-10-22
Applicant: 北京拓尔思信息技术股份有限公司
Abstract: 本发明提供一种基于通知的跨域单点登录方法,其包括:步骤S1,信任通道建立;步骤S2,全局认证凭证生成;步骤S3,用户身份认证;步骤S4,单点登录。借助web服务器的原有会话机制,以安全的加密通道传递会话ID,在认证服务端维护会话ID与认证凭证的关系,实现身份认证和单点登录,具有效率高、安全性高、实现成本低的特点。此外,本发明还提供一种基于通知的跨域单点登录系统,包括:客户端、应用服务端、认证中心三大模块,任意接入认证中心的应用端需携带重定向组件,认证中心负责认证凭证的生成、管理、销毁等工作,应用服务端与认证中心需建立互信通道,复用web服务的会话特性,实现跨域单点登录,具有复杂度低、安全性高、可靠性强的优点。
-
公开(公告)号:CN109753581A
公开(公告)日:2019-05-14
申请号:CN201811452179.9
申请日:2018-11-30
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06F16/583 , G06F16/51 , G06N3/04 , G06K9/46 , G06K9/62
Abstract: 本公开实施例提供一种图像处理方法、装置、电子设备和存储介质。图像处理方法包括:提取图像的具有第一维度的第一特征数据;对所述第一特征数据进行特征降维,获得具有第二维度的第二特征数据,所述第二维度的值小于第一维度的值;根据与所述第二维度的各个特征数据预设的阈值,对所述第二特征数据的各个维度的特征值进行二进制编码,生成表征图像基因的二进制串码;将所述二进制串码中各个对应单位位数的值映射为字符,获得表征图像基因的编码字符串。这种图像特征基因编码方法快速、简单,能够使用相对少的计算资源进行计算,具有极佳的领域适用性。
-
公开(公告)号:CN109741394A
公开(公告)日:2019-05-10
申请号:CN201811506464.4
申请日:2018-12-10
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06T7/62
Abstract: 本公开实施例提供一种图像处理方法、装置、电子设备和存储介质。图像处理方法包括:获取含有非空白图像区域的待处理图像;对所述待处理图像执行二值化处理,获得二值化图像;自所述二值化图像的一个顶点像素点开始,分别沿相互垂直的两个图像边界遍历所述二值化图像,获取与所述非空白图像区域的轮廓相切的多条边切线,所述边切线上包含至少一个黑色像素点且其一侧仅包含白色像素点;根据获取的多条边切线,获取至少一个外接矩形;将多个外接矩形当中面积最小的外接矩形选取为所述非空白图像区域的最小外接矩形区域。能够相对容易地计算得到图像的最小外接矩形,并且降低最小外接矩形的计算复杂度。
-
公开(公告)号:CN105590082B
公开(公告)日:2019-02-22
申请号:CN201410563687.X
申请日:2014-10-22
Applicant: 北京拓尔思信息技术股份有限公司
Abstract: 文档图像识别方法,包括图像预处理、获取图像连通区域、连通区域特征抽取、文档图像判别,图像连通区域的获取借助了聚类的思想,应用8连通准则,对灰度值为0和255的像素点分别聚类,准确识别连通区域。连通区域特征包括形状特征、颜色特征,主要分三种方式抽取,依次为疑似字符识别、一致性字符发现、真实字符判断,特征抽取简洁、复杂度低。实现了文档图像的准确、高效的识别,解决了文档图像识别性能低下的问题。
-
公开(公告)号:CN107222746A
公开(公告)日:2017-09-29
申请号:CN201710271432.X
申请日:2017-04-24
Applicant: 北京拓尔思信息技术股份有限公司
IPC: H04N19/137 , H04N19/167 , H04N19/17
Abstract: 本发明的实施例提供了一种视频关键位置定位方法及装置。所述视频关键位置定位方法包括:获取视频帧序列中各相邻视频帧之间的帧差;获取视频帧序列中设定范围内的帧差的第一帧差极大值;如果第一帧差极大值位于设定范围内的第一区域范围内,则将第一帧差极大值的位置确定为视频帧序列的当前关键位置,其中,设定范围包括第一区域范围和第二区域范围,第一区域范围的长度大于第二区域范围的长度。采用本发明实施例的技术方案,可以有效地实现视频关键位置的定位,并且避免误差传递,具有较高的鲁棒性。
-
公开(公告)号:CN107193883A
公开(公告)日:2017-09-22
申请号:CN201710285832.6
申请日:2017-04-27
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06F17/30
Abstract: 本发明实施例提供了一种数据处理方法和系统,其中,所述方法包括:获取待处理的第一数据;根据自然语言处理引擎抽取所述第一数据的关键词序列;根据协同过滤引擎确定所述关键词序列的推荐数据;查询预设的数据库,得到与所述推荐数据匹配的第二数据。本发明实施例利用协同过滤引擎和第一数据的关键词序列确定第一数据的相似数据,即推荐数据,采用协同过滤技术确定第一数据的相似数据,提高了确定相似数据的准确率。当第一数据作为问题数据,第二数据作为答案数据时,本发明实施例也提高了答案推荐的准确率。
-
公开(公告)号:CN103793421B
公开(公告)日:2017-07-07
申请号:CN201210428272.2
申请日:2012-10-31
Applicant: 北京拓尔思信息技术股份有限公司
Inventor: 都云程
IPC: G06F17/30
Abstract: 本发明公开了一种基于网页结构的信息动态采集更新调度方法,该方法包括:S1,采用网页结构分析方法对每个采集后的网页进行量化打分;S2,页面分数大于一定阈值(θ)判定为Hub页面,参与更新采集调度;S3,将Hub页面分数划定等级,不同等级采用不同的调度周期实施调度;S4,每轮采集后,重新调整Hub页面调度等级,在持续调整过程中实现更新采集效果的不断优化。本发明实现了海量信息时代下,信息采集系统准确、高效的要求。
-
公开(公告)号:CN105592356A
公开(公告)日:2016-05-18
申请号:CN201410563990.X
申请日:2014-10-22
Applicant: 北京拓尔思信息技术股份有限公司
IPC: H04N21/4402 , H04N21/472
Abstract: 本发明提供一种精准的音视频在线虚拟剪辑方法,其包括:步骤S10,音视频对象获取;步骤S20,音视频对象转码;步骤S30,用户在线剪辑;步骤S40,音视频对象准确定位;步骤S50,剪辑关联。将剪辑工具嵌入浏览器,采用流媒体增强型定位技术,精准定位到帧,剪辑信息与父视频进行关联,以实现虚拟剪辑。此外,本发明还提供一种精准的音视频在线虚拟剪辑系统,包括:播放器、在线剪辑工具,流媒体服务器、音视频数据处理服务器,数据库三大模块,实现音视频的精准、高效的在线编辑和播放,同时避免音视频的重复存储,提高存储空间有效利用率。
-
公开(公告)号:CN104679482A
公开(公告)日:2015-06-03
申请号:CN201310607368.X
申请日:2013-11-27
Applicant: 北京拓尔思信息技术股份有限公司
Abstract: 本发明提供的基于OSGI的ETL处理装置,包括:流程设计器和流程执行引擎。其中,流程设计器由节点中心、控制策略和触发器模块组成,流程执行引擎由处理中心、执行策略和流程管理模块组成。任意模块基于OSGI平台,并由其为模块创建独立的运行环境。节点中心负责所有节点及其属性的预定义,控制策略定义了节点间的关系及触发方式,触发器向引擎发送任务请求。处理中心负责任务的执行及执行时的调度,执行策略有单线程串行、多线程并行以及条件判断,实现时基于缓存机制利用数据分发与复制技术。此外,本发明还提供了基于OSGI的ETL处理方法。通过本发明的技术方案,可以有效提高子任务的重用性,提高数据吞吐量及处理效率。
-
-
-
-
-
-
-
-
-