-
公开(公告)号:CN107220296B
公开(公告)日:2020-01-17
申请号:CN201710295530.7
申请日:2017-04-28
Applicant: 北京拓尔思信息技术股份有限公司
Abstract: 本发明实施例提供了一种问答知识库的生成方法、神经网络的训练方法以及设备。其中,所述问答知识库的生成方法包括:对文档数据进行拆分处理,得到多个知识片段;通过神经网络对每个知识片段进行映射处理,得到与所述每个知识片段对应的问题,从而生成得到所述问答知识库。通过本发明实施例,能够有效地降低获取问答知识的难度,大大减少了人工工作量。
-
公开(公告)号:CN109739964A
公开(公告)日:2019-05-10
申请号:CN201811613073.2
申请日:2018-12-27
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06F16/332 , G06F16/36 , G06F16/951 , G06F16/953 , G06F16/9535 , G06F17/27
Abstract: 本公开实施例提供一种知识数据提供方法、装置、电子设备和存储介质。知识数据提供方法包括:获取查询请求语句;对查询请求语句进行分词处理,获取至少一个查询词;从扩展词典分别获取与各个查询词对应的扩展关键词;将获取到的各个所述查询词或其对应的扩展关键词的组合分别与多个语义匹配表达式进行匹配,获取查询意图的信息;从知识库获取与所述查询意图对应的知识数据;提供所述知识数据。能够对以自然语言的方式提出的查询请求进行理解、分析,通过构建的语义理解框架对从查询请求提取的关键信息进行需求匹配,并且根据匹配得到的查询意图,提供知识库中的相应知识数据,从而能够为查询用户提供准确地匹配到其查询意图的知识数据。
-
公开(公告)号:CN107220296A
公开(公告)日:2017-09-29
申请号:CN201710295530.7
申请日:2017-04-28
Applicant: 北京拓尔思信息技术股份有限公司
Abstract: 本发明实施例提供了一种问答知识库的生成方法、神经网络的训练方法以及设备。其中,所述问答知识库的生成方法包括:对文档数据进行拆分处理,得到多个知识片段;通过神经网络对每个知识片段进行映射处理,得到与所述每个知识片段对应的问题,从而生成得到所述问答知识库。通过本发明实施例,能够有效地降低获取问答知识的难度,大大减少了人工工作量。
-
公开(公告)号:CN103577418B
公开(公告)日:2016-12-21
申请号:CN201210256159.0
申请日:2012-07-24
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06F17/30
Abstract: 一种海量文档分布式检索排重系统,包括文档预处理模块、文档特征计算模块、分布式建库模块、存储模块、分布式检索模块、相似度计算模块。文档特征计算模块根据词对文档的重要程度计算文档特征向量。分布式建库模块根据文档特征向量将文档映射到不同的存储分区。分布式检索模块检索目标文档所属的若干个分区,相似度计算模块计算目标文档与这若干个分区中所有文档的相似度,从而实现海量文档分布式排重操作。所提供的海量文档分布式检索排重系统和方法,借助了分布式系统的思想,将海量文档集分散到若干个子集中,使得排重计算在1个或少数几个子集中进行,减少了相似度计算量,提高了文档排重效率。
-
公开(公告)号:CN105389344A
公开(公告)日:2016-03-09
申请号:CN201510696381.6
申请日:2015-10-21
Applicant: 南方电网科学研究院有限责任公司 , 中国南方电网有限责任公司电网技术研究中心 , 北京拓尔思信息技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F16/951
Abstract: 本发明公开了一种自助式查新方法及系统,该方法包括:根据用户输入的查新内容,对查新内容进行语义分析,提取出查新关键词,并通过关联检索生成相应的关联关键词;根据查新关键词和所述关联关键词,基于逻辑关系生成查新检索式;根据查新检索式检索各个资源数据库,获得检索结果;对检索结果进行多维度评价,并根据评价结果生成相应的查新报告;其中,多维度评价包括:基于检索内容相关度评价、基于查新点的相关度评价、基于关键词的相关度评价、基于技术指标的相关度评价。采用本发明实施例,能够提高科技查新的效率。
-
公开(公告)号:CN105592003A
公开(公告)日:2016-05-18
申请号:CN201410563541.5
申请日:2014-10-22
Applicant: 北京拓尔思信息技术股份有限公司
Abstract: 本发明提供一种基于通知的跨域单点登录方法,其包括:步骤S1.信任通道建立;步骤S2.全局认证凭证生成;步骤S3.用户身份认证;步骤S4.单点登录。借助web服务器的原有会话机制,以安全的加密通道传递会话ID,在认证服务端维护会话ID与认证凭证的关系,实现身份认证和单点登录,具有效率高、安全性高、实现成本低的特点。此外,本发明还提供一种基于通知的跨域单点登录系统,包括:客户端、应用服务端、认证中心三大模块,任意接入认证中心的应用端需携带重定向组件,认证中心负责认证凭证的生成、管理、销毁等工作,应用服务端与认证中心需建立互信通道,复用web服务的会话特性,实现跨域单点登录,具有复杂度低、安全性高、可靠性强的优点。
-
公开(公告)号:CN105302793A
公开(公告)日:2016-02-03
申请号:CN201510696274.3
申请日:2015-10-21
Applicant: 南方电网科学研究院有限责任公司 , 中国南方电网有限责任公司电网技术研究中心 , 北京拓尔思信息技术股份有限公司
Abstract: 本发明提供了一种利用计算机自动评价科技文献新颖性的方法,其包括如下步骤:A、基于文档内容排序的新颖性检测;B、基于文档语义比对的新颖性检测;C、基于关键术语的新颖性检测;D、基于数值指标的新颖性检测;E、基于步骤A-D分别得到各自的新颖性评分,运用回归模型计算出查新文档的新颖性总分。采用本发明的方法,可基于多维度新颖性检测的科技文献自动查新,提高科技查新的效率。
-
公开(公告)号:CN104750461A
公开(公告)日:2015-07-01
申请号:CN201310723625.6
申请日:2013-12-25
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06F9/44
Abstract: 本发明提供一种可视化的网站建设系统,其包括:站点池,栏目库,资源池,风格池,母版库,可视化设计页面等模块,其中可视化设计页面作为用户接口,将网页拆分成一个个独立的资源块,由其他数据资源模块提供内容、风格支持,可实现用户拖拽设计和可视化数据配置。此外,本发明还提供一种可视化的网站建设方法,该方法将站点池、栏目库以结构树的形式组织管理,预定义资源池、风格池内容,页面设计时直接选择资源块并配置资源块的内容及风格即可,实现了所见即所得的网站建设模式,同时将内容与表现形式剥离,业务处理逻辑透明化,提高了网站建设效率,降低了网站建设的技术门槛。
-
公开(公告)号:CN105592003B
公开(公告)日:2019-08-09
申请号:CN201410563541.5
申请日:2014-10-22
Applicant: 北京拓尔思信息技术股份有限公司
Abstract: 本发明提供一种基于通知的跨域单点登录方法,其包括:步骤S1,信任通道建立;步骤S2,全局认证凭证生成;步骤S3,用户身份认证;步骤S4,单点登录。借助web服务器的原有会话机制,以安全的加密通道传递会话ID,在认证服务端维护会话ID与认证凭证的关系,实现身份认证和单点登录,具有效率高、安全性高、实现成本低的特点。此外,本发明还提供一种基于通知的跨域单点登录系统,包括:客户端、应用服务端、认证中心三大模块,任意接入认证中心的应用端需携带重定向组件,认证中心负责认证凭证的生成、管理、销毁等工作,应用服务端与认证中心需建立互信通道,复用web服务的会话特性,实现跨域单点登录,具有复杂度低、安全性高、可靠性强的优点。
-
公开(公告)号:CN105590082B
公开(公告)日:2019-02-22
申请号:CN201410563687.X
申请日:2014-10-22
Applicant: 北京拓尔思信息技术股份有限公司
Abstract: 文档图像识别方法,包括图像预处理、获取图像连通区域、连通区域特征抽取、文档图像判别,图像连通区域的获取借助了聚类的思想,应用8连通准则,对灰度值为0和255的像素点分别聚类,准确识别连通区域。连通区域特征包括形状特征、颜色特征,主要分三种方式抽取,依次为疑似字符识别、一致性字符发现、真实字符判断,特征抽取简洁、复杂度低。实现了文档图像的准确、高效的识别,解决了文档图像识别性能低下的问题。
-
-
-
-
-
-
-
-
-