-
公开(公告)号:CN109145125A
公开(公告)日:2019-01-04
申请号:CN201810948268.6
申请日:2018-08-20
Applicant: 长城计算机软件与系统有限公司
IPC: G06F16/383 , G06F17/27
CPC classification number: G06F17/2705
Abstract: 本发明实施例涉及一种动态抽取信息的方法和系统、存储介质,属于信息处理技术领域。该方法包括:对获取到的目标文本进行解析,得到目标文本对应的目标名称;从预设信息抽取规则中选取与目标名称相对应的目标信息抽取规则;根据目标信息抽取规则从目标文本中提取结构化信息。通过本实施例提供的:在对目标文本进行解析后,得到目标名称,根据目标名称从预设信息抽取规则中选取目标信息抽取规则,根据目标信息抽取规则从目标文本中提取结构化信息的技术方案,避免了现有技术中通过人工的方式对结构化信息进行抽取时,造成的出错率高,效率低等技术弊端,实现了高效且精准的对结构化信息进行抽取的技术效果。
-
公开(公告)号:CN113867723A
公开(公告)日:2021-12-31
申请号:CN202111066349.1
申请日:2021-09-13
Applicant: 长城计算机软件与系统有限公司
Abstract: 本发明实施例是关于一种前端代码生成方法和装置。该方法包括:配置前端展示页面对应的多个业务组件、组件的展示逻辑和权限逻辑,所述业务组件为组件和/或业务模块构成,其中,所述业务模块为多个组件构成;配置完成后生成JSON格式结构代码并存储;对所述JSON格式结构代码进行校验,对校验失败的所述JSON格式结构代码根据所述组合逻辑、展示逻辑和权限逻辑进行自动修改;抽象所述业务组件的JSON格式结构代码,根据所述业务组件结构规范所述JSON格式结构代码数据结构,使前端和后端的代码数据结构一致后开发所述业务组件对应的业务接口;接收所述访问用户的访问操作后生成对应展示页面。
-
公开(公告)号:CN112200117A
公开(公告)日:2021-01-08
申请号:CN202011139730.1
申请日:2020-10-22
Applicant: 长城计算机软件与系统有限公司
Abstract: 本发明公开了一种表格识别方法及装置,涉及表格识别技术领域。该方法包括:获取包含待识别表格的图片,对图片中的表格的轮廓进行检测,根据检测结果得到表格中每个单元格的相对坐标;通过卷积递归神经网络对每个单元格内的文字进行识别,如果识别失败,则通过渐进尺度扩展网络对识别失败的单元格内的文字进行识别;识别完成后,根据识别结果确定每个单元格的内容,根据每个单元格的相对坐标确定每个单元格的相对位置,生成表格文件。本发明不需要对样本数据进行字符分割,可识别任意长度的文本序列,模型速度快、性能好,并可以成功地识别相邻文本实例,从而提高识别的准确度和精确度。
-
公开(公告)号:CN111143400A
公开(公告)日:2020-05-12
申请号:CN201911366462.4
申请日:2019-12-26
Applicant: 长城计算机软件与系统有限公司
IPC: G06F16/242 , G06F40/30
Abstract: 本发明涉及一种全栈式检索的方法、系统、引擎及电子设备,首先基于ElasticSearch设计向量检索插件,然后利用向量检索插件在ElasticSearch中扩展出图像字段类型和语义字段类型,根据神经网络模型所训练出的图像网络模型提取多个图像的图像特征向量并存至图像字段,根据神经网络模型所训练出的语义网络模型提取文本数据的语义特征向量并存至语义字段,图像字段、语义字段和ElasticSearch所提供的原始检索字段,共同构成检索数据库结构,以创建检索数据库,当用户进行检索时,可设置不同的检索条件,通过向量检索插件在检索数据库中以布尔检索方式、图像检索方式和语义检索方式中的至少一种检索方式进行检索,实现了将布尔检索方式、图像检索方式和语义检索方式结合起来以支持海量数据的混合全栈检索。
-
公开(公告)号:CN108710652A
公开(公告)日:2018-10-26
申请号:CN201810438993.9
申请日:2018-05-09
Applicant: 长城计算机软件与系统有限公司
IPC: G06F17/30
Abstract: 本发明实施例涉及一种基于统计的数据分析方法和系统、存储介质,属于数据处理技术领域。其中,该方法包括:根据业务类型分别定义显示界面对应的数据维度,以及检索引擎的数据库对应的字段类型;获取用户输入的数据分析请求信息,其中,数据分析请求信息包括目标数据维度,且与目标业务类型相对应,业务类型包括目标业务类型;根据目标数据维度和预设的语法处理规则确定检索式;根据目标数据维度从检索引擎中选取目标检索引擎;根据目标检索引擎和检索式生成数据分析结果。通过本实施例提供的技术方案,避免了现有技术中,随着数据量的增加,无法实现高效的对数据进行分析的技术弊端,从而实现了高效的数据进行分析的技术效果。
-
公开(公告)号:CN112200117B
公开(公告)日:2023-10-13
申请号:CN202011139730.1
申请日:2020-10-22
Applicant: 长城计算机软件与系统有限公司
IPC: G06V30/413 , G06V30/148 , G06V10/82 , G06V30/18 , G06V30/162 , G06V30/16 , G06N3/045 , G06N3/044 , G06N3/0464 , G06N3/08 , G06F40/174 , G06T11/60
Abstract: 本发明公开了一种表格识别方法及装置,涉及表格识别技术领域。该方法包括:获取包含待识别表格的图片,对图片中的表格的轮廓进行检测,根据检测结果得到表格中每个单元格的相对坐标;通过卷积递归神经网络对每个单元格内的文字进行识别,如果识别失败,则通过渐进尺度扩展网络对识别失败的单元格内的文字进行识别;识别完成后,根据识别结果确定每个单元格的内容,根据每个单元格的相对坐标确定每个单元格的相对位置,生成表格文件。本发明不需要对样本数据进行字符分割,可识别任意长度的文本序列,模型速度快、性能好,并可以成功地识别相邻文本实例,从而提高识别的准确度和精确度。
-
公开(公告)号:CN112836010A
公开(公告)日:2021-05-25
申请号:CN202011141538.6
申请日:2020-10-22
Applicant: 长城计算机软件与系统有限公司
Abstract: 本发明公开了用于专利的检索方法、存储介质及装置,涉及计算机技术领域。该方法包括:根据预先建立的神经网络模型分别对待检索专利进行语义和表面信息的特征抽取,将得到的语义特征向量和表面信息特征向量进行拼接,得到融合特征向量;根据融合特征向量从预设的特征数据库中匹配相似度满足预设相似度条件的专利,得到检索结果。本发明适用于专利文件的相似文本的检索,能够得到准确的检索结果,能够充分挖掘不同专利之间的关联性,从而提高检索结果的可信度。
-
公开(公告)号:CN106547911A
公开(公告)日:2017-03-29
申请号:CN201611054238.8
申请日:2016-11-25
Applicant: 长城计算机软件与系统有限公司
IPC: G06F17/30
Abstract: 本发明涉及一种海量小文件的存取方法和系统,该方法包括以下步骤:对获取的业务数据所对应的业务文件进行压缩,得到文件压缩包;根据预设提取规则提取业务数据的特征值;当特征值未存储在文件索引库中时,根据预设编码规则对特征值进行编码,得到数据编码,并将特征值和数据编码的对应关系存储到文件索引库中;根据数据编码生成对应的目录结构;对文件压缩包进行解压,得到业务文件;将业务文件存入到目录结构的存储路径下;读取业务文件。本发明的有益效果是:高效的存储和读取海量小文件,系统接入简单,写入、读取批量数据效率高,且可以多方位弹性扩展。
-
公开(公告)号:CN106372051A
公开(公告)日:2017-02-01
申请号:CN201610916401.0
申请日:2016-10-20
Applicant: 长城计算机软件与系统有限公司
CPC classification number: G06F17/243 , G06F16/35 , G06K9/6223
Abstract: 本发明涉及一种专利地图的可视化方法和系统,该方法包括:获取专利文献数据集中每个专利文献对应的多维文本向量;对每个专利文献对应的多维文本向量进行聚类分析,得到多个聚类结果;将每个聚类结果对应的多个专利文献映射到二维平面,以进行降维处理并得到专利文献数据点;将多个专利文献数据点进行可视化计算,生成可视化数据,并将可视化数据在二维平面上显示成三维图像。本发明提供的一种专利地图的可视化方法和系统,能够简化专利地图生成过程中的运算量,从而减少对对CPU和内存的开销,实现实时生成专利地图并展现。
-
-
-
-
-
-
-
-