-
公开(公告)号:CN107608949B
公开(公告)日:2019-04-16
申请号:CN201710959738.4
申请日:2017-10-16
Applicant: 北京神州泰岳软件股份有限公司
Abstract: 本申请公开了一种基于语义模型的文本信息抽取方法及装置,该方法包括获取待抽取文本信息;根据抽取表达式和抽取表达式对应的语义模型,对待抽取文本信息进行信息抽取,得到目标信息,抽取表达式包括词性抽取表达式、时间抽取表达式和/或规则抽取表达式,其中,词性抽取表达式对应的语义模型为统计语义模型,时间抽取表达式对应的语义模型为时间语义概念模型,规则抽取表达式对应的语义模型为规则语义模型。本申请可根据不同的抽取需求,设定相应的抽取表达式和语义模型,对该待抽取文本信息进行信息抽取,工作人员无需逐个编写复杂的正则表达式,降低生成难度,提高匹配的灵活度,因此,该方法不仅可以提高抽取效率,并且降低工作人员的工作量。
-
公开(公告)号:CN109213899A
公开(公告)日:2019-01-15
申请号:CN201811168333.X
申请日:2018-10-08
Applicant: 郑州云海信息技术有限公司
IPC: G06F16/80
Abstract: 本申请公开了一种度量文件的管理方法,包括:界面展示度量模板,度量模板为预先根据不同的操作系统制定的,度量模板包括操作系统对应的度量文件。接收度量策略,根据度量策略选择度量模板。对度量模板中的度量文件执行度量操作。本申请实施例还提供相应的度量文件管理的装置以及存储介质。本申请技术方案将不同的操作系统中的度量文件进行模板化管理,当接收到度量策略时,可以根据度量策略选择度量模板,对度量模板包括的度量文件执行度量操作,降低了执行度量操作出现问题的概率。
-
公开(公告)号:CN109165318A
公开(公告)日:2019-01-08
申请号:CN201810914825.2
申请日:2018-08-13
Applicant: 洛阳视距智能科技有限公司
Abstract: 一种面向智能巡检的防振锤数据集构建方法,涉及架空输电线路巡检、人工智能技术领域,具体包括以下步骤:确定需要研究的防振锤型号,针对每个型号的防振锤建立分解关系图,按照从零件到部件、由内到外的原则建立起防振锤在零件、部件、约束关系方面可能发生的故障状态,搜集各型号防振锤的图片,并对图片进行标注,利用标注好的图片建立训练集和测试集,训练集用于防振锤检测和故障诊断算法的训练,测试集用于防振锤检测和故障诊断算法的验证;本发明根据架空输电线路中防振锤的特点、零件组成和可能发生的故障信息,构建一套防振锤数据集,用于训练基于深度学习的防振锤检测和故障诊断算法,同时可用于不同算法的测试和比较。
-
公开(公告)号:CN119583544A
公开(公告)日:2025-03-07
申请号:CN202411485258.5
申请日:2024-10-23
Applicant: 中国科学院深圳先进技术研究院
IPC: H04L67/10 , H04L67/12 , H04L67/1097 , H04L67/568 , H04L9/40 , H04Q9/00 , G16Y20/10 , G16Y40/20 , G06K17/00 , G06F18/10 , G06F18/23 , G06N3/006 , G06F16/2458 , G06F16/27 , G06F16/28 , G06F16/80 , G06F21/62 , G06F123/02
Abstract: 本申请公开了一种标准化云边端互联系统,运用于信息技术领域,其系统包括:服务器和终端设备;终端设备用于传输数据和接收服务器传输的命令进行执行;服务器包括分布式数据接收模块、数据缓存模块、数据优化模块、数据格式化模块;分布式数据接收模块接收并行架构下的集群式数据,分布式数据接收模块与数据缓存模块连接;数据缓存模块将分布式数据接收模块接收的数据存储至内存,间隔预设时间段后再将接收的数据全部入库,数据缓存模块与数据优化模块连接;数据优化模块将接收的数据进行预处理,数据优化模块与数据格式化模块连接;数据格式化模块接收数据优化模块处理后的数据,并将处理后的数据进行格式化,存储至数据库。
-
公开(公告)号:CN119150962A
公开(公告)日:2024-12-17
申请号:CN202411229090.1
申请日:2024-09-03
Applicant: 国网智能电网研究院有限公司 , 中国电力科学研究院有限公司 , 国网江苏省电力有限公司 , 国网江苏省电力有限公司南通供电分公司
IPC: G06N5/02 , G06F16/80 , G06F18/25 , G06F18/2415 , G06V30/148 , G06N3/0455 , G06N3/096
Abstract: 本发明公开一种私域半结构化知识表示方法、系统及相关装置,属于自然语言处理技术领域,方法包括:获取的表格文本序列;利用OCR或文档解析获取所述表格文本序列的Markdown形式文本序列,并利用启发式规则进行粗粒度的表格格式修正;采用预先训练的表格类别判别模型对格式修正后的表格进行类别判定,得到分类结果和类别概率;根据所述分类结果和类别概率,并利用教师模型进行表格知识蒸馏得到表格知识文本;基于模型自检的投票机制,从所述表格知识文本中投票出教师模型最认可的表格知识的最后文本表示。该方法提高了私域半结构化知识表示的完整性和准确性,对表格知识候选进行打分,增加了方法的容错,提升了鲁棒性。
-
公开(公告)号:CN119005126A
公开(公告)日:2024-11-22
申请号:CN202310566471.8
申请日:2023-05-18
Applicant: 腾讯科技(深圳)有限公司
Inventor: 金元浩
IPC: G06F40/14 , G06F16/80 , G06F40/106 , G06F40/186
Abstract: 本申请公开了一种HTML文件生成方法、装置、电子设备及存储介质。本申请的实施例涉及云技术等技术领域。该方法包括:获取待处理PDF文件;若待处理PDF文件包括文本信息,从文本信息中获取原语以及原语的原语值;根据原语以及原语的原语值,确定目标元素以及目标元素的元素属性;根据目标元素以及目标元素的元素属性,确定文本HTML元素;根据预置模板以及文本HTML元素,生成HTML文件。本申请实施例中,对包括的文本信息进行处理以生成文本HTML元素,再根据文本HTML元素以及预置模板生成HTML文件,极大地减少了获得的HTML文件中数据丢失的情况发生,提高了HTML文件的准确率。
-
公开(公告)号:CN113227998B
公开(公告)日:2024-10-22
申请号:CN201980084880.6
申请日:2019-12-18
Applicant: 甲骨文国际公司
Abstract: 本发明涉及数据库中文档的数据网格的自主调谐。本文是用于存储单元格自主维护本地索引以及其它优化元数据和算法以加速对文档的分布式集合的选择性访问的技术。在实施例中,每个存储单元格持久化文档的相应子集。每个存储单元格在存储器中存储将每个项目映射到相应文档子集的一个或多个文档中该项目出现的(一个或多个)位置的(一个或多个)相应索引。一个或多个计算机至少基于存储单元格的索引的子集来执行来自数据库管理系统的数据访问请求。在实施例中,JSON文档服务的云提供易于使用的、完全自主的JSON文档数据库,该数据库可以水平和弹性地伸缩以交付文档事务和查询的快速执行,而无需数据库管理员进行调谐。
-
公开(公告)号:CN115061683B
公开(公告)日:2024-09-27
申请号:CN202210677646.8
申请日:2022-06-15
Applicant: 山信软件股份有限公司
Abstract: 本申请实施例提供的一种基于XML的通用功能配置系统及方法,系统包括信息系统客户端、信息系统服务器和数据服务器,信息系统服务器包括通用功能模块、XML配置文件、XML文件解析模块、数据处理模块和页面视图解析模块,信息系统客户端与信息系统服务器通讯连接,XML文件解析模块与XML配置文件通讯连接,数据处理模块与数据服务器、通用功能模块、XML文件解析模块和页面视图解析模块均通讯连接。通过XML配置文件描述了页面视图所需展现的内容,所有内容均以XML节点属性的形式呈现,且集成了信息系统的通用功能,实现了菜单的灵活配置。便于快速实现信息系统的开发,减少了软件开发和交付周期,提高了开发效率。
-
公开(公告)号:CN118153540A
公开(公告)日:2024-06-07
申请号:CN202410234899.7
申请日:2024-03-01
Applicant: 山东浪潮科学研究院有限公司
IPC: G06F40/186 , G06F16/80 , G06F8/38 , G06F18/10 , G06F18/214
Abstract: 本申请涉及计算机软件自动化技术领域,涉及一种基于组件工厂快速生成表单的方法及装置、介质。所述方法包括:分析业务需求,注册组件进行定义表单组件,并建立组件库为组件定义输入要求、属性设置和数据验证规则;构建组件工厂生成表单的各个组件;设计表单模板用于描述生成表单的结构和布局;根据表单模板和组件工厂使用编程语言动态生成表单;为生成的表单添加验证逻辑,确保用户输入的数据符合要求;对表单应用和预测进行训练和测试后将表单应用和预测部署至生产环境。本发明通过使用预定义的组件库和自动化的表单生成算法,能够快速生成符合需求的表单,并提供灵活的定制化选项。
-
-
-
-
-
-
-
-
-