-
公开(公告)号:CN117608545B
公开(公告)日:2024-05-10
申请号:CN202410065354.8
申请日:2024-01-17
Applicant: 之江实验室
IPC: G06F8/30 , G06F16/36 , G06V30/41 , G06V30/418 , G06V30/413 , G06V30/162 , G06V30/19 , G06V30/146
Abstract: 本发明涉及一种基于知识图谱的标准作业程序生成方法,包括以下步骤:对标准作业程序进行知识图谱的本体设计;对不同类型的标准作业程序文档进行知识抽取的模板标注;基于OCR技术,对标准作业程序文档中的信息进行自动知识抽取;将抽取出的知识与本体概念对齐;构建出每个概念下的实体表;构建用于描述实体间关系的关系表;基于实体表和关系表,进行实体对齐处理;通过Neo4j构建出用于用户查询的图数据库服务。与现有技术相比,本发明将纸质或电子文档形式的标准作业程序数字化,能够有效实现标准作业程序的内容知识化、应用智能化。
-
公开(公告)号:CN116049371A
公开(公告)日:2023-05-02
申请号:CN202310119450.1
申请日:2023-01-18
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/34 , G06F16/54 , G06F16/35 , G06F16/532 , G06F18/214 , G06V10/774
Abstract: 本发明公开了一种基于正则化和对偶学习的视觉问答方法与装置,所述方法具体包括以下子步骤:提取VQA数据集中问题的关键词;对图像数据预处理,筛选图像中的关键区域;将关键词和图像中的关键区域输入至VQA、VQG模型进行预训练;构建视觉蕴涵模型,并进行预训练;利用视觉蕴涵模型进行相关性判断,构建训练样本,基于正则化和对偶学习对预训练好的VQA和VQG模型进行协同训练;利用训练好的VQA和VQG模型进行视觉问答。
-
公开(公告)号:CN117668156A
公开(公告)日:2024-03-08
申请号:CN202311607976.0
申请日:2023-11-29
IPC: G06F16/33 , G06F16/35 , G06F40/295 , G06F40/216 , G06F18/24 , G06N3/0464 , G06N3/048 , G06N3/08 , G06N7/01
Abstract: 本发明公开了一种基于标准知识图谱的文本提取方法,包括获取待提取文本,对所述待提取文本进行预处理,提取预处理后的所述待提取文本的关键词,将所述关键词输入识别模型识别命名实体,计算所述命名实体与现有知识图谱实体的相关性,根据所述相关性对所述命名实体与现有的知识图谱实体进行匹配,根据所述匹配获得链接实体,将所述链接实体输入第一算法抽取初始属性,将所述初始属性输入第二算法抽取属性,根据所述属性抽取实体之间的关系,根据所述关系对实体进行聚类,根据所述聚类进行文本提取。该方法不仅可以提高文本提取精度,同时具有较好的可解释性,可以直接应用于标准知识图谱文本提取系统中。
-
公开(公告)号:CN117608545A
公开(公告)日:2024-02-27
申请号:CN202410065354.8
申请日:2024-01-17
Applicant: 之江实验室
IPC: G06F8/30 , G06F16/36 , G06V30/41 , G06V30/418 , G06V30/413 , G06V30/162 , G06V30/19 , G06V30/146
Abstract: 本发明涉及一种基于知识图谱的标准作业程序生成方法,包括以下步骤:对标准作业程序进行知识图谱的本体设计;对不同类型的标准作业程序文档进行知识抽取的模板标注;基于OCR技术,对标准作业程序文档中的信息进行自动知识抽取;将抽取出的知识与本体概念对齐;构建出每个概念下的实体表;构建用于描述实体间关系的关系表;基于实体表和关系表,进行实体对齐处理;通过Neo4j构建出用于用户查询的图数据库服务。与现有技术相比,本发明将纸质或电子文档形式的标准作业程序数字化,能够有效实现标准作业程序的内容知识化、应用智能化。
-
公开(公告)号:CN117576703A
公开(公告)日:2024-02-20
申请号:CN202311607242.2
申请日:2023-11-29
IPC: G06V30/19 , G06V30/262 , G06V30/164 , G06V30/162 , G06V30/148 , G06F16/33 , G06F16/35 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种数字标准文献OCR自动识别的方法,包括获取文献图片,对所述文献图片进行预处理,提取预处理后的所述文献图片的文本,对所述文本进行去停用词和分词处理获得多个初始词,根据多个所述初始词提取关键词,计算文本的所述关键词相似度,根据所述相似度构建卷积神经网络模型,优化所述卷积神经网络模型,调整优化后的所述卷积神经网络模型的权重,将不同初始词所述关键词输入所述卷积神经网络模型,按相似度大于0.85对所述文本进行分类并存储,输出分类结果。该方法不仅可以提高自动识别精度,同时具有较好的可解释性,可以直接应用于数字标准文献OCR自动识别系统中。
-
-
-
-