-
公开(公告)号:CN114528518A
公开(公告)日:2022-05-24
申请号:CN202210174594.2
申请日:2022-02-24
Applicant: 山东亿云信息技术有限公司
IPC: G06F16/958 , G06F16/951
Abstract: 本发明提出了一种基于web端的流程图自动布局方法及系统,包括:获得web端流程图的每个节点的坐标及相关参数,输出每个节点的Y轴对称布局后的横坐标及纵坐标;对任意流程图进行Y轴对称布局之后统计当前流程图中连线的交叉点个数,记为第一数值,进入条件循环,记录当前节点排序后,通过邻域权重启发算法对当前节点进行顺序重排,重新按照Y轴进行对称布局之后再次统计节点连线交叉点个数并将其设置为第一数值,进入下次循环;基于Y轴对称布局后的横坐标及纵坐标,在渲染层中绘制流程图。布局后各业务线之间各节点之间的逻辑关系更加清晰,便于业务开发人员理解各部门之间的业务关系,提升各部门间数据的数据共享质量。
-
公开(公告)号:CN111966901B
公开(公告)日:2021-04-20
申请号:CN202010825873.1
申请日:2020-08-17
Applicant: 山东亿云信息技术有限公司
IPC: G06F16/9535 , G06F16/955 , G06F16/958
Abstract: 本发明公开了政策类网页正文提取方法、系统、设备及存储介质,包括:获取政策网页HTML源代码;根据政策网页HTML源代码,获取网页正文所在的位置;根据网页正文所在的位置,获取正文所对应的HTML源代码,输出正文所对应的HTML源代码。过分析政策网页的页面组织结构规则,构建网页组织结构和网页正文位置的关系,获取网页正文内容。从而实现对政策类网页正文的快速、有效提取。本发明的实施使得政策类网页正文的提取实现了快速、高效获取,大大提高了工作效率,节省公司的人力成本,同时经验证,该发明也取得较高的准确率。
-
公开(公告)号:CN114494506B
公开(公告)日:2025-02-07
申请号:CN202111533968.7
申请日:2021-12-15
Applicant: 山东亿云信息技术有限公司
IPC: G06F17/00
Abstract: 本发明提供了一种有向无环图中回路的判断方法及系统,获取连线请求,根据已有的连线集合与节点集合,计算更新各节点的出度和入度;从每一个出度为设定值的节点出发,循环执行接收当前节点一个参数,检测当前节点是否存在于深度优先遍历所生成的分支栈中,如果不存在则将当前节点推入分支栈,通过连线集合与节点集合寻找当前节点各子下级节点,形成子分支,直至当前节点为终节点时向上递归,栈顶元素出栈;如果所述栈顶元素在分支栈中存在即说明有环,不将相应的连线加入连线集合中,否则继续深度优先遍历。本发明的实现过程无需前后端数据交换,减轻了服务端的流量压力,具有准确性;有效提升用户体验感。
-
公开(公告)号:CN114528518B
公开(公告)日:2025-01-28
申请号:CN202210174594.2
申请日:2022-02-24
Applicant: 山东亿云信息技术有限公司
IPC: G06F16/958 , G06F16/951
Abstract: 本发明提出了一种基于web端的流程图自动布局方法及系统,包括:获得web端流程图的每个节点的坐标及相关参数,输出每个节点的Y轴对称布局后的横坐标及纵坐标;对任意流程图进行Y轴对称布局之后统计当前流程图中连线的交叉点个数,记为第一数值,进入条件循环,记录当前节点排序后,通过邻域权重启发算法对当前节点进行顺序重排,重新按照Y轴进行对称布局之后再次统计节点连线交叉点个数并将其设置为第一数值,进入下次循环;基于Y轴对称布局后的横坐标及纵坐标,在渲染层中绘制流程图。布局后各业务线之间各节点之间的逻辑关系更加清晰,便于业务开发人员理解各部门之间的业务关系,提升各部门间数据的数据共享质量。
-
公开(公告)号:CN115525719A
公开(公告)日:2022-12-27
申请号:CN202211212514.4
申请日:2022-09-29
Applicant: 山东亿云信息技术有限公司
IPC: G06F16/27 , H04L67/1095
Abstract: 本发明提供了一种异构数据增量同步及断点续传的方法,通过增量同步的初始值及结束值的逻辑判断,判断出增量同步需要的真正初始值和真正结束值,通过方言转换器转换成对应的where条件和presql预执行sql,并传递给Datax;将Datax发布到调度平台中以实现周期性的增量同步;插入状态表,记录每次周期同步的情况并复用Datax的日志组件以实现对于同步日志的查看;本发明保证不出现数据丢失、数据重复的情况下的离线增量同步,实现了针对异常情况下的断点续传功能。
-
公开(公告)号:CN113392354B
公开(公告)日:2022-09-13
申请号:CN202110719543.9
申请日:2021-06-28
Applicant: 山东亿云信息技术有限公司
IPC: G06F16/958
Abstract: 本公开提供了一种网页正文解析方法、系统、介质及电子设备,获取网页HTML源代码;对网页HTML源代码进行预处理;根据预处理后的网页HTML源代码生成文档对象模型树;根据获取的文档对象模型树,定位发文日期所在的块并获取其节点;根据发文日期块节点获取正文块节点;根据正文块节点获取正文块XPath及正文块HTML;本公开解决了低密度网页正文提取的问题,提升了网页正文的提取准确率,提高了工作效率,节省了人力成本。
-
公开(公告)号:CN113408290A
公开(公告)日:2021-09-17
申请号:CN202110730230.3
申请日:2021-06-29
Applicant: 山东亿云信息技术有限公司
IPC: G06F40/295 , G06F3/0484
Abstract: 本发明公开了一种针对中文文本的智能标注方法及系统,所述方法包括:获取待标注数据集,以及待标注的实体和关系标签;基于实体关系抽取模型,对待标注数据集进行实体和关系识别,得到预标注结果;接收用户对预标注结果的修正,完成标注。本发明通过模型进行实体关系的识别,得到预标注结果,然后基于预标注结果,给出了一种基于可交互页面的人工标注方法,保证了实体和关系标注的精度。
-
公开(公告)号:CN113392354A
公开(公告)日:2021-09-14
申请号:CN202110719543.9
申请日:2021-06-28
Applicant: 山东亿云信息技术有限公司
IPC: G06F16/958
Abstract: 本公开提供了一种网页正文解析方法、系统、介质及电子设备,获取网页HTML源代码;对网页HTML源代码进行预处理;根据预处理后的网页HTML源代码生成文档对象模型树;根据获取的文档对象模型树,定位发文日期所在的块并获取其节点;根据发文日期块节点获取正文块节点;根据正文块节点获取正文块XPath及正文块HTML;本公开解决了低密度网页正文提取的问题,提升了网页正文的提取准确率,提高了工作效率,节省了人力成本。
-
公开(公告)号:CN112395860A
公开(公告)日:2021-02-23
申请号:CN202011354524.2
申请日:2020-11-27
Applicant: 山东省计算中心(国家超级计算济南中心) , 山东亿云信息技术有限公司
IPC: G06F40/211 , G06F40/284 , G06F16/36 , G06N5/02
Abstract: 本发明提供了一种大规模并行政策数据知识抽取方法及系统,本发明通过对政策数据进行正文内容解析,获得政策正文数据列表,分别进行政策发文机构、发布日期知识抽取、政策申报截止日期知识抽取以及政策事件知识抽取,从而实现政策数据的知识抽取。本发明实现依存句法分析模型预加载,达到模型加载一次,多次使用的效果,提高知识抽取的效率,无需使用人工对知识进行抽取,节省人力成本,提高效率,适用于信息量巨大的网络信息获取。
-
公开(公告)号:CN111966901A
公开(公告)日:2020-11-20
申请号:CN202010825873.1
申请日:2020-08-17
Applicant: 山东亿云信息技术有限公司
IPC: G06F16/9535 , G06F16/955 , G06F16/958
Abstract: 本发明公开了政策类网页正文提取方法、系统、设备及存储介质,包括:获取政策网页HTML源代码;根据政策网页HTML源代码,获取网页正文所在的位置;根据网页正文所在的位置,获取正文所对应的HTML源代码,输出正文所对应的HTML源代码。过分析政策网页的页面组织结构规则,构建网页组织结构和网页正文位置的关系,获取网页正文内容。从而实现对政策类网页正文的快速、有效提取。本发明的实施使得政策类网页正文的提取实现了快速、高效获取,大大提高了工作效率,节省公司的人力成本,同时经验证,该发明也取得较高的准确率。
-
-
-
-
-
-
-
-
-