-
公开(公告)号:CN112100260A
公开(公告)日:2020-12-18
申请号:CN202010952268.0
申请日:2020-09-11
Applicant: 山东亿云信息技术有限公司
Abstract: 本公开提出了一种基于接口引擎的多应用数据融合的方法及系统,包括:利用业务事项模板配置业务事项属性,接口引擎根据业务事项属性动态读取应用接口,解析为统一办理事项的门户可展示的数据格式即形成统一标准接口;调用统一标准接口至用户统一事项办理门户进行业务事项的融合展示。本公开技术方案解决了多个应用业务事项数据融合,实现多应用业务事项数据融合提供给用户统一办理事项的门户,能有效提高用户办理业务事项的效率。
-
公开(公告)号:CN111966901A
公开(公告)日:2020-11-20
申请号:CN202010825873.1
申请日:2020-08-17
Applicant: 山东亿云信息技术有限公司
IPC: G06F16/9535 , G06F16/955 , G06F16/958
Abstract: 本发明公开了政策类网页正文提取方法、系统、设备及存储介质,包括:获取政策网页HTML源代码;根据政策网页HTML源代码,获取网页正文所在的位置;根据网页正文所在的位置,获取正文所对应的HTML源代码,输出正文所对应的HTML源代码。过分析政策网页的页面组织结构规则,构建网页组织结构和网页正文位置的关系,获取网页正文内容。从而实现对政策类网页正文的快速、有效提取。本发明的实施使得政策类网页正文的提取实现了快速、高效获取,大大提高了工作效率,节省公司的人力成本,同时经验证,该发明也取得较高的准确率。
-
公开(公告)号:CN112883165B
公开(公告)日:2022-12-02
申请号:CN202110281426.9
申请日:2021-03-16
Applicant: 山东亿云信息技术有限公司
IPC: G06F16/33 , G06F40/211 , G06F40/289 , G06F40/30
Abstract: 本发明公开了一种基于语义理解的智能全文检索方法及系统,包括:将接收到的搜索语句切割为短文本,对短文本进行分词操作,得到短文本对应的分词库;构建短文本的语义信息向量和依存关系向量;所述语义信息向量包括短文本的中心词和词义共现词;基于短文本的语义信息向量和依存关系向量,将短文本信息与智能索引库中的相关信息进行相似度计算,进而得到搜索结果集。本发明通过将原始数据拆分为多个短文本,形成搜索文本向量,通过调用人工智能平台的语义理解接口对搜索文本和索引库文本相似度计算,能够提高全文检索的准确性。
-
公开(公告)号:CN112926320A
公开(公告)日:2021-06-08
申请号:CN202110316125.5
申请日:2021-03-24
Applicant: 山东亿云信息技术有限公司
IPC: G06F40/289 , G06F40/268 , G06F40/30 , G06F40/205
Abstract: 本公开公开的一种基于主题词优化的文本关键内容智能抽取方法级系统,包括:获取待识别文本;对待识别文本进行篇章级分词,获取篇章级词语和每个篇章级词语的权重;对待识别文本进行段落级分词,获取段落级词语和每个段落级词语的词性;将篇章级词语及权重与段落级词语及词性进行匹配,输出包含词语、词性、权重的元组;将包含词语、词性、权重的元组与关键短语规则库进行匹配,获得符合规则的关键短语;根据关键短语,获取文本关键内容。实现了对待识别文本关键内容的准确提取。
-
公开(公告)号:CN112364047A
公开(公告)日:2021-02-12
申请号:CN202011210164.9
申请日:2020-11-03
Applicant: 山东亿云信息技术有限公司
IPC: G06F16/242 , G06F16/2455 , G06F16/23 , G06F16/27
Abstract: 本公开提供了一种基于Presto的动态数据处理方法及跨库查询方法,所述跨库查询方法包括以下步骤:采用至少一种数据库类型进行数据源信息存储,指定自定义表;使用CANAL组件对自定义表进行监听,实时获取数据源注册信息;对数据源注册表的添加、删除或修改的信息通过CANAL传递给Presto并转化为Presto能够识别的catalogConfig格式;通过得到的catalogConfig格式的数据,动态实现Presto的数据源增加或删除或修改;本公开支持Presto通过jdbc的方式使用ANSI_SQL的方式来对多源异构数据进行查询,解决了对存储在不同数据结构上的数据融合处理问题,提高了跨库数据查询和处理的效率。
-
公开(公告)号:CN111966930A
公开(公告)日:2020-11-20
申请号:CN202010825868.0
申请日:2020-08-17
Applicant: 山东亿云信息技术有限公司
IPC: G06F16/955 , G06F16/958 , G06F40/14
Abstract: 本发明公开了基于XPath序列的网页列表解析方法及系统,包括:根据URL获取网页的HTML源代码;根据网页的HTML源代码,生成DOM Tree;根据DOM Tree,获取网页中列表项的候选路径;从候选路径中筛选出列表项的简化XPath路径,建立候选简化XPath路径与标签label的字典;根据简化XPath路径与标签label的字典,获取网页列表项的结果。
-
-
-
-
-