政策类网页正文提取方法、系统、设备及存储介质

    公开(公告)号:CN111966901B

    公开(公告)日:2021-04-20

    申请号:CN202010825873.1

    申请日:2020-08-17

    Abstract: 本发明公开了政策类网页正文提取方法、系统、设备及存储介质,包括:获取政策网页HTML源代码;根据政策网页HTML源代码,获取网页正文所在的位置;根据网页正文所在的位置,获取正文所对应的HTML源代码,输出正文所对应的HTML源代码。过分析政策网页的页面组织结构规则,构建网页组织结构和网页正文位置的关系,获取网页正文内容。从而实现对政策类网页正文的快速、有效提取。本发明的实施使得政策类网页正文的提取实现了快速、高效获取,大大提高了工作效率,节省公司的人力成本,同时经验证,该发明也取得较高的准确率。

    一种基于分布式的一站式采集方法及采集系统

    公开(公告)号:CN112100495B

    公开(公告)日:2024-04-16

    申请号:CN202010960596.5

    申请日:2020-09-14

    Abstract: 本公开提出了一种基于分布式的一站式采集方法及系统,包括:分布式采集集群构建:将集群服务器添加到采集集群中,并添加采集应用至集群服务器中;全网采集:集群服务器接收所需采集的网站,进行全网数据采集,并对网站中的列表页数据进行过滤;解析:对过滤后的列表页进行解析,获取列表页网站规则以及列表页中详情页的规则;采集任务配置:配置增量采集和全量采集所需的采集应用,然后启动增量采集和全量采集。用户可根据采集需求自定义分配采集资源,采集任务结束后自动释放采集资源,有效的提高了采集效率。

    一种基于区块链的可信交易和服务信誉评价方法

    公开(公告)号:CN113240427A

    公开(公告)日:2021-08-10

    申请号:CN202110540666.6

    申请日:2021-05-18

    Abstract: 本发明公开了一种基于区块链的可信交易和服务信誉评价方法,首先通过认证系统进行实名认证。然后通过数据发布系统对交易信息进行发布。在发布交易信息中,需要对交易信息进行二次认证。双方达成初步意愿后,通过信息采集平台对进行二次认证,并通过担保平台和支付平台进行支付。在交易过程中,交易流程模块构建流程状态图,实施追踪交易进展情况。完成交易后,通过综合反馈模块对发布信息人和需求信息人进行二次评价分数统计。与现有技术相比本发明的有益效果是:通过多级评价方案对相关信息进行综合评分,以保证信息的可靠性和真实性,在费用支付上采用多级担保的方式,提高双方交易的可信赖度,促进交易的成功转换。

    一种基于分布式的一站式采集方法及采集系统

    公开(公告)号:CN112100495A

    公开(公告)日:2020-12-18

    申请号:CN202010960596.5

    申请日:2020-09-14

    Abstract: 本公开提出了一种基于分布式的一站式采集方法及系统,包括:分布式采集集群构建:将集群服务器添加到采集集群中,并添加采集应用至集群服务器中;全网采集:集群服务器接收所需采集的网站,进行全网数据采集,并对网站中的列表页数据进行过滤;解析:对过滤后的列表页进行解析,获取列表页网站规则以及列表页中详情页的规则;采集任务配置:配置增量采集和全量采集所需的采集应用,然后启动增量采集和全量采集。用户可根据采集需求自定义分配采集资源,采集任务结束后自动释放采集资源,有效的提高了采集效率。

    一种信息资源服务平台架构系统

    公开(公告)号:CN113240393A

    公开(公告)日:2021-08-10

    申请号:CN202110541150.3

    申请日:2021-05-18

    Abstract: 本发明公开了一种信息资源服务平台架构系统,包括运营平台、用户端口、中介服务端口、科技创新监管中心;用户端口包括企业端口、高校端口和个人端口;运营平台包括信息维护中心、大数据处理中心、流程监管中心、支付运营中心、登录服务中心;中介服务端口包括第三方科技服务单元、第三方融资单元和中介服务平台;科技创新监管中心包括创新统计中心、交易监控中心和第三方监管中心。与现有技术相比本发明的有益效果是:集成了多方的一体系构建平台,包括企业、个人、高校、科技服务机构以及监管部门,通过平台统一正规化管理,降低风险预算,促进成果转化,为成果的落地形成提供强有力的支撑。

    一种基于语义理解的智能全文检索方法及系统

    公开(公告)号:CN112883165A

    公开(公告)日:2021-06-01

    申请号:CN202110281426.9

    申请日:2021-03-16

    Abstract: 本发明公开了一种基于语义理解的智能全文检索方法及系统,包括:将接收到的搜索语句切割为短文本,对短文本进行分词操作,得到短文本对应的分词库;构建短文本的语义信息向量和依存关系向量;所述语义信息向量包括短文本的中心词和词义共现词;基于短文本的语义信息向量和依存关系向量,将短文本信息与智能索引库中的相关信息进行相似度计算,进而得到搜索结果集。本发明通过将原始数据拆分为多个短文本,形成搜索文本向量,通过调用人工智能平台的语义理解接口对搜索文本和索引库文本相似度计算,能够提高全文检索的准确性。

Patent Agency Ranking