一种基于隐马尔可夫模型的井下预警方法

    公开(公告)号:CN109902265B

    公开(公告)日:2022-07-22

    申请号:CN201910150450.1

    申请日:2019-02-28

    IPC分类号: G06F17/18 G06K9/62

    摘要: 本发明公开了一种基于隐马尔可夫模型的井下预警方法,其包括以下步骤:S1、获取初始样本数据;S2、预测下一时间段的数据;S3、挑选真实数据并纳入事故候选集合;S4、获取与每一时间段内的真实数据相对应的真实事故状态;S5、获取与初始样本数据相对应的真实事故状态序列;S6、采用隐马尔可夫模型建立初始预警模型,对初始预警模型进行训练,得到训练后的预警模型;S7、实时获取目标钻井所产生的数据,并将其作为训练后预警模型的输入,通过训练后的预警模型进行实时预警。本发明可以有效提高井下预测的全面性,使得预测结果更加准确。

    一种基于汉字属性向量表示的文本相似性计算方法及系统

    公开(公告)号:CN106874258B

    公开(公告)日:2020-04-07

    申请号:CN201710083030.7

    申请日:2017-02-16

    IPC分类号: G06F40/30 G06F40/194

    摘要: 本发明公开了一种基于汉字属性向量表示的文本相似性计算方法及系统,所述的方法包括以下步骤:S1.基于汉字属性的向量表示构建文本相似性计算模型;S2.基于带标注的短文本集,对构建的相似性计算模型进行训练以获取模型的参数,得到成熟的文本相似性计算模型;S3.将待计算相似度的短文本消息输入成熟的文本相似性计算模型中,得到短文本对之间的相似性,并结果并反馈给用户。本发明提供一种基于汉字属性向量表示的文本相似性计算方法及系统,能够得到准确有效的短文本分析结果,有利于从海量短文本消息中挖掘出有价值的信息,方便于用户使用。

    一种基于隐马尔可夫模型的井下预警方法

    公开(公告)号:CN109902265A

    公开(公告)日:2019-06-18

    申请号:CN201910150450.1

    申请日:2019-02-28

    IPC分类号: G06F17/18 G06K9/62

    摘要: 本发明公开了一种基于隐马尔可夫模型的井下预警方法,其包括以下步骤:S1、获取初始样本数据;S2、预测下一时间段的数据;S3、挑选真实数据并纳入事故候选集合;S4、获取与每一时间段内的真实数据相对应的真实事故状态;S5、获取与初始样本数据相对应的真实事故状态序列;S6、采用隐马尔可夫模型建立初始预警模型,对初始预警模型进行训练,得到训练后的预警模型;S7、实时获取目标钻井所产生的数据,并将其作为训练后预警模型的输入,通过训练后的预警模型进行实时预警。本发明可以有效提高井下预测的全面性,使得预测结果更加准确。

    一种基于汉字属性向量表示的文本相似性计算方法及系统

    公开(公告)号:CN106874258A

    公开(公告)日:2017-06-20

    申请号:CN201710083030.7

    申请日:2017-02-16

    IPC分类号: G06F17/27 G06F17/22

    摘要: 本发明公开了一种基于汉字属性向量表示的文本相似性计算方法及系统,所述的方法包括以下步骤:S1.基于汉字属性的向量表示构建文本相似性计算模型;S2.基于带标注的短文本集,对构建的相似性计算模型进行训练以获取模型的参数,得到成熟的文本相似性计算模型;S3.将待计算相似度的短文本消息输入成熟的文本相似性计算模型中,得到短文本对之间的相似性,并结果并反馈给用户。本发明提供一种基于汉字属性向量表示的文本相似性计算方法及系统,能够得到准确有效的短文本分析结果,有利于从海量短文本消息中挖掘出有价值的信息,方便于用户使用。

    一种基于分布式的舆情数据实时采集方法和系统

    公开(公告)号:CN106096056B

    公开(公告)日:2019-11-26

    申请号:CN201610502047.7

    申请日:2016-06-30

    IPC分类号: G06F16/951

    摘要: 本发明公开了一种基于分布式的舆情数据实时采集方法及系统,方法包括以下步骤:S1:建立舆情数据网站类库,分类并定义爬取数据项;S2:将数据采集网站列表传输给数据采集服务器,服务器分配相应的爬虫以休眠的模式循环地爬取数据;S3:对爬取到的源网页数据进行标签解析,定位目标数据项位置获取目标数据项;S4:将获取到的结果数据项封装成对应类的统一格式;S5:将封装后的数据存入对应的数据库;S6:生成监测日志文件。本发明架构先进,通过使用工厂模式作为系统的主要设计模式,能够快速生成新实例,将浏览器访问、日志生成、数据封装、代理设置以及队列设置等系统核心功能封装起来,增强系统的可扩展性和可移植性,提高代码的可重用性和系统的可维护性。

    一种基于分布式的舆情数据实时采集方法和系统

    公开(公告)号:CN106096056A

    公开(公告)日:2016-11-09

    申请号:CN201610502047.7

    申请日:2016-06-30

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种基于分布式的舆情数据实时采集方法及系统,方法包括以下步骤:S1:建立舆情数据网站类库,分类并定义爬取数据项;S2:将数据采集网站列表传输给数据采集服务器,服务器分配相应的爬虫以休眠的模式循环地爬取数据;S3:对爬取到的源网页数据进行标签解析,定位目标数据项位置获取目标数据项;S4:将获取到的结果数据项封装成对应类的统一格式;S5:将封装后的数据存入对应的数据库;S6:生成监测日志文件。本发明架构先进,通过使用工厂模式作为系统的主要设计模式,能够快速生成新实例,将浏览器访问、日志生成、数据封装、代理设置以及队列设置等系统核心功能封装起来,增强系统的可扩展性和可移植性,提高代码的可重用性和系统的可维护性。

    一种实时关联事件新闻推荐方法及系统

    公开(公告)号:CN106202563A

    公开(公告)日:2016-12-07

    申请号:CN201610622291.7

    申请日:2016-08-02

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30867

    摘要: 本发明公开了一种实时关联事件新闻推荐方法及系统,方法包括:1)对于每日发生的新闻,以及对应的微博等各大论坛上的评论进行数据爬取,建立新闻库;2)对新闻库中数据进行深度挖掘,建立相应的事件模型,并保存在事件库中;3)对用户正在浏览的新闻数据进行爬取,涉及新闻的内容、标题、所发布的网站等信息;4)把用户正在浏览的信息和事件库中的数据进行对比,匹配出此新闻的整个事件模型和相关的分析结果,并以直观方式推荐给用户。通过本发明提供的方法和装置,可以使用户高效实时了解与某新闻相关的关联事件的整个经过,起源,现状等详情,并推送相关的新闻链接给用户。