-
公开(公告)号:CN114117292A
公开(公告)日:2022-03-01
申请号:CN202111298638.4
申请日:2021-11-04
Applicant: 中通服咨询设计研究院有限公司
IPC: G06F16/958 , G06F16/953 , G06F16/906
Abstract: 本发明提供了一种互联网大数据分析提取方法,包括:步骤1、根据数据的特点,将数据对象划分为不同的部分和类型,得到所要提取的数据范围;步骤2、建立回归模型,并根据实测数据来求解模型的各参数,然后评价回归模型是否能够拟合实测数据,如果能够拟合,则根据自变量作进一步缩小所要提取的数据范围;步骤3、根据数据的特征属性将数据分成两个以上聚合类,每一个聚合类中的元素具有相同的特性,对所要抓取的数据进行分组;步骤4、采用相似匹配法来计算两个数据的相似程度;步骤5、用词频作为统计指标,表明数据所反馈的数据段信息;步骤6、得到数据分析结果。本发明利用基于嵌入映射的表征学习算法自动完成,计算效率高。
-
公开(公告)号:CN114117292B
公开(公告)日:2024-04-16
申请号:CN202111298638.4
申请日:2021-11-04
Applicant: 中通服咨询设计研究院有限公司
IPC: G06F16/958 , G06F16/953 , G06F16/906
Abstract: 本发明提供了一种互联网大数据分析提取方法,包括:步骤1、根据数据的特点,将数据对象划分为不同的部分和类型,得到所要提取的数据范围;步骤2、建立回归模型,并根据实测数据来求解模型的各参数,然后评价回归模型是否能够拟合实测数据,如果能够拟合,则根据自变量作进一步缩小所要提取的数据范围;步骤3、根据数据的特征属性将数据分成两个以上聚合类,每一个聚合类中的元素具有相同的特性,对所要抓取的数据进行分组;步骤4、采用相似匹配法来计算两个数据的相似程度;步骤5、用词频作为统计指标,表明数据所反馈的数据段信息;步骤6、得到数据分析结果。本发明利用基于嵌入映射的表征学习算法自动完成,计算效率高。
-