云存储系统中一种基于气候季节的细粒度能耗感知框架

    公开(公告)号:CN115357187A

    公开(公告)日:2022-11-18

    申请号:CN202210950209.9

    申请日:2022-08-15

    Abstract: 本发明涉及存储系统领域中的绿色存储技术以及自然语言处理领域中的数据语义挖掘技术,针对存储系统中数据语义的挖掘,采用多特征融合方法,提升了现有基于单一特征在数据布局策略上的不足,包括以下步骤:(一)、设定实验所需200个访问关键词;(二)、将中国34个省级行政区,按标准划分为四季分明区、夏长冬短区、冬长夏短区和其他区;(三)、获取每个气候区中200个关键词3年每日的访问记录;(四)、利用K‑means聚类,确定关键词在不同气候区的季节属性;(五)、构建存储系统能耗和成本模型,得到不同粒度框架下的能耗和成本。本发明融合“季节+地域”特征,充分提取关键词的季节属性,能够更为有效地降低存储能耗和成本。

    一种融合知识信息的领域专利质量等级预测方法

    公开(公告)号:CN115204519A

    公开(公告)日:2022-10-18

    申请号:CN202210972465.8

    申请日:2022-08-17

    Abstract: 本发明涉及自然语言处理领域的专利质量等级预测研究,其主要步骤如下:1.利用融合多特征的功效词抽取模型对功效短语进行识别;2.基于Albert‑BiLSTM模型对专利文本中包含的主题词进行抽取;3.将抽取完成的功效短语与主题词用K‑means算法进行聚类,人工构建技术功效矩阵,得到相应的技术功效与技术规模;4.将专利中包含的结构化数字信息单独量化或组合,结合长文本得到132个评价指标,并利用美国专利数据训练一个迁移学习模型,同时利用主动学习技术进行中文数据集的扩充;5.将技术功效矩阵与132个指标相结合进行迁移训练并更新参数,得到最终的预测模型。本发明有效提升了专利质量评估的准确性。

Patent Agency Ranking