多入口数据缓存方法及存储介质

    公开(公告)号:CN111090675A

    公开(公告)日:2020-05-01

    申请号:CN201911154529.8

    申请日:2019-11-22

    Abstract: 一种多入口数据缓存方法及存储介质,其中方法包括如下步骤,拦截原缓存调用请求,根据该缓存调用请求生成密钥KEY,所述密钥KEY的生成规则为:入口平台代码+命名空间+类名+命名空间版本号+识别码;使用上述密钥在缓存服务器中进行数据调用,若获取的到数据,则将数据返回,若未命中数据,则直接使用原缓存调用请求获取数据库中数据,并将该数据及对应的密钥KEY存储在缓存服务器中。本发明通过对数据调用的请求进行拦截,然后在缓存服务器中创建识别KEY及对应数据的方式,使得多入口分次调用相同数据的请求不用再多次访问数据库,减少了数据库的代码侵入,并进一步地提高了入口数据调用的效率。

    海量文本中低占比信息识别方法及装置

    公开(公告)号:CN105653649B

    公开(公告)日:2019-05-21

    申请号:CN201511002761.1

    申请日:2015-12-28

    Abstract: 一种海量文本中低占比信息识别方法及装置,其中方法包括如下步骤,将素材信息分为训练信息和测试信息,将所述素材信息通过特征选择、向量化处理转化成可分析的数学矩阵,代入集成学习模型进行模型训练;所述模型训练包括步骤,根据训练信息构建第一分析模型;将测试信息代入分析模型,对所述第一分析模型的运行效果进行评估,得到评估值,根据评估值调整第一分析模型中各算法的训练信息分配权重得到新的分析模型;本方法解决了大量数据中低占比的少量待识别信息的识别问题。

    一种知识地图构建方法及存储介质

    公开(公告)号:CN109597885A

    公开(公告)日:2019-04-09

    申请号:CN201811511737.4

    申请日:2018-12-11

    Abstract: 一种知识地图构建方法及存储介质,其中方法包括如下步骤,识别知识点,通过人工进行部分标注的语料输入基于机器学习的CRF算法模型进行训练,所述CRF算法模型被预置为词性特征倾向、和或信息熵特征倾向、和或全文词频倾向、和或逆文档概率倾向;用训练好的所述模型对特定文档集进行知识点识别,得到知识点集。本发明提出的面向知识搜索的动态知识地图构建方法,不面向特定的业务领域,在不同行业中具备普遍适用性,仅需通过普通标注少量知识点投入的资源少,无监督运行的效果也很好。同时针对不断扩展的企业文档,也能够起到不断进行知识地图结果优化的效果。

    一种基于大语言模型的机器学习算法改进方法及系统

    公开(公告)号:CN118607579A

    公开(公告)日:2024-09-06

    申请号:CN202410761687.4

    申请日:2024-06-13

    Abstract: 本发明公开了一种基于大语言模型的机器学习算法改进方法及系统,其中方法包括:将分析提示与技术文档输入大语言模型,生成现有机器学习算法的分析结果;基于分析结果,利用大语言模型挖掘潜在的创新点;利用大语言模型通过使用元学习策略,生成新的机器学习算法;结合大语言模型与模型解释工具所述机器学习算法的特征贡献度;利用大语言模型生成模型融合策略,组合多个新生成的机器学习算法的预测结果;利用大语言模型自动生成特征工程策略,将生成的特征工程策略输入自动化特征工具进行特征提取;利用训练与验证数据集对最终的机器学习算法进行训练与评估。本发明通过利用大语言模型分析现有机器学习算法,提高机器学习算法的性能和准确度。

Patent Agency Ranking