多入口数据缓存方法及存储介质

    公开(公告)号:CN111090675A

    公开(公告)日:2020-05-01

    申请号:CN201911154529.8

    申请日:2019-11-22

    Abstract: 一种多入口数据缓存方法及存储介质,其中方法包括如下步骤,拦截原缓存调用请求,根据该缓存调用请求生成密钥KEY,所述密钥KEY的生成规则为:入口平台代码+命名空间+类名+命名空间版本号+识别码;使用上述密钥在缓存服务器中进行数据调用,若获取的到数据,则将数据返回,若未命中数据,则直接使用原缓存调用请求获取数据库中数据,并将该数据及对应的密钥KEY存储在缓存服务器中。本发明通过对数据调用的请求进行拦截,然后在缓存服务器中创建识别KEY及对应数据的方式,使得多入口分次调用相同数据的请求不用再多次访问数据库,减少了数据库的代码侵入,并进一步地提高了入口数据调用的效率。

    一种电力文本智能纠错方法及系统

    公开(公告)号:CN119808763A

    公开(公告)日:2025-04-11

    申请号:CN202411868447.0

    申请日:2024-12-18

    Abstract: 本发明涉及一种电力文本智能纠错方法,包括以下步骤:步骤1:收集与电力相关的文本数据,包括电力行业的报告、技术文档、操作手册、用户手册;步骤2:建立数据标签系统,根据来源、类型、主题等,为每条数据打上合适的标签,支持多维度数据检索,并使用自然语言处理工具对文本进行语言检测和分词处理;步骤3:对检测和分词处理后的文本数据进行错误检测,构建训练数据集;步骤4:基于序列到序列seq2seq模型构建电力文本智能纠错模型,用于生成纠正后的文本,训练数据通过加入错误/正确的文本对来增强;步骤5:根据训练后的电力文本智能纠错模型进行文本智能纠错。本发明能够有效地识别错误文本,并生成高质量的正确文本。

    基于语言大模型的文档聚类排序方法、系统、设备及介质

    公开(公告)号:CN118152572A

    公开(公告)日:2024-06-07

    申请号:CN202410377375.3

    申请日:2024-03-29

    Abstract: 本发明公开了基于语言大模型的文档聚类排序方法、系统、设备及介质,其中方法包括:收集文档数据进行结构化处理与预处理;将文档内容输入语言大模型得到向量化表示;对向量化文档内容使用聚类算法得到文档簇及文档簇中的相似度矩阵,对各文档簇内文档按照相似度矩阵的加权和进行簇内排序,将排序前十的文档标题作为种子文档标题;统计文档簇中的各等级文档数量、文档总数与文档簇相关系数加权和,并计算所述三个指标的加权和,得到各文档簇最终得分,按照得分高低排序;将种子文档标题与设定prompt输入语言大模型生成短句,作为文档簇的类标签。本发明能够使得文档向量化更加准确,类排序依据更加科学,类标签的生成更加具体化、自动化。

Patent Agency Ranking