基于多能智能体深度强化学习的结构化数据预测优化方法

    公开(公告)号:CN115577872A

    公开(公告)日:2023-01-06

    申请号:CN202211164902.X

    申请日:2022-09-23

    Abstract: 本发明公开了一种基于多能智能体深度强化学习的结构化数据预测优化方法。获取结构化数据的原始数据;用深度强化学习智能体和代理模型对原始数据进行迭代处理,获得优化后的深度强化学习智能体;将原始数据和初始设定的超参数再次输入到优化后的深度强化学习智能体中生成新训练数据,并用新训练数据训练一个预测模型;将结构化数据的待预测数据输入输入到预测模型中,得到最终的预测目标参数的预测结果。本发明能够一次性解决包括自动特征工程、超参搜索等多个优化任务,大幅降低建模过程中的人力消耗,同时提高寻优的准确度。

    一种基于自然语言的多表格数据查询和分析方法

    公开(公告)号:CN117725078B

    公开(公告)日:2024-10-18

    申请号:CN202311619928.3

    申请日:2023-11-30

    Abstract: 本发明公开了一种基于自然语言的多表格数据查询和分析方法。基于已有的业务数据库和具体的业务场景,收集常见的业务问题;在此基础上分别构建表格抽取数据集、业务知识数据集和查询分析数据集;选择表格抽取模型和查询分析指令生成模型,采用全参数微调的方式进行训练;在生产环境中部署模型,并根据实际功能需求差异,适配开发对应的指令翻译、矫正和执行模块;最后,通过WEB前端页面对模型发送数据查询、分析请求。本发明能够实现使用自然语言在多表格、多字段的复杂业务数仓环境中进行精确的数据提取查询、可视化分析和数据预测,让业务人员能够跨越SQL、Python等结构化数据提取分析语言的使用门槛,进行交互式的数据查询和分析。

    一种基于注意力机制与BiLSTM的中文查询表格选取方法

    公开(公告)号:CN117743363A

    公开(公告)日:2024-03-22

    申请号:CN202311547173.0

    申请日:2023-11-20

    Abstract: 本发明公开了一种基于注意力机制与BiLSTM的中文查询表格选取方法。方法包括:接收中文查询文本以及待查询的数据库连接方式,连接待查询数据库,解析获得数据库表结构,进行拼接获得长序列文本;使用垂直场景语料微调预训练语言模型,将长序列文本输入,进行分词标注与表征编码后输出序列编码;进行池化操作后获得表和列级别表征信息;使用注意力机制将列信息注入表信息中;使用分类器进行表格的分类召回,实现中文查询的表格选取。本发明方法实现了对多表数仓环境下复杂中文查询的表格召回,提升了数据库表格召回的精准度,可有效提高Text2SQL模型的泛化能力,减少语言模型Token长度带来的限制,可以得到良好的查询结果。

    基于人体关键点动作序列匹配的视频图像运动计数方法

    公开(公告)号:CN116206237A

    公开(公告)日:2023-06-02

    申请号:CN202310018858.X

    申请日:2023-01-06

    Abstract: 本发明公开了一种基于人体关键点动作序列匹配的视频图像运动计数方法。人体在相机视野中进行运动,通过相机采集人体运动的视频图像,通过对视频图像的分析处理获得运动的类型和计数,具体是基于动作序列拆分的运动计数,建立不同的模板对每个运动动作进行匹配识别,且自适应分配运行在不同的计算设备中。本发明在使用关键点检测准确率相对较低的小模型上也有较高的计数准确性和稳定性,满足检测速度要求较高的运动场景,具有运行速度快,动作匹配稳定性和准确率高,计数准确率高,适用于不同部署设备上运行等优点。

    一种表格数据分析领域大模型的训练和评估方法

    公开(公告)号:CN119415641A

    公开(公告)日:2025-02-11

    申请号:CN202510014062.6

    申请日:2025-01-06

    Abstract: 本发明公开了一种表格数据分析领域大模型的训练和评估方法。对获取的表格、文本数据进行筛选打分;编制多套不同提示词,制作表格数据场景下的“问题”数据以及“问题‑回答”数据对作为基础的训练样本;对生成的“问题”和“问题‑回答”样本对进行数据增强;收集并筛选普通的文本问答、逻辑数学以及代码生成任务数据,选择合适的数据配比,对基底模型进行全参数指令对齐训练;收集、制作评估数据集,编写评估脚本,运行获得对应评价指标;根据评价指标以及评估集合的反馈,迭代优化训练数据集,直到模型达到预期指标为止。本发明能够使得训练得到的表格数据分析领域大模型不仅具有很强的表格问答能力,还具备较强的通用问题解决能力。

    一种二维表格数据多模态模型的设计和训练方法

    公开(公告)号:CN119398018A

    公开(公告)日:2025-02-07

    申请号:CN202411975829.3

    申请日:2024-12-31

    Abstract: 本发明公开了一种二维表格数据多模态模型的设计和训练方法。本发明首先设计二维表格数据多模态模型,其包括表格表征模块,所述表格表征模块由多个串行的双向注意力模块组成;通过所述双向注意力模块处理使得表格表征词嵌入集能够与其它相关单元格交互,捕获全局结构化表格语义;然后预训练表格表征模块,使用大量原始表格数据来训练表格表征模块,使其能够输出准确的表格表征信息;最后对表格表征模块和大语言模型解码器进行对齐训练,采用表格表征模块和大语言模型解码器进行联合监督微调。本发明能实现表格模态与文本模态共同输入大模型进行表格问答、数据分析等生成式任务,有效提升二维表格问答、代码生成等任务的效果和性能。

    基于检索增强生成技术与生成式大模型的自主代理系统

    公开(公告)号:CN119003592A

    公开(公告)日:2024-11-22

    申请号:CN202411076898.0

    申请日:2024-08-07

    Abstract: 本发明公开了一种基于检索增强生成技术与生成式大模型的自主代理系统。系统的知识库模块用于存储业务领域数据集转化分隔后建立的知识库,记忆模块存储用户提问和对话内容以及通过RAG检索后从自身和知识库中召回的关联知识;计划模块根据提问和对话内容以及关联知识制定计划清单;执行模块根据计划清单进行执行后获得计划执行结果,通过反思判断是否符合预期,决定是否进行再计划直至符合预期。本发明系统能够有效缓解大模型的生成幻觉问题,提高了大模型的生成速度,并同时提高了生成内容的关联性、时效性以及准确性;另外,通过设计计划模块的计划清单、执行模块的逐步执行等流程机制,帮助用户理解大模型的执行过程,提高最终结果的可解释性。

    一种基于自然语言的多表格数据查询和预测方法

    公开(公告)号:CN117725078A

    公开(公告)日:2024-03-19

    申请号:CN202311619928.3

    申请日:2023-11-30

    Abstract: 本发明公开了一种基于自然语言的多表格数据查询和预测方法。基于已有的业务数据库和具体的业务场景,收集常见的业务问题;在此基础上分别构建表格抽取数据集、业务知识数据集和查询分析数据集;选择表格抽取模型和查询分析指令生成模型,采用全参数微调的方式进行训练;在生产环境中部署模型,并根据实际功能需求差异,适配开发对应的指令翻译、矫正和执行模块;最后,通过WEB前端页面对模型发送数据查询、分析请求。本发明能够实现使用自然语言在多表格、多字段的复杂业务数仓环境中进行精确的数据提取查询、可视化分析和数据预测,让业务人员能够跨越SQL、Python等结构化数据提取分析语言的使用门槛,进行交互式的数据查询和分析。

Patent Agency Ranking