一种基于大模型的潜在绿色企业挖掘方法和装置

    公开(公告)号:CN119066185B

    公开(公告)日:2025-04-22

    申请号:CN202411574862.5

    申请日:2024-11-06

    Abstract: 本发明公开了一种基于大模型的潜在绿色企业挖掘方法和装置,包括:对大语言模型基座进行领域预训练以及进行绿色企业与绿色产业识别任务的微调;获取每个企业的经营范围、业务范围以及生态环境行政处罚相关文本信息,并与企业申请绿色信贷时填写的信贷业务相关文本信息进行文本处理;将经过处理的文本数据和问题输入微调后的大语言模型,输出是否为绿色企业以及绿色企业所属的绿色产业类别,同时由人工对输出结果进行二次确认得到确认结果,将确认结果作为标签对大语言模型进行训练;利用训练好的大语言模型进行绿色企业挖掘。本发明通过一整套智能的流程设计,极大削减了人力成本,简化了潜在绿色企业的挖掘流程,缩短潜在绿色企业的挖掘周期。

    一种基于大模型的财报自动化问答方法和装置

    公开(公告)号:CN117235233A

    公开(公告)日:2023-12-15

    申请号:CN202311379778.3

    申请日:2023-10-24

    Abstract: 本发明公开了一种基于大模型的财报自动化问答方法和装置,该方法包括以下步骤:基于金融数据集和历年财报数据对基础开源大模型进行预训练和微调,构建具有财务问答能力的财报大模型;用户上传财报文件并输入问题至财报大模型,通过财报大模型对财报文件进行文件解析并生成答案返回给用户;构建数据库,其中包括历年财报数据、财报文件解析结果和对答案的打分结果;利用数据库中的信息通过反馈迭代机制对财报大模型进行迭代优化;利用优化后的财报大模型进行财报自动化问答。本发明方法能够有效提高财报分析的准确性和效率,适用于财务领域中对财报数据的智能化问答应用场景。

    实验样本分组方法、实验样本收集平台和设备

    公开(公告)号:CN117113158A

    公开(公告)日:2023-11-24

    申请号:CN202311374516.8

    申请日:2023-10-23

    Abstract: 本申请涉及一种实验样本分组方法、实验样本收集平台和设备,方法包括:将第一样本进行随机分组;计算当前分组的均衡指标;判断当前分组的均衡指标是否落入阈值范围之内;若是,则中止分组,输出分组结果,分组结果包括分组信息和当前分组的均衡指标;若否,则返回至将第一样本进行随机分组的步骤;其中,确定阈值范围包括:将第二样本进行N次随机分组,输出对应于每一次分组的均衡指标,其中,均衡指标包括:各组样本之间的马氏距离,以及常数回归模型和全参数回归模型之间的AIC差值;在N个分组结果中根据第一预设比例pa选取目标分组,并根据目标分组的均衡指标确定阈值范围。本申请改善了实验样本分组均衡性,使实验结果更加精确。

    模型剪枝方法、设备及计算机可读存储介质

    公开(公告)号:CN119962609A

    公开(公告)日:2025-05-09

    申请号:CN202510420849.2

    申请日:2025-04-07

    Abstract: 本申请提供一种模型剪枝方法、设备及计算机可读存储介质,在初始模型训练过程中,动态评估所述初始模型的各层之间的连接强度和节点重要性,能够精准地识别对模型性能贡献较小的连接或节点。根据动态指标选择冗余的目标连接和目标节点进行剪枝,移除那些对模型性能贡献较小的连接或节点。最后,基于所述初始模型的模型性能,对剪枝后的初始模型进行微调,得到符合所述模型性能要求的目标模型,恢复模型可能因剪枝而损失的性能,从而实现提高剪枝的准确性,同时保持或提高模型的性能。

    一种基于大模型的财报自动化问答方法和装置

    公开(公告)号:CN117235233B

    公开(公告)日:2024-06-11

    申请号:CN202311379778.3

    申请日:2023-10-24

    Abstract: 本发明公开了一种基于大模型的财报自动化问答方法和装置,该方法包括以下步骤:基于金融数据集和历年财报数据对基础开源大模型进行预训练和微调,构建具有财务问答能力的财报大模型;用户上传财报文件并输入问题至财报大模型,通过财报大模型对财报文件进行文件解析并生成答案返回给用户;构建数据库,其中包括历年财报数据、财报文件解析结果和对答案的打分结果;利用数据库中的信息通过反馈迭代机制对财报大模型进行迭代优化;利用优化后的财报大模型进行财报自动化问答。本发明方法能够有效提高财报分析的准确性和效率,适用于财务领域中对财报数据的智能化问答应用场景。

    一种基于深度语言模型的绿色信贷项目识别方法和系统

    公开(公告)号:CN115809654A

    公开(公告)日:2023-03-17

    申请号:CN202211459933.8

    申请日:2022-11-16

    Abstract: 本发明公开一种基于深度语言模型的绿色信贷项目识别方法和系统。绿色信贷通常是指以银行为主的金融机构为各类对环保有益的公司/项目提供贷款机会或对环境造成不良影响的公司/项目进行贷款控制。本发明通过构建关于绿色金融的语料库以及绿色金融预训练语言模型,提出了基于绿色金融语料库的多级绿色信贷分类方法。该发明具体包括以下部分:提取与绿色金融业务相关的语料并构建绿色金融语料库,利用上述绿色金融语料库对语言模型进行预训练,得到关于绿色金融语料的预训练模型;以绿色信贷自主分类为业务目的,设计基于贷款描述的多级绿色信贷分类体系,并基于此分类体系构建多级绿色信贷分类模型,利用所述模型预测贷款描述对应的绿色信贷分类。

    一种用于数值型数据的智能异常检测方法及装置

    公开(公告)号:CN112328424A

    公开(公告)日:2021-02-05

    申请号:CN202011396662.7

    申请日:2020-12-03

    Abstract: 本发明公开了一种用于数值型数据的智能异常检测方法及装置,该方法包括:上传数据阶段,实现数据上传;数据池阶段,实现数据存储与数据比对;算法池阶段,实现系统智能推荐多种适合当前数据的异常检测算法;算法结果集成阶段,实现汇总各算法的计算结果并得出最终计算结果;异常点判定阶段,实现自主选择异常点判定方法并做出判定;检测结果可视化阶段,实现可视化直观展示数据尤其是异常点。本发明创新地提出了智能辅助算法推荐、算法结果集成和异常点智能判定并将其运用到系统中,极大地简化了用户操作,帮助用户在较少的时间内得到更加准确且易于观察的异常检测结果。

    一种基于词权统计和预训练模型的文本分类方法及装置

    公开(公告)号:CN118535743A

    公开(公告)日:2024-08-23

    申请号:CN202411004264.4

    申请日:2024-07-25

    Abstract: 本发明公开了一种基于词权统计和预训练模型的文本分类方法及装置,主要包括以下步骤:获取文本语料并存储在文本数据库中;对文本语料进行数据清洗得到文本数据集;利用词频‑逆标签集频率算法生成词‑标签权重词典;利用词‑标签权重词典生成文本权重得分向量结合预处理后的文本经文本分类模型得到文本分类预测结果,对模型进行迭代训练;利用预训练后的文本分类模型对新输入文本进行分类。本发明将每个词相对于每个标签的重要程度作为先验知识,之后在文本分类模型中使用注意力机制将该先验知识融入预训练BERT模型输出的文本语义表示中,能够进一步提高文本分类的准确率和效率。

    基于动态聚类的面向不平衡数据集的绿色金融产业分类方法和装置

    公开(公告)号:CN116401362A

    公开(公告)日:2023-07-07

    申请号:CN202310110726.X

    申请日:2023-01-16

    Abstract: 本发明公开了一种基于动态聚类的面向不平衡数据集的绿色金融产业分类方法和装置,包括:清洗并将不平衡的绿色信贷数据转换为词向量;统计每类数据的词向量数量,并计算词向量数量的平均值作为采样基线,对于大于等于采样基线的类别数据,采用动态聚类欠采样方式减少该类别数据的词向量,对于低于采样基线的类别数据,采用动态聚类过采样方式增加该类别数据的词向量,以实现数据平衡;利用数据平衡后的词向量对文本分类模型进行训练;利用训练后的文本分类模型进行绿色金融产业分类,该方法和装置通过对不平衡数据集均衡采样来提升绿色金融产业分类的准确性。

    一种基于大模型的潜在绿色企业挖掘方法和装置

    公开(公告)号:CN119066185A

    公开(公告)日:2024-12-03

    申请号:CN202411574862.5

    申请日:2024-11-06

    Abstract: 本发明公开了一种基于大模型的潜在绿色企业挖掘方法和装置,包括:对大语言模型基座进行领域预训练以及进行绿色企业与绿色产业识别任务的微调;获取每个企业的经营范围、业务范围以及生态环境行政处罚相关文本信息,并与企业申请绿色信贷时填写的信贷业务相关文本信息进行文本处理;将经过处理的文本数据和问题输入微调后的大语言模型,输出是否为绿色企业以及绿色企业所属的绿色产业类别,同时由人工对输出结果进行二次确认得到确认结果,将确认结果作为标签对大语言模型进行训练;利用训练好的大语言模型进行绿色企业挖掘。本发明通过一整套智能的流程设计,极大削减了人力成本,简化了潜在绿色企业的挖掘流程,缩短潜在绿色企业的挖掘周期。

Patent Agency Ranking