基于Python的商务文件财务表格格式转换方法及系统

    公开(公告)号:CN118095211A

    公开(公告)日:2024-05-28

    申请号:CN202410169054.4

    申请日:2024-02-06

    IPC分类号: G06F40/151 G06F40/18

    摘要: 本发明涉及数据存储技术领域,具体涉及基于Python的商务文件财务表格格式转换方法及系统,包括:将PDF商务文件财务表格转化为DataFrame格式表格,创建一个包含不同内容分类数组的Python字典变量并将DataFrame格式表格根据内容种类传入字典类型变量的各个数组对字典变量进行填充;对字典变量内DataFrame格式表格进行数据清洗去噪、单位转换、模式匹配并标准化,去除冗余数据后获取包含整个商务文件中各个财务表格的Python字典变量;将包含整个商务文件中各个财务表格的Python字典变量转化为JSON格式。本发明减少了格式转化的误差,提高了格式转化的效率。

    表格的处理方法、装置、电子设备及存储介质

    公开(公告)号:CN117912036A

    公开(公告)日:2024-04-19

    申请号:CN202410165580.3

    申请日:2024-02-05

    IPC分类号: G06V30/41 G06F40/18

    摘要: 本申请提出一种表格的处理方法、装置、电子设备及存储介质,其中,该方法包括:获取待处理文档;获取所述待处理文档中第一页面的第一表格和页面文本;将所述页面文本和预设的至少一个表名关键词进行匹配;响应于所述页面文本包含所述表名关键词中的至少一个,获取所述第一表格对应的表头文本;基于所述表头文本确定所述第一表格的表格类型;基于所述第一表格的表格类型处理所述第一表格。通过本申请的技术方案,可以提高获取的表格的准确性,为后续基于表格进行的数据分析和决策提供可靠的数据支持。

    一种自监督风电功率预测方法、装置、设备及介质

    公开(公告)号:CN115481820A

    公开(公告)日:2022-12-16

    申请号:CN202211255171.X

    申请日:2022-10-13

    摘要: 本发明公开了一种自监督风电功率预测方法、装置、设备及介质,自监督风电功率预测方法,包括步骤:将多个风电场构建为图网络,每个风电场被视为图网络中的节点;其中,图网络的邻接矩阵用多个风电场间的相关矩阵表示,图网络的特征矩阵为历史数据;将所述特征矩阵和邻接矩阵输入预设的图编码器中,所述图编码器输出各风电场的空间特征;将所述各风电场的空间特征作为输入特征,输入预设的长短期记忆网络,所述长短期记忆网络输出时间特征;将所述时间特征投影到未来的发电曲线上,进行发电功率预测。本方案提出采用自监督的方式构建风电功率预测网络模型,基于图神经网络和长短期记忆法,是一种不需要标签的自监督方法。