-
公开(公告)号:CN109558399B
公开(公告)日:2021-06-29
申请号:CN201811400598.8
申请日:2018-11-22
Applicant: 北京邮电大学
IPC: G06F16/215 , G06F16/2457 , G06Q40/00
Abstract: 本发明实施例公开了一种数据存储方法及装置,涉及数据处理技术领域。其中,包括:对待存储发票数据进行数据清洗,清洗掉所述待存储发票数据中的干扰数据;确定清洗后待存储发票数据中的纳税方、负税方以及纳税方和负税方之间的发票流数据;在用于存储数据的图数据库中确定纳税方对应的第一节点和负税方对应的第二节点;在图数据库中建立第一节点与第二节点之间的关联关系;按照关联关系将所述发票流数据导入图数据库中,实现待存储发票数据的存储。应用本发明实施例提供的方案时,在面对海量数据存储的情况下,能够满足用户对数据读写等方面的需求。
-
公开(公告)号:CN110009796B
公开(公告)日:2020-12-04
申请号:CN201910290457.3
申请日:2019-04-11
Applicant: 北京邮电大学
IPC: G07D7/0047 , G06K9/62
Abstract: 本发明实施例提供了一种发票类别识别方法、装置、电子设备及可读存储介质,应用于数据挖掘技术领域,所述方法包括:获取用户输入的针对待识别发票的发票信息,根据发票信息中的关键词以及预先获取的发票样本训练集,确定待识别发票所属的发票编码集合;针对发票编码集合中的每个发票编码,根据关键词以及发票样本训练集,通过朴素贝叶斯算法,计算待识别发票属于该发票编码的后验概率值;将最大后验概率值对应的发票编码作为待识别发票的发票编码。与现有技术相比,本发明可以提高发票类别识别的效率。
-
公开(公告)号:CN110009796A
公开(公告)日:2019-07-12
申请号:CN201910290457.3
申请日:2019-04-11
Applicant: 北京邮电大学
IPC: G07D7/0047 , G06K9/62
Abstract: 本发明实施例提供了一种发票类别识别方法、装置、电子设备及可读存储介质,应用于数据挖掘技术领域,所述方法包括:获取用户输入的针对待识别发票的发票信息,根据发票信息中的关键词以及预先获取的发票样本训练集,确定待识别发票所属的发票编码集合;针对发票编码集合中的每个发票编码,根据关键词以及发票样本训练集,通过朴素贝叶斯算法,计算待识别发票属于该发票编码的后验概率值;将最大后验概率值对应的发票编码作为待识别发票的发票编码。与现有技术相比,本发明可以提高发票类别识别的效率。
-
公开(公告)号:CN109740642A
公开(公告)日:2019-05-10
申请号:CN201811555038.X
申请日:2018-12-19
Applicant: 北京邮电大学
Abstract: 本发明实施例提供了一种发票类别识别方法、装置、电子设备及可读存储介质,应用于数据挖掘技术领域,所述方法包括:提取待识别发票中的关键信息,对关键信息中的每个词进行向量表示,得到关键信息矩阵;将关键信息矩阵输入预先建立的神经网络模型中,得到关键信息矩阵对应的分类概率向量,神经网络模型是根据各发票中的关键信息以及各发票对应的分类编码得到的;将分类概率向量中最大值元素对应的分类编码作为待识别发票的分类编码。与现有技术相比,本发明可以提高发票类别识别的效率和准确性。
-
公开(公告)号:CN109558399A
公开(公告)日:2019-04-02
申请号:CN201811400598.8
申请日:2018-11-22
Applicant: 北京邮电大学
IPC: G06F16/215 , G06F16/2457 , G06Q40/00
Abstract: 本发明实施例公开了一种数据存储方法及装置,涉及数据处理技术领域。其中,包括:对待存储发票数据进行数据清洗,清洗掉所述待存储发票数据中的干扰数据;确定清洗后待存储发票数据中的纳税方、负税方以及纳税方和负税方之间的发票流数据;在用于存储数据的图数据库中确定纳税方对应的第一节点和负税方对应的第二节点;在图数据库中建立第一节点与第二节点之间的关联关系;按照关联关系将所述发票流数据导入图数据库中,实现待存储发票数据的存储。应用本发明实施例提供的方案时,在面对海量数据存储的情况下,能够满足用户对数据读写等方面的需求。
-
-
-
-