-
公开(公告)号:CN113298179B
公开(公告)日:2024-05-28
申请号:CN202110658278.8
申请日:2021-06-15
Applicant: 南京大学
IPC: G06F18/22 , G06F18/214 , G06Q30/0201 , G06Q30/0202 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/084 , G06F40/284
Abstract: 本发明公开了一种海关商品异常价格检测方法及装置,其中方法包括:把数据集分割成训练集和验证集;将数据集文本的不同信息分割成不同的词序列;对于每个数据,将分割成的词序列输入语言表示层,得到关于词向量的二维矩阵;将得到的二维矩阵输入文本双向多尺度神经网络中,从中提取相应的特征向量;将得到的特征向量输入用指数函数激活的单层感知机网络中,得到价格预测值;通过平均绝对对数误差损失函数计算网络的预测损失,然后使用随机梯度下降算法更新网络参数;结合得到的预测的价格,计算价格相似度;根据价格相似度,判断价格数据是否异常。本发明检测方法能较好地检测出异常价格,为海关部门异常报关价格数据的检测提供了参考依据。
-
公开(公告)号:CN114971001A
公开(公告)日:2022-08-30
申请号:CN202210546521.1
申请日:2022-05-18
Applicant: 南京大学
Abstract: 本发明公开了一种海关数据的关口预测方法、装置及存储介质,方法包括:将海关每条多属性数据转换为二维矩阵;将得到的二维矩阵与常数一维卷积得到组合基础关键词信息;将基础关键词特征输入个体注意力模块和一个关系注意力模块,提取关键词的特征和不同关键词之间的关系特征;将二维矩阵输入双向长短期神经网络中,将输出特征输入注意力机制模块中,提取原始文本的时序特征;将两个模块得到的特征向量融合,最后通过一个全连接的softmax分类层得到关口预测的条件概率。本发明结合海关实际电商数据部分字段丢失以及关键词显著的特点,提出了关键词特征融合模型,有效地提取关键词属性特征以及长程的关键词关系,为解决关口预测问题提供了有效的方法。
-
公开(公告)号:CN113298179A
公开(公告)日:2021-08-24
申请号:CN202110658278.8
申请日:2021-06-15
Applicant: 南京大学
Abstract: 本发明公开了一种海关商品异常价格检测方法及装置,其中方法包括:把数据集分割成训练集和验证集;将数据集文本的不同信息分割成不同的词序列;对于每个数据,将分割成的词序列输入语言表示层,得到关于词向量的二维矩阵;将得到的二维矩阵输入文本双向多尺度神经网络中,从中提取相应的特征向量;将得到的特征向量输入用指数函数激活的单层感知机网络中,得到价格预测值;通过平均绝对对数误差损失函数计算网络的预测损失,然后使用随机梯度下降算法更新网络参数;结合得到的预测的价格,计算价格相似度;根据价格相似度,判断价格数据是否异常。本发明检测方法能较好地检测出异常价格,为海关部门异常报关价格数据的检测提供了参考依据。
-
公开(公告)号:CN114971001B
公开(公告)日:2025-05-06
申请号:CN202210546521.1
申请日:2022-05-18
Applicant: 南京大学
IPC: G06Q10/04 , G06F16/35 , G06F18/2415 , G06N3/0442 , G06N3/045
Abstract: 本发明公开了一种海关数据的关口预测方法、装置及存储介质,方法包括:将海关每条多属性数据转换为二维矩阵;将得到的二维矩阵与常数一维卷积得到组合基础关键词信息;将基础关键词特征输入个体注意力模块和一个关系注意力模块,提取关键词的特征和不同关键词之间的关系特征;将二维矩阵输入双向长短期神经网络中,将输出特征输入注意力机制模块中,提取原始文本的时序特征;将两个模块得到的特征向量融合,最后通过一个全连接的softmax分类层得到关口预测的条件概率。本发明结合海关实际电商数据部分字段丢失以及关键词显著的特点,提出了关键词特征融合模型,有效地提取关键词属性特征以及长程的关键词关系,为解决关口预测问题提供了有效的方法。
-
公开(公告)号:CN113343640B
公开(公告)日:2024-02-20
申请号:CN202110574885.6
申请日:2021-05-26
Applicant: 南京大学
IPC: G06F40/126 , G06F40/289 , G06F18/2415 , G06N3/047 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种海关报关商品HS编码分类方法及装置,方法包括:对海关报关单数据进行重采样,生成用于实验的数据集;对于数据集的文字部分,使离散的词的文字表示转为词的向量表示;对于数据集的HS编码部分,使用分层编码方式生成分层词向量;设置多层编码器提取文字部分词向量的深层特征;设置多层解码器提取文字部分词向量和HS编码部分的分层节点的特征;将解码器最后一层输出的分层节点特征输入一个全连接的分类层得到HS编码前缀条件概率,计算全概率,取概率最大的作为分类结果。本发明有效解决了长尾分布下数据的分类问题,在长尾分布分类任务中能增强对尾部类的分类性能,且能够灵活地满足类别系统动态更新的需求。
-
公开(公告)号:CN113343640A
公开(公告)日:2021-09-03
申请号:CN202110574885.6
申请日:2021-05-26
Applicant: 南京大学
IPC: G06F40/126 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种海关报关商品HS编码分类方法及装置,方法包括:对海关报关单数据进行重采样,生成用于实验的数据集;对于数据集的文字部分,使离散的词的文字表示转为词的向量表示;对于数据集的HS编码部分,使用分层编码方式生成分层词向量;设置多层编码器提取文字部分词向量的深层特征;设置多层解码器提取文字部分词向量和HS编码部分的分层节点的特征;将解码器最后一层输出的分层节点特征输入一个全连接的分类层得到HS编码前缀条件概率,计算全概率,取概率最大的作为分类结果。本发明有效解决了长尾分布下数据的分类问题,在长尾分布分类任务中能增强对尾部类的分类性能,且能够灵活地满足类别系统动态更新的需求。
-
-
-
-
-