-
公开(公告)号:CN109741394A
公开(公告)日:2019-05-10
申请号:CN201811506464.4
申请日:2018-12-10
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06T7/62
Abstract: 本公开实施例提供一种图像处理方法、装置、电子设备和存储介质。图像处理方法包括:获取含有非空白图像区域的待处理图像;对所述待处理图像执行二值化处理,获得二值化图像;自所述二值化图像的一个顶点像素点开始,分别沿相互垂直的两个图像边界遍历所述二值化图像,获取与所述非空白图像区域的轮廓相切的多条边切线,所述边切线上包含至少一个黑色像素点且其一侧仅包含白色像素点;根据获取的多条边切线,获取至少一个外接矩形;将多个外接矩形当中面积最小的外接矩形选取为所述非空白图像区域的最小外接矩形区域。能够相对容易地计算得到图像的最小外接矩形,并且降低最小外接矩形的计算复杂度。
-
公开(公告)号:CN119624143A
公开(公告)日:2025-03-14
申请号:CN202510161594.2
申请日:2025-02-14
Applicant: 拓尔思信息技术股份有限公司
IPC: G06Q10/0635 , G06Q10/0831 , G06F18/10 , G06F18/211 , G06F18/214 , G06F18/243 , G06F18/25 , G06N3/042 , G06N3/08 , G06N5/01
Abstract: 本发明属于海关风险监测技术领域,提出了一种基于可解释性深度学习的海关风险评估规则挖掘方法,通过规格型号栏清洗和从海关风险知识库引入互联网公开信息拓展报关单特征项,利用tabnet模型的可解释性从拓展后的众多报关单特征项中定位关键的特征项,再结合决策树模型,用特征归因方法分别生成全局风险规则和局部风险规则,为海关风险评估规则设计提供了参考。本发明能够提升海关风险评估规则设计的效率,确保特征选择的全面性,并使研判结果更加精准,通过生成全局风险规则和局部风险规则,本发明全面解决了海关业务专家在为海关风险研判规则引擎设计规则时所面临的难题,即无法充分考虑报关单的众多特征项,以及难以利用互联网上的公开信息的问题。
-
公开(公告)号:CN119624143B
公开(公告)日:2025-05-02
申请号:CN202510161594.2
申请日:2025-02-14
Applicant: 拓尔思信息技术股份有限公司
IPC: G06Q10/0635 , G06Q10/0831 , G06F18/10 , G06F18/211 , G06F18/214 , G06F18/243 , G06F18/25 , G06N3/042 , G06N3/08 , G06N5/01
Abstract: 本发明属于海关风险监测技术领域,提出了一种基于可解释性深度学习的海关风险评估规则挖掘方法,通过规格型号栏清洗和从海关风险知识库引入互联网公开信息拓展报关单特征项,利用tabnet模型的可解释性从拓展后的众多报关单特征项中定位关键的特征项,再结合决策树模型,用特征归因方法分别生成全局风险规则和局部风险规则,为海关风险评估规则设计提供了参考。本发明能够提升海关风险评估规则设计的效率,确保特征选择的全面性,并使研判结果更加精准,通过生成全局风险规则和局部风险规则,本发明全面解决了海关业务专家在为海关风险研判规则引擎设计规则时所面临的难题,即无法充分考虑报关单的众多特征项,以及难以利用互联网上的公开信息的问题。
-
公开(公告)号:CN109741394B
公开(公告)日:2021-02-26
申请号:CN201811506464.4
申请日:2018-12-10
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06T7/62
Abstract: 本公开实施例提供一种图像处理方法、装置、电子设备和存储介质。图像处理方法包括:获取含有非空白图像区域的待处理图像;对所述待处理图像执行二值化处理,获得二值化图像;自所述二值化图像的一个顶点像素点开始,分别沿相互垂直的两个图像边界遍历所述二值化图像,获取与所述非空白图像区域的轮廓相切的多条边切线,所述边切线上包含至少一个黑色像素点且其一侧仅包含白色像素点;根据获取的多条边切线,获取至少一个外接矩形;将多个外接矩形当中面积最小的外接矩形选取为所述非空白图像区域的最小外接矩形区域。能够相对容易地计算得到图像的最小外接矩形,并且降低最小外接矩形的计算复杂度。
-
公开(公告)号:CN107273412B
公开(公告)日:2019-09-27
申请号:CN201710307520.0
申请日:2017-05-04
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06F16/35
Abstract: 本发明的实施例提供了一种文本数据的聚类方法、装置和系统。其中,所述方法包括:子节点接收主节点针对海量文本数据进行拆分得到的待聚类的文本子集合;所述子节点将所述文本子集合中的每个文本分别与所有子节点的文本子集合中的每个文本进行文本相似度的比对,得到文本对的相似关系集合;所述子节点将所述相似关系集合发送至所述主节点,以使得所述主节点根据所有子节点发送的所述相似关系集合对所述海量文本数据进行聚类,得到所述海量文本数据的聚类结果。本发明通过引入spark分布式框架,对海量文本数据进行分布式聚类,从而获得对海量文本数据进行聚类的能力。
-
公开(公告)号:CN107273412A
公开(公告)日:2017-10-20
申请号:CN201710307520.0
申请日:2017-05-04
Applicant: 北京拓尔思信息技术股份有限公司
IPC: G06F17/30
Abstract: 本发明的实施例提供了一种文本数据的聚类方法、装置和系统。其中,所述方法包括:子节点接收主节点针对海量文本数据进行拆分得到的待聚类的文本子集合;所述子节点将所述文本子集合中的每个文本分别与所有子节点的文本子集合中的每个文本进行文本相似度的比对,得到文本对的相似关系集合;所述子节点将所述相似关系集合发送至所述主节点,以使得所述主节点根据所有子节点发送的所述相似关系集合对所述海量文本数据进行聚类,得到所述海量文本数据的聚类结果。本发明通过引入spark分布式框架,对海量文本数据进行分布式聚类,从而获得对海量文本数据进行聚类的能力。
-
-
-
-
-