-
公开(公告)号:CN117094826B
公开(公告)日:2024-04-09
申请号:CN202311261009.3
申请日:2023-09-27
Applicant: 之江实验室
IPC: G06Q40/04 , G06Q30/0601 , G06F40/30 , G06F16/36 , G06N3/04 , G06F18/22 , G06F18/25 , G06F18/213
Abstract: 本申请涉及一种数据交易的匹配方法、装置、电子装置和存储介质,其中,该数据交易的匹配方法包括:基于各数据提供方的第一语义特征,和各数据采购方的第二语义特征进行匹配,得到第一匹配结果;将第一语义特征和第一图谱特征融合,将第二语义特征和第二图谱特征融合,基于融合结果得到第二匹配结果;利用图计算方法对第二匹配结果进行交易对象分层,并根据分层结果构建交易反馈链路,以使匹配后的交易双方完成数据交易。其能够基于机器学习完成对数据提供方和数据采购方的交易需求的特征表征,进而基于特征表征完成数据提供方和数据采购方的匹配,从而为数据交易过程中的数据提供方和数据采购方实现精确的交易匹配。
-
公开(公告)号:CN117131070B
公开(公告)日:2024-02-09
申请号:CN202311404243.7
申请日:2023-10-27
Applicant: 之江实验室
IPC: G06F16/242 , G06F40/30 , G06F40/242
Abstract: 本发明公开了一种自适应规则引导的大语言模型生成SQL系统,包括:表结构构建模块,用于列名标准化和列名字典构建;参考规则库构建模块用于构建参考规则库,包括表和列名筛选子模块、列条件抽取子模块、合并表嵌套子模块、SQL片段生成子模块、校验子模块;常用规则库中包含实际业务场景中常用的Text到SQL的各个步骤和推理逻辑;自适应规则构建模块用于构建与Text查询语句匹配的自适应规则;规则引导SQL生成模块根据自适应规则,引导大语言模型逐步生成SQL语句。本发明能帮助非数据库技术人员实现自然语言查询转SQL语句,并避免隐含条件和模糊语义引起的列数据筛选条件错误等问题。
-
公开(公告)号:CN116304891A
公开(公告)日:2023-06-23
申请号:CN202310590427.0
申请日:2023-05-24
Applicant: 之江实验室
IPC: G06F18/241 , G06N3/096 , G06N3/088 , G06F16/2452 , G06N3/08
Abstract: 本申请涉及一种基于多源数据迁移学习的类别预测方法和装置。所述方法包括:获取多个来自不同数据源的表格数据,基于表格数据确定不同的目标任务下的关键数据映射表;通过数据向量化获取表格数据中每个单元格的文本向量,根据文本向量对待训练的自监督表格模型进行预训练;基于关键数据映射表,通过自监督表格模型确定目标任务训练集;基于目标任务对自监督表格模型进行优化,得到待优化的目标表格模型,根据目标任务训练集训练待优化的目标表格模型,得到目标表格模型;通过目标表格模型确定待预测数据的类别。采用本方法能够解决业务相似的不同机构中存在的因表格结构差异导致的预处理工作繁重、业务模型无法迁移复用等难点问题。
-
公开(公告)号:CN115410174B
公开(公告)日:2023-05-23
申请号:CN202211352917.9
申请日:2022-11-01
Applicant: 之江实验室
IPC: G06V20/56 , G06V10/10 , G06V10/22 , G06V10/764 , G06Q30/018 , G06Q40/08
Abstract: 本发明公开一种两阶段车险反欺诈图像采集质检方法、装置和系统,该方法包括:步骤一,采集车险现场图片,标注车辆朝向;步骤二,对采集车险现场图片进行目标检测,筛选得到目标坐标;步骤三,根据车辆朝向和目标坐标,计算目标坐标位于整车的具体部位;步骤四,根据步骤二筛选得到的目标坐标,对车险现场图片进行车辆部件检测,得到车辆部件坐标,并进行筛选,得到距离目标坐标最近的车辆部件;步骤五,根据步得到的目标坐标位于整车的具体部位和距离目标坐标最近的车辆部件,得到距离目标坐标最近的车辆部件位于整车的位置,并抽象化为结构化数据。本发明避免了传统保险行业中存在的低质量图片,以及人工识别耗费的大量时间。
-
公开(公告)号:CN115810134A
公开(公告)日:2023-03-17
申请号:CN202310110512.2
申请日:2023-02-14
Applicant: 之江实验室
IPC: G06V10/764 , G06V20/70 , G06V10/10 , G06V20/62 , G06V10/74 , G06Q30/018 , G06Q40/08
Abstract: 本发明公开了一种车险反欺诈的图像采集质检方法、系统和装置,所述方法由车险理赔质检终端和车险理赔质检服务器执行,包括:通过车险理赔质检终端收集并识别分类包括车损情况、车辆信息、场景信息、驾驶员信息、三方信息在内的图像信息,对图像信息进行筛选,并对筛选后的图像信息进行标注;将标注后的图像信息发送至车险理赔质检服务器,以使车险理赔质检服务器执行图像质检,得到质检结果;险理赔质检服务器将质检结果返回至车险理赔质检终端。本发明方法能够在信息收集的过程中,完成车险现场数据的标注和识别,从收集端规范了数据的采集,提高了图像采集的质量。
-
公开(公告)号:CN116306657A
公开(公告)日:2023-06-23
申请号:CN202310565366.2
申请日:2023-05-19
Applicant: 之江实验室
IPC: G06F40/295 , G06F16/33 , G06N20/00 , G06F16/35
Abstract: 本发明公开一种基于方阵标注和双仿射层注意力的实体抽取方法及系统。本发明由文本数据库模块、文本预处理模块、文本建模模块、输出模块四个部分组成。该系统是首次将图像语义分割的思想融入文本实体抽取的任务中,将传统的序列标注任务转变成方阵标注任务,并使用双仿射层注意力机制将序列表示的语义向量转化为长宽均为文本序列长度的方阵,缓解了中文文本实体识别任务中实体边缘检测难,检测精度低的问题。
-
公开(公告)号:CN116168117A
公开(公告)日:2023-05-26
申请号:CN202211541125.6
申请日:2022-12-02
Applicant: 之江实验室
IPC: G06T11/60 , G06T7/12 , G06V10/774 , G06V10/26 , G06Q40/08
Abstract: 本发明公开了一种面向车险反欺诈的图像生成方法、系统、装置和介质,该方法具体为:首先收集车险图像构建车险图像数据库并进行预处理,构建图像数据集,根据语义分割方式,对车辆部件进行标注;然后通过标注结果解析和分布分析,统计不同部件不同损伤类型的概率,对概率小于阈值的样本类型进行补充;其次构建车辆部件的有损和无损图像样本集,使用特征迁移方法将无损图像样本转换为有损图像样本,实现车损部件特征迁移;最后将有损部件图像合成到目标车辆上,形成新的车损图像样本。本发明能够使得车损图像样本集更全面,增加其多样性,提高数据质量,以提高车损反欺诈中的图像特征提取等算法的有效性。
-
公开(公告)号:CN115145906B
公开(公告)日:2023-01-03
申请号:CN202211068167.2
申请日:2022-09-02
Applicant: 之江实验室
IPC: G06F16/215 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种面向结构化数据的预处理和补全方法,包括:步骤一,对原始数据的缺失信息进行查询,统计缺失值,得到原始数据的缺失率;步骤二,根据缺失率对原始数据进行行列剔除处理,然后进行行遍历生成行对应数组,再将数组转换为直方图形式,计算出对应直方图构成的最大的矩形面积,接着对所有矩形面积进行排序,采集得到最大的完整信息矩阵;步骤三,采用基于链式方程进行的多重填补方法或基于编码器的多重填补方法或基于对抗生成网络的填补方法,对原始数据进行缺失值填补。本发明能够对原始数据进行缺失信息统计,自动搜寻满足条件的最大完整信息,补全结构化数据,极大提高原始数据集的质量,对后期的预测任务提供了便利。
-
公开(公告)号:CN115410174A
公开(公告)日:2022-11-29
申请号:CN202211352917.9
申请日:2022-11-01
Applicant: 之江实验室
Abstract: 本发明公开一种两阶段车险反欺诈图像采集质检方法、装置和系统,该方法包括:步骤一,采集车险现场图片,标注车辆朝向;步骤二,对采集车险现场图片进行目标检测,筛选得到目标坐标;步骤三,根据车辆朝向和目标坐标,计算目标坐标位于整车的具体部位;步骤四,根据步骤二筛选得到的目标坐标,对车险现场图片进行车辆部件检测,得到车辆部件坐标,并进行筛选,得到距离目标坐标最近的车辆部件;步骤五,根据步得到的目标坐标位于整车的具体部位和距离目标坐标最近的车辆部件,得到距离目标坐标最近的车辆部件位于整车的位置,并抽象化为结构化数据。本发明避免了传统保险行业中存在的低质量图片,以及人工识别耗费的大量时间。
-
公开(公告)号:CN115145906A
公开(公告)日:2022-10-04
申请号:CN202211068167.2
申请日:2022-09-02
Applicant: 之江实验室
IPC: G06F16/215 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种面向结构化数据的预处理和补全方法,包括:步骤一,对原始数据的缺失信息进行查询,统计缺失值,得到原始数据的缺失率;步骤二,根据缺失率对原始数据进行行列剔除处理,然后进行行遍历生成行对应数组,再将数组转换为直方图形式,计算出对应直方图构成的最大的矩形面积,接着对所有矩形面积进行排序,采集得到最大的完整信息矩阵;步骤三,采用基于链式方程进行的多重填补方法或基于编码器的多重填补方法或基于对抗生成网络的填补方法,对原始数据进行缺失值填补。本发明能够对原始数据进行缺失信息统计,自动搜寻满足条件的最大完整信息,补全结构化数据,极大提高原始数据集的质量,对后期的预测任务提供了便利。
-
-
-
-
-
-
-
-
-