一种基于抽取文本因子增强的车险欺诈行为识别方法

    公开(公告)号:CN115293133A

    公开(公告)日:2022-11-04

    申请号:CN202210564739.X

    申请日:2022-05-23

    Abstract: 本发明公开了一种基于抽取文本因子增强的车险欺诈行为识别方法,在文本抽取前期阶段,通过度量文本相似度解决原始数据缺省和错误问题,利用车险场景知识构建车辆事故描述关键词词汇表,提升车险场景文本分词准确度。本发明融合了词性句法信息,设计了预训练语言模型联合框架。利用预训练语言模型知识抽取事故触发词,结合注意力机制学习句法关系权重,通过词性过滤优化抽取结果。本发明还提出并设计了事故原因转译模版帮助抽取事故原因,可以有效减低模型中间存在的传递误差。最后,整合抽取的文本因子,利用Transformer编码器将离散的结构化文本编码,并采用集成学习模型预测是否存在车险欺诈行为。

    一种面向结构化数据的预处理和补全方法

    公开(公告)号:CN115145906B

    公开(公告)日:2023-01-03

    申请号:CN202211068167.2

    申请日:2022-09-02

    Abstract: 本发明公开一种面向结构化数据的预处理和补全方法,包括:步骤一,对原始数据的缺失信息进行查询,统计缺失值,得到原始数据的缺失率;步骤二,根据缺失率对原始数据进行行列剔除处理,然后进行行遍历生成行对应数组,再将数组转换为直方图形式,计算出对应直方图构成的最大的矩形面积,接着对所有矩形面积进行排序,采集得到最大的完整信息矩阵;步骤三,采用基于链式方程进行的多重填补方法或基于编码器的多重填补方法或基于对抗生成网络的填补方法,对原始数据进行缺失值填补。本发明能够对原始数据进行缺失信息统计,自动搜寻满足条件的最大完整信息,补全结构化数据,极大提高原始数据集的质量,对后期的预测任务提供了便利。

    一种两阶段车险反欺诈图像采集质检方法、装置和系统

    公开(公告)号:CN115410174A

    公开(公告)日:2022-11-29

    申请号:CN202211352917.9

    申请日:2022-11-01

    Abstract: 本发明公开一种两阶段车险反欺诈图像采集质检方法、装置和系统,该方法包括:步骤一,采集车险现场图片,标注车辆朝向;步骤二,对采集车险现场图片进行目标检测,筛选得到目标坐标;步骤三,根据车辆朝向和目标坐标,计算目标坐标位于整车的具体部位;步骤四,根据步骤二筛选得到的目标坐标,对车险现场图片进行车辆部件检测,得到车辆部件坐标,并进行筛选,得到距离目标坐标最近的车辆部件;步骤五,根据步得到的目标坐标位于整车的具体部位和距离目标坐标最近的车辆部件,得到距离目标坐标最近的车辆部件位于整车的位置,并抽象化为结构化数据。本发明避免了传统保险行业中存在的低质量图片,以及人工识别耗费的大量时间。

    面向多模态数据的车险欺诈行为预测系统、方法和装置

    公开(公告)号:CN114140025A

    公开(公告)日:2022-03-04

    申请号:CN202111520083.3

    申请日:2021-12-13

    Abstract: 本发明公开了一种面向多模态数据的车险欺诈行为预测系统、方法和装置,本发明从图片数据中抽取风险因子后,与对应结构化数据字段相结合,基于特征工程,机器学习,深度学习等算法,构建车险欺诈风险预测模型,对有风险的行为进行预警。在预测之后,对图片因子进行风险评估和重要性排序,对存在高风险,高权重的因子进行可视化表达。该方法可有效辅助人工进行风险评估,并利用不同种类图片的数据,实现模型和预测结果的可视化因果关系表达。本发明方法利用计算机视觉算法,对某些难以利用的图片数据进行因子抽取,并借助因子分析,因果推论等算法,对预测模型和结果进行可视化展示。

    面向多模态数据的车险欺诈行为预测系统、方法和装置

    公开(公告)号:CN114140025B

    公开(公告)日:2025-03-07

    申请号:CN202111520083.3

    申请日:2021-12-13

    Abstract: 本发明公开了一种面向多模态数据的车险欺诈行为预测系统、方法和装置,本发明从图片数据中抽取风险因子后,与对应结构化数据字段相结合,基于特征工程,机器学习,深度学习等算法,构建车险欺诈风险预测模型,对有风险的行为进行预警。在预测之后,对图片因子进行风险评估和重要性排序,对存在高风险,高权重的因子进行可视化表达。该方法可有效辅助人工进行风险评估,并利用不同种类图片的数据,实现模型和预测结果的可视化因果关系表达。本发明方法利用计算机视觉算法,对某些难以利用的图片数据进行因子抽取,并借助因子分析,因果推论等算法,对预测模型和结果进行可视化展示。

    天文文献检索方法和天文文献搜索方法

    公开(公告)号:CN116910232B

    公开(公告)日:2024-01-09

    申请号:CN202311179447.5

    申请日:2023-09-13

    Abstract: 本申请涉及一种天文文献检索方法和天文文献搜索方法,其中,该天文文献检索方法包括:获取天文检索数据,对天文检索数据进行向量化编码,得到检索向量;基于天文检索数据中的文献属性,利用知识库索引引擎从预设的文献库中为天文检索数据匹配第一候选文献数据;基于检索向量,利用向量相似矩阵结合向量索引引擎,从文献库中为天文检索数据匹配第二候选文献数据;合并第一候选文献数据和第二候选文献数据,得到检索结果。其能够基于多种索引引擎分别实现天文文献数据的检索,从而提高检索的全面度和准确度。

    天文文献检索方法和天文文献搜索方法

    公开(公告)号:CN116910232A

    公开(公告)日:2023-10-20

    申请号:CN202311179447.5

    申请日:2023-09-13

    Abstract: 本申请涉及一种天文文献检索方法和天文文献搜索方法,其中,该天文文献检索方法包括:获取天文检索数据,对天文检索数据进行向量化编码,得到检索向量;基于天文检索数据中的文献属性,利用知识库索引引擎从预设的文献库中为天文检索数据匹配第一候选文献数据;基于检索向量,利用向量相似矩阵结合向量索引引擎,从文献库中为天文检索数据匹配第二候选文献数据;合并第一候选文献数据和第二候选文献数据,得到检索结果。其能够基于多种索引引擎分别实现天文文献数据的检索,从而提高检索的全面度和准确度。

    一种面向结构化数据的预处理和补全方法

    公开(公告)号:CN115145906A

    公开(公告)日:2022-10-04

    申请号:CN202211068167.2

    申请日:2022-09-02

    Abstract: 本发明公开一种面向结构化数据的预处理和补全方法,包括:步骤一,对原始数据的缺失信息进行查询,统计缺失值,得到原始数据的缺失率;步骤二,根据缺失率对原始数据进行行列剔除处理,然后进行行遍历生成行对应数组,再将数组转换为直方图形式,计算出对应直方图构成的最大的矩形面积,接着对所有矩形面积进行排序,采集得到最大的完整信息矩阵;步骤三,采用基于链式方程进行的多重填补方法或基于编码器的多重填补方法或基于对抗生成网络的填补方法,对原始数据进行缺失值填补。本发明能够对原始数据进行缺失信息统计,自动搜寻满足条件的最大完整信息,补全结构化数据,极大提高原始数据集的质量,对后期的预测任务提供了便利。

    一种面向车险反欺诈的图像标注及要素抽取方法与系统

    公开(公告)号:CN114462553A

    公开(公告)日:2022-05-10

    申请号:CN202210376689.2

    申请日:2022-04-12

    Abstract: 本发明公开了一种面向车险反欺诈的图像标注及要素抽取方法与系统,本发明方法针对车险现场采集,事后补充图片等图像进行反欺诈要素提取。本发明系统包括:车险要素表构建模块,图像采集模块、标注功能模块和要素提取模块,其中标注功能模块包括多标签类别标注模块,车损部位标注模块,人脸标注模块;要素提取模块用于对各个标注数据集进行要素提取。本发明主要聚焦于建立面向车险反欺诈的图像要素标注与提取,使得提取的图像要素更客观,生成可以用于交叉验证车险结构化数据,提高数据质量。

    天文知识图谱构建方法、资源查找方法、设备和介质

    公开(公告)号:CN116932780B

    公开(公告)日:2024-01-09

    申请号:CN202311179452.6

    申请日:2023-09-13

    Abstract: 本申请涉及一种天文知识图谱构建方法、资源查找方法、设备和介质,获取资源对应的天体信息,其中,天体信息包括天体的形态特征和天体的坐标;基于形态特征对天体分类,得到多个天体类别;根据天体的坐标计算同一天体类别下每两个天体之间的距离,将每个天体作为节点,将属于同一个天体类别的每两个天体进行关联,构建得到多个知识图谱;获取各天体的光谱特征,在任意第一知识图谱和第二知识图谱之间,将具备相似光谱特征的天体进行关联。通过本申请天文知识图谱构建方法,提高了构建的知识图谱的准确性,有利于相关人员基于知识图谱搜索系统、完善的天体信息。(56)对比文件陈淑鑫;孙伟民;王丽丽.网格聚类分析天文光谱数据.计算机科学.2017,(第S2期),463-466.

Patent Agency Ranking