文本提取方法、模型训练方法计算机设备及存储介质

    公开(公告)号:CN115512366A

    公开(公告)日:2022-12-23

    申请号:CN202211020224.X

    申请日:2022-08-24

    Abstract: 本申请实施例提供了一种文本提取方法、模型训练方法计算机设备及存储介质,该方法包括:获取目标图像,所述目标图像至少包括字符区域;对所述目标图像进行文本识别,得到若干文本行,各所述文本行包括若干字符;基于文本分类模型,识别各所述文本行的段落类型;根据各所述文本行的段落类型,对所述若干文本行进行拼接,得到目标文本,所述目标文本包括若干文本段落。通过识别各文本行的段落类型,根据各文本行的段落类型,可以将文本识别得到的文本行拼接成包含语义段落信息的自然段,更符合用户的阅读习惯。

    金融行为检测方法及相关装置、电子设备和存储介质

    公开(公告)号:CN116485511A

    公开(公告)日:2023-07-25

    申请号:CN202310319239.4

    申请日:2023-03-28

    Inventor: 刘宇 何春江 张毅

    Abstract: 本申请公开了一种金融行为检测方法及相关装置、电子设备和存储介质,其中,金融行为检测方法包括:获取金融行为数据,并基于金融行为检测模型对金融行为数据进行检测,得到金融行为数据的行为标签;行为标签至少表征金融行为数据是否属于异常金融行为,金融行为检测模型基于训练样本集进行训练得到,训练样本集包含标注有样本行为标签的样本金融行为数据,样本行为标签至少表征样本金融行为数据是否属于异常金融行为,训练样本集基于初始样本集进行数据增强得到,且训练样本集内不同样本行为标签的样本金融行为数据具有相同数量级。上述方案,能够提高金融行为检测结果的准确性。

    信息检索方法、装置、相关设备及计算机程序产品

    公开(公告)号:CN119248834A

    公开(公告)日:2025-01-03

    申请号:CN202411351015.2

    申请日:2024-09-26

    Abstract: 本申请公开了一种信息检索方法、装置、相关设备及计算机程序产品,本申请配置了专家模型集合,包含两个以上的专家模型,不同专家模型对应不同的检索领域,对于用户的查询请求,通过配置的动态路由网络动态调配专家模型集合中每个专家模型的输出权重,通过调用每个专家模型,基于查询请求在信息检索库中执行检索,得到每个专家模型的检索结果,按照各个专家模型的输出权重,对各个专家模型的检索结果进行合并,得到最终的检索结果。本申请提供了一个更加强大的集成学习框架,实现更高的检索精度和更广的适用范围,提升了对于复杂多样化信息数据检索结果的准确性。

    一种文本图像识别方法、系统及相关装置

    公开(公告)号:CN115909381A

    公开(公告)日:2023-04-04

    申请号:CN202211567149.9

    申请日:2022-12-07

    Abstract: 本申请公开了一种文本图像识别方法、系统及相关装置,该方法包括:获取包括待识别文字的文本图像,基于所述文本图像获得所述待识别文本对应的初始文字、以及所述初始文字对应的识别置信度得分;基于各个所述初始文字的语义信息,获得各个所述初始文字的语义置信度得分;基于各个所述初始文字对应的所述识别置信度得分和所述语义置信度得分,从所有所述初始文字中确定至少部分待纠正文字;对所述待纠正文字进行纠正,得到所述文本图像对应的目标文本。通过上述方式,本申请能够提高对文本图像进行识别的准确性。

Patent Agency Ranking