-
公开(公告)号:CN120045637A
公开(公告)日:2025-05-27
申请号:CN202510206885.9
申请日:2025-02-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/31 , G06F40/289 , G06F40/284 , G06F40/186 , G06N3/08 , G06N3/0442 , G06N3/0455
Abstract: 本说明书实施例公开了一种文本抽取方法、装置、设备以及介质。该方案包括:将获取的待处理文本按照预设切分颗粒度进行切分处理,得到若干个切分位置;在若干个切分位置处插入用于区分不同子文本的索引编码,得到编码后文本;将编码后文本输入至预先训练的文本抽取模型,利用文本抽取模型输出符合任务要求的目标索引编码,根据所述目标索引编码,确定待处理文本中与目标索引编码对应的目标子文本。