文本规整方法、装置、电子设备和存储介质

    公开(公告)号:CN111832248B

    公开(公告)日:2024-07-05

    申请号:CN202010731385.4

    申请日:2020-07-27

    Abstract: 本发明实施例提供一种文本规整方法、装置、电子设备和存储介质,其中方法包括:确定待规整文本;将待规整文本输入至文本规整模型,得到文本规整模型输出的待规整文本对应的已规整文本;其中,文本规整模型是基于样本待规整文本、样本已规整文本,以及样本待规整文本中每一分词的样本编辑类型训练得到的;文本规整模型用于确定所述待规整文本中每一分词的编辑类型,并基于所述待规整文本中是否包含编辑类型为插入类型的插入分词确定所述待规整文本的规整方式,基于所述规整方式对待规整文本进行规整。本发明实施例提供的方法、装置、电子设备和存储介质,提升了文本规整的准确性和文本规整的效率。

    一种文本规整方法、装置、设备及存储介质

    公开(公告)号:CN113850071A

    公开(公告)日:2021-12-28

    申请号:CN202111136464.1

    申请日:2021-09-27

    Abstract: 本申请提供了一种文本规整方法、装置、设备及存储介质,其中,方法包括:获取待规整文本;利用预先构建的文本规整模型对待规整文本进行规整,以得到待规整文本对应的规整后文本;其中,文本规整模型采用训练样本训练得到,训练样本包括语义相同、表达不同且标注有相同规整后文本的多个训练文本,在采用训练样本训练文本规整模型时,对训练样本包含的多个训练文本的语义一致性进行约束。本申请提供的文本规整方法不但可将口语化的待规整文本规整为书面化的文本,还能保证规整后的文本语义不变。

Patent Agency Ranking