基于前置分类器的中立文本生成方法

    公开(公告)号:CN117390189A

    公开(公告)日:2024-01-12

    申请号:CN202311458205.X

    申请日:2023-11-05

    Inventor: 赵力丹 李童 杨震

    Abstract: 本发明公开了基于前置分类器的中立文本生成方法。现有方法使用同一个文本生成器对句子中引发偏见的词进行替换或删除操作实现主观偏见的消除,然而这类方法受到不同操作分布的影响,当某一种操作较少时,模型更偏向于进行另一种操作。本方法针对去偏问题的特点,进行细粒度的分析处理,提升去偏的效果;该方法主要分为三步:序列标注模型标记待操作序列;分类器判断操作策略(提取文本语义向量;文本句法特征嵌入;特征融合;MLP实现分类);中立文本生成。本方法结合句子的语义特征和句法特征对操作类型进行细粒度分析并标记出待操作序列,同时,根据操作类型(替换或删除),我们采取相应的生成策略来得到表达中立的句子。

Patent Agency Ranking