表格生成文本模型的训练方法、表格生成文本方法和装置

    公开(公告)号:CN117892785A

    公开(公告)日:2024-04-16

    申请号:CN202410041377.5

    申请日:2024-01-11

    Inventor: 林谢雄 褚崴

    Abstract: 本说明书的实施例提供了一种用于训练表格生成文本模型的方法和装置。在该用于训练表格生成文本模型的方法中,在每个模型训练过程:利用表格编码模型根据当前训练样本的表格得到表格特征表示;根据该表格以及基于表格中各个数值和预定数值操作进行组合得到的数值操作结果集,生成对应的衍生数值推理图;利用路径生成模型根据表格特征表示和该衍生数值推理图得到衍生值生成路径特征表示;再利用文本解码模型结合表格特征表示、衍生值生成路径特征表示以及衍生词表得到该表格的描述文本;最后根据该描述文本和该表格的文本标签之间的差异确定当前训练过程的损失函数值,进而调整表格编码模型、路径生成模型和文本解码模型当前的模型参数。

    通过神经网络模型进行文档图像处理的方法及装置

    公开(公告)号:CN117351324B

    公开(公告)日:2024-03-01

    申请号:CN202311647324.X

    申请日:2023-12-04

    Abstract: 本公开提供一种通过神经网络模型进行文档图像处理的方法及装置,神经网络模型预先通过整体训练得到,其中至少包括匹配预测网络和逻辑交互网络,方法包括:从包含文档内容的目标图像中识别出多个文字;对于多个文字中任意两个文字构成的文字组合,使用匹配预测网络,得到文字组合属于同一语义字段的第一概率;在逻辑交互网络中,根据与文档理解相关的若干条约束规则,更新各个文字组合对应的第一概率,得到各个文字组合对应的第二概率;基于各个文字组合对应的第二概率,确定多个文字各自所属的语义字段。该实施方式使用包括约束规则的神经网络模型确定文档图像中多个文字各自所属(56)对比文件孙忠严.“逻辑规则增强的中医实体表示学习与应用研究”《.中国优秀硕士学位论文全文数据库 医药卫生科技辑》.2023,第2023年卷(第10期),第E056-3页.Rinon Gal et.al..“Cardinal graphconvolution framework for documentinformation extraction”《.Proceedings ofthe ACM Symposium on Document Engineering2020》.2020,第7卷第1–11页.张雪;孙宏宇;辛东兴;李翠平;陈红.自动术语抽取研究综述.软件学报.2020,(第07期),第136-168页.

    用户响应预测系统的训练方法、用户响应预测方法及装置

    公开(公告)号:CN117350351A

    公开(公告)日:2024-01-05

    申请号:CN202311645094.3

    申请日:2023-12-04

    Inventor: 张雷 何建杉 褚崴

    Abstract: 本说明书实施例中提供了一种包括用户响应预测系统的训练方法,系统包括行为预测模型、干预表征模型、特征映射模型和倾向预测模型。方法包括获取样本,样本中包括用户特征,对用户施加的第一干预和施加第一干预后用户做出的第一响应;将用户特征输入已训练的行为预测模型,得到第二响应;将第一干预输入干预表征模型,得到干预表征;将用户特征分别输入特征映射模型和倾向预测模型,得到映射特征和倾向性特征;基于干预表征、映射特征和倾向性特征,对第二响应进行修正,得到第三响应;基于根据第一响应和第三响应的差异而确定的第一损失和根据倾向性特征和第一干预表征的差异而确定的第二损失,训练干预表征模型、特征映射模型和倾向预测模型。

    机器阅读理解中的数值推理方法和装置

    公开(公告)号:CN112507074A

    公开(公告)日:2021-03-16

    申请号:CN202011436272.8

    申请日:2020-07-31

    Abstract: 本说明书实施例提供一种机器阅读理解中的数值推理方法和装置。方法包括:获取当前问题和当前文本;确定当前问题和当前文本中包括的各实体和各数字,以及各数字分别对应的类型;构建关系网络图,包括对应于各实体的实体节点,和对应于各数字的数字节点,在相同类型的数字节点之间,以及具有预设关系的实体节点和数字节点之间,通过连接边形成邻居;确定当前问题对应的第一问题表征向量,以及关系网络图中各节点的初始表征向量;基于各节点的初始表征向量,对所述关系网络图中的各节点进行预定次数的迭代,以得到各节点的更新表征向量。能够提高机器阅读理解中的数值推理处理复杂问题的能力。

    用于知识图谱的数据预处理方法及装置

    公开(公告)号:CN111309823A

    公开(公告)日:2020-06-19

    申请号:CN202010089110.5

    申请日:2020-02-12

    Abstract: 本说明书实施例提供一种用于知识图谱的数据预处理方法和装置,在确定知识图谱中的节点及连接关系类别的向量表达时,以三元组中首节点对应的第一节点向量与首节点和尾节点之间的连接关系类别对应的第一关系向量的哈达玛积融合得到中间向量,并将中间向量与尾节点对应的第二节点向量的距离作为参考评价指标,基于对正负样本在参考评价指标上的取值的调整,更新相应的节点向量及关系向量。这种方式在节约参数的基础上,能够同时表达诸如对称关系、相反关系、组合关系等常见关联关系,提升知识图谱的表达能力。

    编码装置、数据处理方法及装置
    9.
    发明公开

    公开(公告)号:CN119918635A

    公开(公告)日:2025-05-02

    申请号:CN202510051894.5

    申请日:2022-07-06

    Inventor: 郭清沛 褚崴

    Abstract: 本说明书实施例提供编码装置、数据处理方法及装置,其中所述编码装置包括编码层和至少一个联合编码单元,其中,所述编码层对接收到的第一模态初始特征向量和第二模态初始特征向量进行编码,生成第一模态特征向量和第二模态特征向量,所述至少一个联合编码单元对所述第一模态特征向量和第二模态特征向量进行联合编码,所述至少一个联合编码单元包括编码模块和模态输入切换模块,所述模态输入切换模块被配置为对第一模态特征向量和第二模态特征向量进行处理得到第一模态切换编码向量和第二模态切换编码向量;所述编码模块被配置为对接收的第一模态切换编码向量和第二模态切换编码向量进行处理生成第一目标模态融合向量和第二目标模态融合向量。

Patent Agency Ranking