跨模态检索模型的训练方法及装置

    公开(公告)号:CN117435763A

    公开(公告)日:2024-01-23

    申请号:CN202311450485.X

    申请日:2023-11-02

    Inventor: 吴渝 王志文 蒲晓

    Abstract: 本发明公开了一种跨模态检索模型训练方法即装置,涉及人工智能技术领域。本发明的方法训练方法包括:提取训练集中数据对的文本局部特征和图像局部特征;基于图卷积神经网络推理文本局部特征与图像局部特征之间的关系,得到联合特征;解耦联合特征;对数据对进行跨模态一致性学习,得到图像特征和文本特征的一致性分数;基于解耦后的文本特征、图像特征、一致性分数训练跨模态检索模型。本发明融合了关系结构和图相似性特征,通过图神经网络聚合同一模态及异构模态局部特征之间的关系结构信息,再通过特征解耦重构局部特征,充分抓取图文模态内、模态间的关系结构信息,上下文语义,提高了语义理解程度,使得训练的跨模态检索模型准确率更高。

    一种针对司法裁判文书的摘要生成方法及系统

    公开(公告)号:CN117435725A

    公开(公告)日:2024-01-23

    申请号:CN202311451427.9

    申请日:2023-11-02

    Inventor: 杨杰 王志文 何睿

    Abstract: 本发明公开了一种针对司法裁判文书的摘要生成方法及系统,该方法包括:基于司法裁判文书的论辩结构对司法裁判文书进行段落划分,得到诉讼请求部分、被告辩称部分、审理查明部分和判决结果部分;结合BERT模型和GCN模型从每个论辩结构段落中提取关键句子,将各关键句子组成关键句集合;将关键句集合输入生成模型中,利用生成模型进行内容重写,生成每个论辩结构段落的子摘要;将每个论辩结构对应的子摘要拼接,生成最终的司法裁判文书摘要。本发明能够解决模型输入长度限制造成的信息丢失问题以及粗略截断造成的上下文信息不连贯问题。

    一种针对司法文书的类案推荐方法、系统及设备

    公开(公告)号:CN117435721A

    公开(公告)日:2024-01-23

    申请号:CN202311451422.6

    申请日:2023-11-02

    Inventor: 吴渝 何睿 王志文

    Abstract: 本发明公开了一种针对司法文书的类案推荐方法、系统及设备,包括:获取司法文书的原始数据,按照司法文书的类型对原始数据的司法文书内容进行剥离,得到三种剥离结果;采用ALBERT模型对各种剥离结果进行特征编码,分别提取司法文书分层次的语义特征信息向量;采用CNN网络将语义特征信息向量映射到同一隐空间,进行结构特征解耦并挖掘司法文书结构间的细粒度特征信息;构建三元组文书,根据细粒度特征信息及三元组文书,对原司法文书与候选司法文书进行相似度计算,得到相似度结果并进行相似案件推荐。本发明能最大程度保证司法文书的内容与结构完整性,获取效果更佳的推荐案件。

Patent Agency Ranking