网络社区类群与用户的表征模型的建模方法

    公开(公告)号:CN117312489A

    公开(公告)日:2023-12-29

    申请号:CN202311078577.X

    申请日:2023-08-25

    Applicant: 复旦大学

    Inventor: 魏忠钰 张辛农

    Abstract: 本发明的目的是提供一种网络社区类群与用户统一建模的图预训练方法,所述方法包括:通过对社区级和用户级两类不同的对象抽取语义信息和结构信息,搭建具有层次特征的异质图模型;在该模型的预训练过程中,通过引入能够适应不同层级对象的自监督任务,训练模型能够表示不同层级对象的特征,以及层级之间的相互关系;在该模型的预训练过程中,通过设计层次化迭代的训练方法,模型能够促进不同层级之间的相互表示,完成以社区、用户为目标对象的多种复杂推断任务。

    用于解释开放域问答模型的可视分析系统

    公开(公告)号:CN116383370A

    公开(公告)日:2023-07-04

    申请号:CN202310169737.5

    申请日:2023-02-27

    Applicant: 复旦大学

    Abstract: 本发明属于开放域问答模型分析技术领域,具体为用于解释开放域问答模型的可视分析系统。本发明系统包括解释引擎模块、流程分析模块以及视图模块;解释引擎模块使用归因方法对OpenQA模型的每个模块的最终输出和隐式输出在全局和局部级别进行归因;流程分析模块把VEQA中的模型信息、数据以及经由解释引擎生成的可解释性数据被可视化为用户分析界面的各个视图,用户按照线性工作流以数据集、子集、单个实例、单个段落的顺序进行多层次探索;视图模块包括摘要视图、上下文视图、实例视图和树视图,用于可视化分析;本发明系统可帮助理解OpenQA模型的决策原因,并为模型改进提供见解;系统还支持对单个模块内的决策流程进行细粒度探索。

    图像描述的生成方法和装置

    公开(公告)号:CN112508048B

    公开(公告)日:2023-06-06

    申请号:CN202011136029.4

    申请日:2020-10-22

    Applicant: 复旦大学

    Inventor: 魏忠钰 范智昊

    Abstract: 本申请实施例提供了一种图像描述的生成方法和装置,其中,该方法包括:获取目标图像中的物体数据和关系数据;根据物体数据和关系数据确定出目标图像的主题数据;调用预训练的图像处理模型获取并根据上述数据通过底层表征隐式地推断出目标图像中的高层语义信息,来生成与目标图像对应的图像描述;其中,上述预训练的图像处理模型具有对底层表征进行抽象的能力。该方法通过先从物体数据和关系数据中抽象出主题数据,再利用包含有主题节点的预训练的图像处理模型,根据主题数据、物体数据和关系数据,来共同确定出目标图像的图像描述,从而可以高效地得到能准确地表征出目标图像中的高层语义信息的图像描述。

    图像文本对的判断方法和装置

    公开(公告)号:CN115017356A

    公开(公告)日:2022-09-06

    申请号:CN202210615255.3

    申请日:2022-06-01

    Applicant: 复旦大学

    Inventor: 魏忠钰 范智昊

    Abstract: 本申请实施例提供了一种图像文本对的判断方法,包括以下步骤根据图片的句子级语义标签生成短语级语义标签;建立模态间关系模型和模态内关系模型;根据全局配对、局部配对和短语配对计算图片文本匹配度,全局配对由模态间关系模型和模态内关系模型生成整体图片和句子的相似度,局部配对由模态间关系模型生成图片和字符短语之间相似度以及句子和图片区域之间的相似度,短语配对在图片和字符短语相似度的基础上,根据短语级语义标生成。在跨模态语义编码当中,本申请通过引入短语节点来扩展自注意力编码器输入,并在编码过程中保持短语与单词的层次结构关系,以实现更好的多粒度语义建模。本申请提供了短语级别的细粒度损失函数来指导模型区分不匹配的句子,使模型更多地基于不相关的局部部分做出决策。这方法不仅有助于模型获得更好的检索性能,而且使之具有可解释性和可信度。

    在消息交互传播中进行谣言判别的方法及装置

    公开(公告)号:CN112528015A

    公开(公告)日:2021-03-19

    申请号:CN202011154448.0

    申请日:2020-10-26

    Applicant: 复旦大学

    Inventor: 魏忠钰 陈蕾

    Abstract: 本发明公开了一种在消息交互传播中进行谣言判别的方法及装置,其涉及人工智能识别技术领域,包括:对帖子的文本信息进行编码,并分析相关联的帖子之间的关系,从而生成消息交互的控制向量a;根据动态时间序列模型捕获交互信息的变化,应用注意力机制将各个时间阶段信息进行聚合,对帖子是否属于谣言进行预测;基于消息交互的控制向量a得到模型总体的损失函数,计算损失函数然后进行梯度回传,从而对提出模型进行训练和拟合,计算得到模型的最优参数网络,使用最优参数网络下的模型对帖子是否属于谣言进行预测。本申请能够通过传播过程中信息交互模式的建模和与交互模式的时序演化特征捕捉时间动态结构匹配以提高谣言判别的准确性。

    一种多跳问答模型的评估方法、装置及存储介质

    公开(公告)号:CN114911900B

    公开(公告)日:2025-01-24

    申请号:CN202210469885.4

    申请日:2022-04-30

    Applicant: 复旦大学

    Inventor: 魏忠钰 丁佳玙

    Abstract: 本说明书实施例提供一种多跳问答模型的评估方法、装置及存储介质,所述方法包括:获取目标问题和多跳问答模型的数据库中与所述目标问题的真实答案相对应的原始文本;提取所述原始文本中的推理链;所述推理链表示推理得到所述目标问题的答案所使用的多个实体之间的关系;根据所述推理链的类型生成干扰所述多个实体之间的关系的至少一个干扰文本;将所述至少一个干扰文本加入至所述原始文本中,得到测试文本;根据所述多跳问答模型从测试文本中推理得到的推理答案评估所述多跳问答模型的抗干扰能力,从而实现定向地对模型进行评估,准确地查找到模型的弱点。

    长短期记忆辅助的文档级事件论元提取方法以及迭代框架

    公开(公告)号:CN117436435A

    公开(公告)日:2024-01-23

    申请号:CN202311170862.4

    申请日:2023-09-12

    Applicant: 复旦大学

    Inventor: 魏忠钰 游涛

    Abstract: 长短期记忆辅助的文档级事件论元提取方法以及迭代框架。本发明的目的是为文档事件信息抽取提供一种基于提示(prompt)的、长短期记忆的句子迭代抽取框架,所述方法包括:通过将文档输入拆分成句子输入进行抽取,以突破transformer的输出长度限制;包含事件信息以及事件论元交互的提示作为论元抽取器,用于句子论元抽取。为进一步利用文档全局信息和句子抽取结果,记忆存储器用于存储已抽取的句子作为文档长记忆信息,在下一次迭代中同句子一同输入从而让句子也能获得句子外的文档信息;包含论元本体信息和文档局部信息的句子抽取结果,作为短记忆信息,用于提示的更新以辅助模型对句子迭代抽取。

    文本属性图的表征模型、预训练的自监督方法、节点表示更新的模型框架

    公开(公告)号:CN117312490A

    公开(公告)日:2023-12-29

    申请号:CN202311078582.0

    申请日:2023-08-25

    Applicant: 复旦大学

    Inventor: 魏忠钰 旷皓予

    Abstract: 本发明的目的是提供一种文本属性图的表征模型,用于预训练的自监督方法、以及一种节点表示更新的模型框架,所述方法包括:通过将文本属性图中的单词与基础的图结构解耦,并将单词作为节点建模到原有的图结构中,建模为层次文本属性图;进一步通过针对层次文本属性图中不同层级的自监督任务,捕捉原数据中的语义信息和结构信息;在模型训练阶段,通过均值聚合器对节点的表示进行更新,并使用更新后的节点表示作为输入,利用自监督任务继续进行预训练,从而得到层次文本属性图中的节点、单词的表示,完成图中的节点分类和链接预测任务。

    一种模型训练的方法、装置、存储介质及电子设备

    公开(公告)号:CN116451808A

    公开(公告)日:2023-07-18

    申请号:CN202310451948.8

    申请日:2023-04-23

    Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质及电子设备,获取图文对和翻译文本对,将图文对中的描述文本和翻译文本对包含的两种语言文本输入到预设的视觉语言模型中的文本特征提取层中,以通过文本特征提取层得到描述文本和两种语言文本的文本特征,并将图文对中的图像输入到视觉语言模型中的图像特征提取层中,以通过图像特征提取层得到图像的图像特征。根据图文对中图像的图像特征与描述文本的文本特征,以及翻译文本对中包含的两种语言文本的文本特征,确定目标损失;根据目标损失,对视觉语言模型进行训练。

Patent Agency Ranking