-
公开(公告)号:CN103559193B
公开(公告)日:2016-08-31
申请号:CN201310410816.7
申请日:2013-09-10
Applicant: 浙江大学
Abstract: 本发明公开了一种基于选择单元的主题建模方法,包括如下步骤:根据查询请求提取数据库中的搜索结果包含的单词、片段结构和单词特征;确定建模采用的主题数;随机分配产生各个片段结构主题、单词主题及二元选择子;通过Gibbs采样过程迭代地确定上述变量;根据上述变量的最终分配结果向用户反馈各个主题中的显著文档和单词,以及具有各种特征的单词表达其所在片段结构的主题的能力。本发明具有的有益效果有:可同时在多种模态数据上进行主题建模;充分利用了数据隐含的结构信息,并消除了结构限制过强的不利效果;可提供文档中单词特征与片段结构限制之间的关联度等信息,为用户在理解数据上提供帮助;具有良好的可扩展性,可作为多种应用的算法基础。
-
公开(公告)号:CN104484346A
公开(公告)日:2015-04-01
申请号:CN201410706246.0
申请日:2014-11-28
Applicant: 浙江大学
IPC: G06F17/30
CPC classification number: G06F17/30867
Abstract: 本发明公开了一种基于混合距离依赖中餐馆过程的层次化主题建模方法,包括如下步骤:首先用自然语言处理(NLP)工具从新闻文档中提取出事件要素;然后利用这些要素和文档内容作为产生文档之间链接的依据;在模型的估计过程中这些链接和他们相连的点(即文档)构成一个有向无环图(DAG),亦即事件发展结构图;最后将类似的事件聚集到一起,形成主题。本发明具有的有益效果有:能够在保证模型简单灵活的前提下涵盖多个事件要素;模型的输出既是层级的又是结构化的,这保证了既能找出事件,又能够发掘出其主题;对于一个特定的事件,可以描述出它的发展过程;具有良好的可扩展性,可作为多种应用的算法基础。
-
公开(公告)号:CN104317834A
公开(公告)日:2015-01-28
申请号:CN201410531101.1
申请日:2014-10-10
Applicant: 浙江大学
CPC classification number: G06F16/3331 , G06F16/5846
Abstract: 本发明公开了一种基于深度神经网络的跨媒体排序方法。包括如下步骤:1)将文本检索图像的排序样本或图像检索文本的排序样本构建为训练样本;2)对构建得到的训练样本进行基于深度神经网络的跨媒体排序学习,得到多媒体语义空间以及跨媒体排序模型;3)使用学习得到的跨媒体排序模型进行跨媒体检索。本发明由于使用了跨媒体排序数据驱动的深度神经网络,因此得到的检索模型的语义理解能力更强,在图像检索文本或文本检索图像中所取得性能较传统的浅层模型方法更好。
-
公开(公告)号:CN101079054A
公开(公告)日:2007-11-28
申请号:CN200710069839.0
申请日:2007-07-02
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明涉及一种基于ContextFS上下文文件系统的格式转换方法,主要包括以下步骤:根据可计算设备的配置信息,得到可以量化比较的权值,通过权值大小设定用户可计算设备的计算能力,如果定义了格式转换的规则,则按照规则转换;如果未定义规则,则根据对设备计算能力的划分选择最接近该设备计算能力能处理的文件类型;文件格式转换时采用链式转换,格式转换程序负责生成转换链,并根据转换链对各种文档进行格式转换;格式转换程序在多条转换链中根据各个转换所要消耗的计算能力,设定权值,并根据权值选择合适的转换链进行转换。本发明有益的效果是:可以根据用户携带的可计算设备的计算能力,将原文件转换成相应格式,转换后的文件是原文件的副本。
-
公开(公告)号:CN119066183B
公开(公告)日:2025-05-13
申请号:CN202411570021.7
申请日:2024-11-06
Applicant: 浙江大学
IPC: G06F16/3329 , G06F16/334 , G06F18/22 , G06N3/0455 , G06N5/022
Abstract: 本发明提供了一种开放域问答方法、装置、设备及存储介质,属于自然语言处理技术领域,包括:获取待查询问题,在知识库中检索待查询问题的相关文档;将待查询问题和相关文档输入预训练的问答模型,生成待查询问题的候选答案;验证候选答案的正确性,若候选答案未通过验证,则基于检索得到的相关文档和待查询问题生成关于候选答案中缺失内容的反馈;基于候选答案中缺失内容的反馈在知识库中再次检索待查询问题的相关文档;迭代生成候选答案、验证和再次检索的过程,直至候选答案通过验证。该方法能够提高大语言模型对于复杂问题的回答准确性。
-
公开(公告)号:CN112036170B
公开(公告)日:2025-04-29
申请号:CN202010918084.2
申请日:2020-09-03
Applicant: 浙江大学
IPC: G06F40/279 , G06F16/353 , G06F18/22 , G06F18/213 , G06F18/214 , G06N3/0464 , G06N3/049 , G06N3/08
Abstract: 本发明公开了一种基于类型注意力的神经零样本细粒度实体分类方法,具体为:基于目标实体文本中各单词对应的单词向量,计算目标实体文本表示向量;基于句子中目标实体文本两侧各单词分别对应的语境单词向量,获取目标实体文本的基础语境向量;基于目标实体文本中各实体对应的类型,构建实体类型向量;基于目标实体类型向量及基础语境向量,计算两侧单词分别对应的相关注意力值;基于相关注意力值及基础语境向量,计算目标实体文本的相关语境向量;合并目标实体文本的实体表示向量和相关语境向量,获取整个句子的表示向量,利用已创建的实体类型分类器模型,获取目标实体文本属于各给定类别的分值,并有效改善实体细粒度分类的效果。
-
公开(公告)号:CN119577102A
公开(公告)日:2025-03-07
申请号:CN202510143753.6
申请日:2025-02-10
Applicant: 浙江大学
IPC: G06F16/3329 , G06N5/04 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于自举式生成的图表反事实问答构建方法及系统,包括提取图表图像中的视觉描述和元数据;基于图表视觉描述文本,通过大语言模型的少样本提示方法生成与图表视觉描述文本相对应的初始反事实假设提案,以自举的方式生成达到数量要求的提案储备;基于图表元数据和初始问题答案对,对假设提案储备采样出反事实假设提案样本,通过大语言模型的少样本提示方法生成反事实问题答案对;在收集达到数量要求的反事实问题答案对后,核查反事实问题答案对的文本和数值。本发明能够构建具有反事实逻辑的图表问答数据集,能为视觉问答模型的性能评测生成具有挑战性的测试集,能为视觉文本模型的训练提供具有多样性的训练语料。
-
公开(公告)号:CN119150978A
公开(公告)日:2024-12-17
申请号:CN202411626400.3
申请日:2024-11-14
Applicant: 浙江大学
IPC: G06N5/025 , G06F40/35 , G06F16/36 , G06F16/332 , G06F16/33 , G06F40/289 , G06N3/0455
Abstract: 本发明公开了一种基于多智能体的网格治理知识图谱构建方法,属于知识图谱构建领域。本发明包括以下步骤:预先设计智能体角色信息,为每个智能体编写智能体提示语,并构建对应的智能体,对照智能体角色信息进行角色对齐,当智能体的实际能力与智能体角色配置存在偏差时,优化智能体提示语,直至生成满足要求的智能体;通过自然语言对话形式构建知识图谱;当有新知识需要补充到构建好的知识图谱中时,由相应智能体按需更新知识图谱,完成知识图谱的构建。本发明的方法充分利用大规模预训练语言模型的习得知识、自然语言处理能力和任务泛化能力,基于多智能体的多视角特点和大规模预训练语言模型的反思机制增强了任务执行结果的质量。
-
公开(公告)号:CN113554078B
公开(公告)日:2023-10-17
申请号:CN202110788454.X
申请日:2021-07-13
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/44 , G06V10/82 , G06V10/774 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于对比类别集中提升连续学习下图分类精度的方法。该方法用于对已经过历史数据训练的图分类模型进行类增长学习,具体步骤如下:S1:获取加入新类别的图像分类数据集,图像分类数据集中每个样本均带有其类别标签;S2:获取所述图分类模型在上一轮训练过程中进行参数更新前的旧模型和参数更新后的新模型,然后利用加入新类别的图像分类数据集构建训练数据,进行本轮训练;S3:保存本轮参数更新前的旧模型和参数更新后的新模型,并在进行下一轮训练之前利用本轮参数更新后的新模型进行图分类任务。本发明结合对比学习和知识蒸馏的思想,能够帮助模型学习到更加聚合的数据表征,从而缓解表征覆盖,帮助模型减少灾难性遗忘。
-
公开(公告)号:CN112329879A
公开(公告)日:2021-02-05
申请号:CN202011280061.X
申请日:2020-11-16
Applicant: 浙江大学
Abstract: 本发明公开了一种基于反事实多智能体学习的图像场景图的生成方法和系统。该方法把图像场景图生成任务转换成为一种多智能体协同决策任务。其中将每个物体看成是一个智能体,每个智能体的动作空间是所有可选择的物体类别。每个智能体之间可以进行通信,来编码周围的视觉元素,提升智能体内部的特征表达。经过多轮智能体通信之后,再利用一个视觉关系预测模型来预测智能体之间的视觉关系,得到最终的场景图预测结果。本发明提出全新的反事实多智能体学习模型,使用场景图生成的评价指标作为模型的优化目标,反事实多智能体学习模型包含一个反事实基准模型,本发明可以通过提升物体类别的准确率,显著提升场景图生成质量。
-
-
-
-
-
-
-
-
-