一种基于背景知识的视频描述自动生成方法

    公开(公告)号:CN119603524A

    公开(公告)日:2025-03-11

    申请号:CN202411802767.6

    申请日:2024-12-09

    Applicant: 同济大学

    Inventor: 方钰 林星 郑杜磊

    Abstract: 本发明在短视频时代提供了一种基于背景知识的视频描述自动生成方法,该方法主要是通过利用短视频相关的弹幕和评论信息结合视频信息来生成更加准确的视频描述。传统的视频描述方法由于缺乏相关的背景知识(背景知识通常是和视频相关的先验知识,如人物姓名,事件,地点等等)导致视频描述质量并不理想,本发明使用弹幕和评论信息作为相关的背景知识来源,结合视频内容进行描述。本发明的创新点在于引入了弹幕和评论这些信息来辅助短视频描述生成,并且基于CLIP的文本预处理方案来减少背景知识中的噪音,该方法有效提高了视频描述的生成质量。

    一种联合序列标注和模式匹配的事件元素检测方法

    公开(公告)号:CN113177416B

    公开(公告)日:2022-06-07

    申请号:CN202110532819.2

    申请日:2021-05-17

    Applicant: 同济大学

    Abstract: 目前的中文医疗事理知识图谱事件元素检测研究主要基于单一的模式匹配或深度学习模型,且未对事件元素进行长短级粒度划分,不能有效抽取长句级元素,导致了模型灵活性不高、泛化性差。因此,本发明提出了一种联合序列标注和模式匹配的事件元素检测方法,创新点在依据事件类型对其中的事件元素进行粒度区分,并针对不同粒度的事件元素采用不同的方法进行检测。首先,对于短词级事件元素检测,使用基于序列标注的BERT‑BiLSTM‑CRF模型,并结合实体信息、触发词信息等语料特征,以实现较强的可扩展性。其次,通过联合依存句法分析的模式匹配方法,进行了长句级事件元素的检测,由此提高事件元素检测的准确率。

    一种肺部X线胸片检查报告自动生成方法

    公开(公告)号:CN111243729B

    公开(公告)日:2022-03-08

    申请号:CN202010013066.X

    申请日:2020-01-07

    Applicant: 同济大学

    Abstract: 目前的X线胸片检查报告自动生成方法无法准确地生成长段的检查报告、无法有效地捕获胸片包含的语义信息、未考虑中文检查报告中正常样本描述相似的特点。一种肺部X线胸片检查报告自动生成方法,本发明的创新点在于利用胸片的语义标签生成检查报告,并针对中文检查报告的特点加入二分类器来区分胸片的正常与异常,有效地提高了自动生成中文检查报告的精确度。

    一种基于负样本多样性的问答模型集成方法

    公开(公告)号:CN113254609A

    公开(公告)日:2021-08-13

    申请号:CN202110516176.2

    申请日:2021-05-12

    Applicant: 同济大学

    Inventor: 方钰 翟鹏珺 崔雪

    Abstract: 一种基于负样本多样性的问答模型集成方法。自动问答系统的问答匹配阶段常通过集成模型来捕捉语料中多角度的信息,从而提升问答系统的准确性和稳定性。在中文医疗问答领域,现有问答模型集成方法大多数使用随机采样或单一相似度距离分段采样的方法获取负样本,忽略了负样本的多样性,进而导致基模型的多样性不足,影响了集成模型的效果。本发明根据正负样本间的多种相似度距离,分别对负样本进行排序和分段采样,由此构成多个训练样本集,并基于这些训练样本集训练出多个基模型最后进行集成,不仅弥补了基模型多样性的不足,也提升了问答模型的稳定性和准确率。

    一种面向样本不均衡的多疾病分类器设计方法

    公开(公告)号:CN112560900A

    公开(公告)日:2021-03-26

    申请号:CN202011365674.3

    申请日:2020-11-28

    Applicant: 同济大学

    Abstract: 本发明目的在于克服现有技术的不足,给出一种面向样本不均衡的多疾病分类器设计方法,首先对按其疾病类别将医学病例数据划分为多个病例样本子集,然后对每个样本子集进行病症关联规则的特征选择方法,选择出该病例样本子集的特征向量,然后在不均衡度为上限阈值的前提条件下,迭代随机更新采用概率,对病例样本子集进行均衡化,然后再训练每一个样本子集的弱分类器并计算其分类效果,并最终通过判断macro‑F1的差值是否满足迭代收敛阈值来决定迭代生成多疾病分类器是否结束。

    中文电子病历的关系抽取方法

    公开(公告)号:CN111223539A

    公开(公告)日:2020-06-02

    申请号:CN201911388053.4

    申请日:2019-12-30

    Applicant: 同济大学

    Abstract: 一种基于中文电子病历的关系抽取方法,其特征在于,使用NLPIR分词器对中文电子病历文本进行分词,提取词和词性特征,即基本特征;对中文电子病历文本进行分句,抽取实体对,保留其起始和终止位置信息、实体类别以及修饰信息;提取电子病历的章节名字为章节信息特征(病历特征),为扩展特征;构建关系指示词词典,提取每对实体对的核心词特征,为扩展特征;利用LTP工具对分句后的句子进行依存分析,得到句子各成分之间依存关系;将二元实体的句法依存关系、实体对的依存关系以及二元实体与核心谓词的距离作为依存句法特征;将上述基本特征、扩展特征和依存特征组成的特征向量输入已训练好的支持向量机分类器,抽取中文电子病历的实体关系。

    语音合成装置、语音合成方法以及GPS语音导航系统

    公开(公告)号:CN1956056B

    公开(公告)日:2010-05-12

    申请号:CN200610117188.3

    申请日:2006-10-16

    Applicant: 同济大学

    Abstract: 一种语音合成装置以及方法,用于具有GPS导航装置的GPS语音导航系统中,其主要包括语音存储单元、索引存储单元,分析单元以及播放单元;其储存道路导航过程中所使用到的以词段为单位的语音格式道路信息,并对应地生成至少包含所述语音格式道路信息的文本描述、偏移量及数据长度的文本格式道路信息,在播放一导航语句之前,先将导航语句拆分为多个语音格式道路信息,并以一预定关键词检索基本资料库中的文本格式道路信息,接着解析检索到的文本格式道路信息,获得与之对应的语音格式道路信息,最后将所述导航语句涉及到的以词段为单位的语音格式道路信息重组,再进行语音播报,本发明还提供一种包括上述语音合成装置的GPS语音导航系统。

    数据库索引的方法
    8.
    发明公开

    公开(公告)号:CN101286160A

    公开(公告)日:2008-10-15

    申请号:CN200810038369.6

    申请日:2008-05-30

    Applicant: 同济大学

    Abstract: 本发明揭示了一种数据库索引的方法,该方法包括如下步骤:步骤A、根据索引数据库建立一B+树;步骤B、定义步骤A中的B+树的数据结构,将重复的键值存储于B+树的叶节点中;步骤C、执行索引操作,包括查询操作、插入操作、删除操作。本发明的利用B+树的数据库索引方法,由于将重复出现的键值直接存储在B+树的叶节点中,避免了使用溢出节点,所以当溢出节点相对于键值较大时,而数据表中又存在一定量的重复键值的情况下,本发明能够有效地避免空间的浪费,从而减少索引文件的大小,同时也拓宽了B+树的适用范围。由此优化了数据库索引方案。

    用网格技术实现交通信息服务的系统和方法

    公开(公告)号:CN1904935A

    公开(公告)日:2007-01-31

    申请号:CN200510028150.4

    申请日:2005-07-26

    Applicant: 同济大学

    Abstract: 一种用网格技术实现交通信息服务的系统和方法,所述系统分为信息点播与展示层、应用服务层、网格服务层、资源层,所述信息点播与展示层包括服务点播与信息展示装置,所述资源层包括计算资源、数据库、程序代码库、交通模型库,所述信息点播与展示层用于信息点播和展示,所述应用服务层用于接受和分辨信息点播的服务类型并向网格服务层发出服务请求,所述网格服务层响应服务请求,调用资源层中的资源进行处理和计算,并将计算结果发送至信息展示装置。本发明首次将网格技术应用于交通智能系统,通过网格技术对异构交通信息和资源进行整合,基于海量的车辆GPS数据,实现全区域路网的路况预测和实时路况信息服务,为出行者提供动态出行方案。

    一种基于Unix V6的页式连续存储管理系统的地址映射方法

    公开(公告)号:CN118394676A

    公开(公告)日:2024-07-26

    申请号:CN202410597855.0

    申请日:2024-05-14

    Applicant: 同济大学

    Inventor: 徐海岩 邓蓉 方钰

    Abstract: 本发明属于计算机系统存储管理领域,是一种基于Unix V6系统的连续内存管理方式地址映射优化方法。本方法令所有进程共用同一块用户页表区域,将只读数据段与代码段映射至一块连续的物理空间,将其它的逻辑段映射至另一块连续的物理空间。进程切换时,系统根据现运行进程的各个逻辑段在用户空间中的布局,细粒度地更新系统页表。本发明特别适用于将Unix V6系统运行在物理内存空间有限、进程图像不大的应用场景,可以在无需为每个进程分别分配页表的前提下,提高地址映射关系的重建速度。系统物理内存利用率高,进程切换速度快,可以为页式连续存储操作系统的地址映射和速度优化提供可参考借鉴。

Patent Agency Ranking