-
公开(公告)号:CN114492440B
公开(公告)日:2024-10-15
申请号:CN202210016537.1
申请日:2022-01-07
Applicant: 清华大学
IPC: G06F40/295 , G06F40/242 , G06N3/0464 , G06N3/0895 , G06N3/049
Abstract: 本申请涉及命名体识别技术领域,特别涉及一种利用字典知识的命名体识别方法、装置、电子设备及介质,其中,方法包括:获取文本中文本数据的上下文表示;利用实体词典匹配文本的匹配实体,获取匹配实体的隐向量表示;以及基于上下文表示和隐向量表示获取文本联合实体的表示和实体联合上下文的表示,生成命名体识别结果。由此,解决了在识别命名体时通常需要大量的领域知识及人工标注,且严重依赖标注句子来训练命名体识别模型等问题,通过采用多种模型来得到文本的单词的上下文表示并使用双向门控循环单元对匹配实体进行单词级建模从而得到该实体的表示,通过文本和实体的表示联合学习,提升了命名体识别的性能。
-
公开(公告)号:CN116484020A
公开(公告)日:2023-07-25
申请号:CN202310450112.6
申请日:2023-04-24
Applicant: 清华大学
IPC: G06F16/36 , G06F40/30 , G06F40/295 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本申请涉及知识图谱技术领域,特别涉及一种融合拓扑和语义信息的知识图谱表征方法及装置,其中,方法包括:获取实体描述文本的第一向量表示和实体召回文本的第二向量表示,联合第一向量表示与第二向量表示进行对比学习,并联合实体描述文本的第一向量表示与知识图谱的嵌入式表示进行距离向量模型的学习,得到知识图谱表征结果。本申请实施例可以通过建模知识的语义信息,设计基于真实文本的语义表征对比学习任务和基于知识图谱关联的拓扑表征对比学习任务,以获得知识图谱表征结果,从而实现语义信息与拓扑信息的融合,保障了知识图谱的表征效果,提高了图谱表征针对不同知识图谱及场景的适应性,更加可靠实用。
-
公开(公告)号:CN116401357A
公开(公告)日:2023-07-07
申请号:CN202310337398.7
申请日:2023-03-31
Applicant: 清华大学
IPC: G06F16/335 , G06F40/194 , G06F18/22 , G06F18/25 , G06N3/0464 , G06N3/0499 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本申请涉及文档检索技术领域,特别涉及一种基于跨模态互注意力机制的多模态文档检索方法及装置,其中,方法包括:建模文档的多模态表示,基于多模态互注意力机制得到目标文档感知的多模态文档表示,融合文档的自注意力向量化表示和多模态增强向量化表示,得到文档的多模态增强统一表示,计算目标文档和至少一个候选文档相关性分数并进行排序,检索到相关的文档。本申请实施例可以基于跨模态互注意力机制,通过获取文档多模态增强的统一表示,计算相关性分数以检索获得匹配文档,从而实现了文档多模态信息的充分利用,增强了文档各模态间的相关性,进而提升了文档检索结果的匹配度,使检索结果更加准确可靠。
-
公开(公告)号:CN115620918A
公开(公告)日:2023-01-17
申请号:CN202211317843.5
申请日:2022-10-26
Applicant: 清华大学
Abstract: 本申请涉及一种基于历史病历关联挖掘的病历智能检索方法及装置,其中,方法包括:基于构建的病历模型对于候选病历和患者的历史病历进行建模,构建病历的向量化表示;基于候选感知的自注意力机制、候选感知的卷积神经网络、候选感知的注意力池化机制,融合候选病历和患者的历史病历,建模患者历史病历的向量化表示;基于候选病历的向量化表示和患者历史病历的向量化表示,计算候选病历的匹配结果,检索相关的候选病历。本申请实施例可以融合当前患者诊疗历史和候选病历,将用于匹配的候选病历整合到患者历史病历建模中,以实现候选病历与患者的准确匹配,提高检索的准确性和适用性。
-
公开(公告)号:CN114492440A
公开(公告)日:2022-05-13
申请号:CN202210016537.1
申请日:2022-01-07
Applicant: 清华大学
IPC: G06F40/295 , G06F40/242 , G06N3/04 , G06N3/08
Abstract: 本申请涉及命名体识别技术领域,特别涉及一种利用字典知识的命名体识别方法、装置、电子设备及介质,其中,方法包括:获取文本中文本数据的上下文表示;利用实体词典匹配文本的匹配实体,获取匹配实体的隐向量表示;以及基于上下文表示和隐向量表示获取文本联合实体的表示和实体联合上下文的表示,生成命名体识别结果。由此,解决了在识别命名体时通常需要大量的领域知识及人工标注,且严重依赖标注句子来训练命名体识别模型等问题,通过采用多种模型来得到文本的单词的上下文表示并使用双向门控循环单元对匹配实体进行单词级建模从而得到该实体的表示,通过文本和实体的表示联合学习,提升了命名体识别的性能。
-
公开(公告)号:CN107452403B
公开(公告)日:2020-07-07
申请号:CN201710817534.7
申请日:2017-09-12
Applicant: 清华大学
Abstract: 本发明提出一种说话人标记方法,属于声纹识别、模式识别与机器学习技术领域。本方法包括三个阶段:在第一阶段,通过i‑vector概率线性鉴别分析凝聚层次聚类方法将待测语音数据分为长度相等的片段,然后将片段聚为与说话人总数相等的类;在第二阶段,利用第一阶段的聚类结果,得到片段属于说话人的先验概率;在第三阶段,通过基于软判决的变分贝叶斯隐马尔科夫方法进行迭代,当系统收敛时,计算片段所属的说话人,说话人标记结束。本发明结合了两种说话人标记方法的优点,可有效地提高说话人标记的准确率。
-
公开(公告)号:CN106898354A
公开(公告)日:2017-06-27
申请号:CN201710123753.5
申请日:2017-03-03
Applicant: 清华大学
Abstract: 本发明提出基于DNN模型和支持向量机模型的说话人个数估计方法,属于语音信号处理和深度学习领域。模型训练阶段,首先获取N个说话人的训练语音数据,得到深度神经网络DNN模型;然后获取M个说话人的训练语音数据,每个说话人的梅尔倒谱特征对应DNN模型的N个输出概率,组成M个说话人的N维特征,建立M个支持向量机SVM模型;说话人个数估计阶段,将每条待测语音数据的梅尔倒谱特征输入DNN模型得到N维特征并依次输入M个SVM模型中评分,得分最高的SVM模型即为该条待测语音数据所对应的类别,类别总个数即为估计的说话人个数。该方法解决多说话人场景中说话人个数计算不准确的问题,提高语音数据中说话人个数估计的准确率。
-
公开(公告)号:CN102508578B
公开(公告)日:2015-07-22
申请号:CN201110302639.1
申请日:2011-10-09
Applicant: 清华大学深圳研究生院
CPC classification number: G06F3/0425 , G06F3/0304
Abstract: 本发明公开了一种投影定位装置,包括:投影仪,用于将具有设定规律的条纹图案投影到被测物体表面;摄像机,用于摄取由被测物体表面形状所调制的变形条纹图像;处理装置,用于根据所述变形条纹图像确定被测物体的空间位置和/或位置变化。在此还公开了相应的投影定位方法、交互系统和交互方法。通过将条纹图案投影到被测物体表面,摄取并分析被测物体表面起伏所调制的变形条纹图像,可以对被测物体例如具复杂三维手势的人手进行较高精度地定位和较快速度地实时跟踪,从而实现精准流畅的体感或触控操作。
-
公开(公告)号:CN102508575B
公开(公告)日:2014-10-22
申请号:CN201110354897.4
申请日:2011-11-10
Applicant: 清华大学深圳研究生院
Abstract: 本发明公开了一种屏幕书写装置,用于在投影屏幕上手写输入信息,包括接触块和压力传感器,所述接触块与所述投影屏幕相接触用于获取书写时的压力信息,所述压力传感器将所述接触块获取的压力信息转换为电信号;其特征在于:还包括电信号处理单元和变色材料;所述电信号处理单元将所述压力传感器输出的电信号转换为所述颜色变化模块能感知的信号;所述变色材料根据所述电信号处理单元输出的信号产生相应的颜色。本发明的屏幕书写装置,屏幕书写装置中不需再设置通信装置,屏幕书写装置的体积较小,方便携带,且交互过程能达到实时准确的要求。本发明还同时公开了一种屏幕书写系统及其实现方法。
-
公开(公告)号:CN119295751A
公开(公告)日:2025-01-10
申请号:CN202411415480.8
申请日:2024-10-11
Applicant: 嘉兴恒创电力设计研究院有限公司 , 清华大学
IPC: G06V10/26 , G06V20/70 , G06V20/10 , G06V10/40 , G06V10/80 , G06V10/82 , G06N3/0464 , G06V10/764
Abstract: 本申请涉及一种遥感图像的语义分割方法、装置、电子设备及存储介质。包括:对已获取的遥感图像数据集进行预处理,并利用预设的模型框架对预处理后的遥感图像数据集进行特征提取和融合,得到每个像素的融合后的特征,其中,预设的模型框架包括Mamba2编码器和CNN解码器;利用预设的分类网络对每个像素的融合后的特征进行分类,确定每个像素所对应的遥感图像的语义类别。由此,通过结合先进的模型Mamba2模型和卷积神经网络CNN,能够有效处理和分割各种尺度和复杂度的遥感图像,解决了现有技术在处理大尺寸图像时计算成本过高、处理复杂的依赖关系时受限于训练数据的不足和泛化能力的问题,从而提供更加准确的地物分类和语义信息。
-
-
-
-
-
-
-
-
-