明喻句式的成分抽取方法、装置、计算机可读介质及设备

    公开(公告)号:CN115688765A

    公开(公告)日:2023-02-03

    申请号:CN202211338577.4

    申请日:2022-10-28

    Applicant: 厦门大学

    Abstract: 本申请的实施例提供了一种明喻句式的成分抽取方法、装置、计算机可读介质及设备。该方法包括:确定待处理文本对应的分词结果、分词掩码矩阵以及基于句法依存关系的邻接矩阵;对词性为名词的分词进行词义检索,得到所述待处理文本对应的名词释义集合;将所述待处理文本与所述名词释义集合进行拼接,并输入至BERT编码器中,得到对应的文本表示矩阵;将所述文本表示矩阵与所述分词掩码矩阵相乘,得到对应的词结点矩阵;基于GAT算法对所述词结点矩阵和所述邻接矩阵进行表示更新,以得到所述待处理文本对应的结点表示;基于所述结点表示,对所述待处理文本进行明喻成分抽取。本申请实施例的技术方案提高明喻句式中成分识别以及抽取的准确性。

    缓解语言对差异冲突的多语言机器翻译模型的训练方法

    公开(公告)号:CN112329481A

    公开(公告)日:2021-02-05

    申请号:CN202011167339.2

    申请日:2020-10-27

    Applicant: 厦门大学

    Abstract: 本发明提出了一种缓解语言对差异冲突的多语言机器翻译模型的训练方法,该方法包括:获取训练语料,其中,训练语料包括多个语言对;建立多语言机器翻译模型,并根据训练语料的每个语言对对多语言机器翻译模型进行训练;在训练过程中,计算训练语料中所有语言对对应的导数,并对任意两个语言对对应的导数进行冲突调整,以获取调整后的所有语言对对应的导数;根据调整后的所有语言对对应的导数对多语言机器翻译模型参数进行更新,以得到训练好的多语言机器翻译模型;由此,通过对任意两个语言对对应的导数进行冲突调整,从而减轻了不同语言对的训练实例对模型参数更新的导数冲突问题,从而提高了多语言机器翻译模型在多个语言对上的整体效果。

    一种可有效促进拟南芥营养生长的光照装置

    公开(公告)号:CN109362392A

    公开(公告)日:2019-02-22

    申请号:CN201811605903.7

    申请日:2018-12-26

    Applicant: 厦门大学

    CPC classification number: A01G7/045

    Abstract: 一种可有效促进拟南芥营养生长的光照装置,涉及植物培养光照装置。设有植物培养架、中性光荧光灯管、中性光荧光灯架、UV-B灯管、UV-B灯架、植物种植盒、定时器和温度计;植物培养架设有4层,植物培养架大小根据所需培养的植物占地面积调整;中性光荧光灯管设在中性光荧光灯架上,UV-B灯管设在UV-B灯架上,中性光荧光灯架设在每层植物培养架的顶部并平行于植物培养架;UV-B灯架垂直于中性光荧光灯架并置于中性光荧光灯架底部,中性光荧光灯管和UV-B灯管独立受定时器控制并分别为拟南芥生长提供不同的光源;温度计设在植物培养架侧面,植物种植盒设在植物培养架上,用于种植拟南芥,使拟南芥处于一定的营养环境中。

    一种适用于超高温热解反应原位检测的加热传输装置

    公开(公告)号:CN119618791A

    公开(公告)日:2025-03-14

    申请号:CN202411806136.1

    申请日:2024-12-10

    Applicant: 厦门大学

    Abstract: 本发明公开了一种适用于超高温热解反应原位检测的加热传输装置,包括加热管和调节组件;所述加热管的出样端能够连接检测装置;所述加热管分为低温区、高温区和退火区,所述低温区外套设第一水冷电极,所述退火区外套设第二水冷电极;所述调节组件包括导轨和滑动块,所述滑动块与第一水冷电极或连接。本发明通过加热管与水冷电极组合设计形成变径变温区域,保证加热管与保护电极的接触,在退火区构建出较为缓慢且均匀的降温梯度,保证了产物分子的生成和分散,提高了大分子量化合物传输效率。本发明便于连接质谱仪,可以实现超高温热解反应的原位分析,解决了热解反应中大分子量产物如多环芳烃、富勒烯等因分子间作用力而发生聚集导致无法被原位检测的问题。

    基于残差连接的缓解数据偏置模型的训练方法及装置

    公开(公告)号:CN117150011A

    公开(公告)日:2023-12-01

    申请号:CN202311067350.5

    申请日:2023-08-23

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于残差连接的缓解数据偏置模型的训练方法及装置,其中,该方法包括以下步骤:获取文本数据集;构建文本分类模型,其中,文本分类模型包括多个transformer堆叠而成,且在多个transformer中的底层接入第一分类器,顶层接入第二分类器;根据文本数据集对文本分类模型进行训练,得到训练好的缓解数据偏置模型,以便根据缓解数据偏置模型进行文本分类预测,其中,在训练过程中,将底层得到的文本表示和顶层得到的文本表示相加后输入到第二分类器进行分类,以得到预测概率;由此,通过构建训练缓解数据偏置模型,从而在达到在缓解数据偏置的同时,还避免了额外的计算资源消耗。

    一种采用辉光电离源的原位热解装置

    公开(公告)号:CN119943643A

    公开(公告)日:2025-05-06

    申请号:CN202510098276.6

    申请日:2025-01-22

    Applicant: 厦门大学

    Abstract: 本发明提供一种采用辉光电离源的原位热解装置,包括高温热解装置、辉光电离装置、两级采样锥、四极杆装置及飞行时间质量分析器;高温热解装置包括第一铜块、第二铜块、石墨套筒及长石墨管;辉光电离装置包括第一电极固定筒、第二电极固定筒及环形电极;两级采样锥分为一级采样锥、二级采样锥;四极杆装置包括四根互相平行、对称放置的四极杆电极。热解反应物通过高温热解装置产生富勒烯及其中间体产物,后由辉光电离装置对产物分子进行电离,电离后的离子通过两级采样锥,并在四极杆装置的射频电场和直流电场的引导下,到达飞行时间质量分析器进行原位质谱分析,可以实现“先电离,后取样”的原位质谱分析,捕捉到高温热解形成的富勒烯及其中间体。

    一种基于Incep-CapsNet网络的篆文识别方法及系统

    公开(公告)号:CN108805223A

    公开(公告)日:2018-11-13

    申请号:CN201810480506.5

    申请日:2018-05-18

    Applicant: 厦门大学

    Inventor: 杨帆 于飞 刘鑫

    CPC classification number: G06K9/6828

    Abstract: 本发明涉及一种基于Incep‑CapsNet网络的篆文识别方法及系统,方法包括:获取篆文图像数据集,并按照字形与字体制作分类标签;对图像数据集进行预处理与图像增广操作;通过Incep‑CapsNet网络对预处理和图像增广后的篆文图像进行特征提取并识别分类;通过重构网络对预处理和图像增广后的篆文图像进行重构,作为一种有效的正则化方式。本发明能够根据Inception结构提取出更多更本质的特征,并根据胶囊网络克服传统深度卷积神经网络模型所存在的无法识别特征的朝向以及空间中的相对位置等缺点,既具有精确的识别精度,又具有较强的鲁棒性。

    模型去偏的数据集增强方法
    8.
    发明公开

    公开(公告)号:CN117093870A

    公开(公告)日:2023-11-21

    申请号:CN202311099815.5

    申请日:2023-08-29

    Applicant: 厦门大学

    Abstract: 本发明公开了一种模型去偏的数据集增强方法,包括以下步骤:获取数据集;构建偏置模型,并采用数据集中的部分数据对偏置模型进行训练,以便采用训练好的偏置模型得到数据集中的每个样本对应的偏置程度;根据偏置程度对数据集中的每个样本进行排列,并将排序好的每个样本等分为多个组,每个组对应拼接一个偏置指示器,以得到具有偏差指标的数据集;构建生成器,并采用具有偏差指标的数据集对生成器进行训练,以便通过训练好的生成器生成偏置程度低的伪样本;采用偏置程度低的伪样本对原始数据集进行扩增,以得到扩增后的数据集;迭代进行伪样本生成,从而得到最终的数据集;由此,达到了缓解数据偏置的目的,避免了人工资源耗费。

    缓解语言对差异冲突的多语言机器翻译模型的训练方法

    公开(公告)号:CN112329481B

    公开(公告)日:2022-07-19

    申请号:CN202011167339.2

    申请日:2020-10-27

    Applicant: 厦门大学

    Abstract: 本发明提出了一种缓解语言对差异冲突的多语言机器翻译模型的训练方法,该方法包括:获取训练语料,其中,训练语料包括多个语言对;建立多语言机器翻译模型,并根据训练语料的每个语言对对多语言机器翻译模型进行训练;在训练过程中,计算训练语料中所有语言对对应的导数,并对任意两个语言对对应的导数进行冲突调整,以获取调整后的所有语言对对应的导数;根据调整后的所有语言对对应的导数对多语言机器翻译模型参数进行更新,以得到训练好的多语言机器翻译模型;由此,通过对任意两个语言对对应的导数进行冲突调整,从而减轻了不同语言对的训练实例对模型参数更新的导数冲突问题,从而提高了多语言机器翻译模型在多个语言对上的整体效果。

    一种基于Incep-CapsNet网络的篆文识别方法及系统

    公开(公告)号:CN108805223B

    公开(公告)日:2021-03-23

    申请号:CN201810480506.5

    申请日:2018-05-18

    Applicant: 厦门大学

    Inventor: 杨帆 于飞 刘鑫

    Abstract: 本发明涉及一种基于Incep‑CapsNet网络的篆文识别方法及系统,方法包括:获取篆文图像数据集,并按照字形与字体制作分类标签;对图像数据集进行预处理与图像增广操作;通过Incep‑CapsNet网络对预处理和图像增广后的篆文图像进行特征提取并识别分类;通过重构网络对预处理和图像增广后的篆文图像进行重构,作为一种有效的正则化方式。本发明能够根据Inception结构提取出更多更本质的特征,并根据胶囊网络克服传统深度卷积神经网络模型所存在的无法识别特征的朝向以及空间中的相对位置等缺点,既具有精确的识别精度,又具有较强的鲁棒性。

Patent Agency Ranking