基于二维分子图的分子类药性无监督预测方法及装置

    公开(公告)号:CN118866166B

    公开(公告)日:2025-01-07

    申请号:CN202411372121.9

    申请日:2024-09-29

    Applicant: 厦门大学

    Abstract: 本申请提出了一种基于二维分子图的分子类药性无监督预测方法及装置,其中,该方法包括:首先,在大量包括类药和非类药分子的数据库ChEMBL上,通过原子掩码预测和化学键掩码预测的预训练任务训练教师模型,使其学到了和类药性高度相关的分子拓扑结构的特征;然后,仅在药物数据上蒸馏出一个与教师模型结构相同的学生模型;接着,将一个任意分子分别输入到教师模型和学生模型,并将两个模型输出的特征表示的差距作为这个任意分子的类药性分数;最后,根据类药性分数对这个任意分子的类药性进行预测,以得到预测结果;由此,通过训练好的教师模型和学生模型能够直接捕捉和类药性高度相关的分子特征,同时极大地缓解了一维序列模型的长度偏差问题。

    融入迭代式句对关系预测的图神经网络句子排序方法

    公开(公告)号:CN113869033B

    公开(公告)日:2024-08-09

    申请号:CN202111123744.9

    申请日:2021-09-24

    Applicant: 厦门大学

    Abstract: 本发明公开了一种融入迭代式句对关系预测的图神经网络句子排序方法和介质,其中方法包括:构建句子实体图;通过初始句对顺序分类器对所述句子实体图进行分析,以预测所述句子实体图中相连句对的顺序;根据所述句子实体图中相连句对的顺序进行训练,以得到迭代句对顺序分类器,并通过所述迭代句对顺序分类器对所述句子实体图中连边的权重进行迭代更新;根据迭代更新后的句子实体图进行训练,以得到句子排序模型;获取待排序句子信息,并将所述待排序句子信息输入到所述句子排序模型,以通过所述句子排序模型输出待排序句子信息对应的句子排序方式;能够有效提高句子排序的准确性。

    基于译文树结构解码路径动态选择的机器翻译方法

    公开(公告)号:CN113869069B

    公开(公告)日:2024-08-06

    申请号:CN202111063749.7

    申请日:2021-09-10

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于译文树结构解码路径动态选择的机器翻译方法和介质,其中方法包括:获取人工标注的机器翻译数据;对目标语言句子进行解析,以得到该目标语言句子对应的目标语言成分句法树,并根据源语言句子和对应的目标语言成分句法树生成训练数据;进行模型的训练,以生成基于译文树结构解码路径动态选择的机器翻译模型;获取待翻译源语言句子,并将待翻译源语言句子输入到基于译文树结构解码路径动态选择的机器翻译模型,以通过基于译文树结构解码路径动态选择的机器翻译模型生成对应的目标语言成分句法树和目标语言句子;能够有效提高机器翻译过程中成分句法树的生成效率,提高机器翻译准确率。

    缓解过度联想的对话查询生成模型的训练方法及装置

    公开(公告)号:CN116340484A

    公开(公告)日:2023-06-27

    申请号:CN202310213004.7

    申请日:2023-03-07

    Applicant: 厦门大学

    Inventor: 苏劲松 王安特

    Abstract: 本申请公开了一种缓解过度联想的对话查询生成模型的训练方法及装置,该方法包括获取训练样本集,其中,训练样本集中的每个训练样本包括对话上下文和对话查询;根据每个训练样本对应的对话上下文和对话查询得到对应的过度联想程度值;构建对话查询生成模型,并采用过度联想程度值调整训练样本权重以对对话查询生成模型进行第一阶段训练,以得到初步对话查询生成模型;根据初步对话查询生成模型的输出结果对初步对话查询生成模型的训练目标进行调整,以便对初步对话查询生成模型进行第二阶段训练,直至收敛以完成训练;由此,通过数据及模型两个层面的训练策略调整,降低了过度联想程度高的训练样本对模型的负面影响,从而生成更准确的对话查询。

    基于译文树结构解码路径动态选择的机器翻译方法

    公开(公告)号:CN113869069A

    公开(公告)日:2021-12-31

    申请号:CN202111063749.7

    申请日:2021-09-10

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于译文树结构解码路径动态选择的机器翻译方法和介质,其中方法包括:获取人工标注的机器翻译数据;对目标语言句子进行解析,以得到该目标语言句子对应的目标语言成分句法树,并根据源语言句子和对应的目标语言成分句法树生成训练数据;进行模型的训练,以生成基于译文树结构解码路径动态选择的机器翻译模型;获取待翻译源语言句子,并将待翻译源语言句子输入到基于译文树结构解码路径动态选择的机器翻译模型,以通过基于译文树结构解码路径动态选择的机器翻译模型生成对应的目标语言成分句法树和目标语言句子;能够有效提高机器翻译过程中成分句法树的生成效率,提高机器翻译准确率。

    对话篇章解析方法
    6.
    发明公开

    公开(公告)号:CN113377915A

    公开(公告)日:2021-09-10

    申请号:CN202110692574.X

    申请日:2021-06-22

    Applicant: 厦门大学

    Abstract: 本发明公开了一种对话篇章解析方法、介质和设备,其中方法包括:获取历史对话信息,并对历史对话信息进行预处理,以生成初始训练样本;根据初始训练样本生成第一训练样本和第二训练样本;根据第一训练样本进行模型训练,以得到结构自感知教师模型;根据第二训练样本进行模型训练,以得到结构自感知学生模型,并拉近结构自感知教师模型的结构关系和结构自感知学生模型的结构关系,以得到最终结构自感知学生模型;获取待解析对话信息,并将待解析对话信息输入到最终结构自感知学生模型,以生成对应待解析对话信息的对话轮次间篇章关系;能够自动对对话信息进行解析,避免因引入显式预测结果而导致的错误传播;同时,提高篇章解析效果。

    一种基于内部语义层次结构的词嵌入表示方法

    公开(公告)号:CN107025219B

    公开(公告)日:2019-07-26

    申请号:CN201710256916.7

    申请日:2017-04-19

    Applicant: 厦门大学

    Abstract: 一种基于内部语义层次结构的词嵌入表示方法,涉及基于深度学习的自然语言处理。使用开源工具获得输入文本中每个词语的内部层次结构:该结构类似于传统短语树结构,不同的是以字符为基本单位,并且标注每个字符在该结构中的层次位置和类别信息;根据层次结构不变性原则对上述结构进行序列化操作,得到保持词内部的层次位置、类别信息的文本序列;将双向GRU网络作用于上述序列进行嵌入表示编码,然后将前向和后向GRU网络得到的两个嵌入表示向量进行拼接,最后通过非线性变换,ReLU操作,得到词语的最终嵌入表示向量。框架结构清晰简洁、方法直观,有助于学习内涵更为丰富的词嵌入表示,更好地为后续的自然语言处理任务服务。

    基于快速自动密度聚类的可变尺度红外小目标的检测方法

    公开(公告)号:CN106407989B

    公开(公告)日:2019-05-28

    申请号:CN201610805463.4

    申请日:2016-09-07

    Applicant: 厦门大学

    Abstract: 基于快速自动密度聚类的可变尺度红外小目标的检测方法,涉及图像分析与图像理解。利用SURF算子解决尺度可变小目标的特征提取。解决特征对于环境的敏感问题;快速自动化密度聚类算法,针对问题域,直接从空域完成轨迹的分割、提取,克服了原有序列检测问题中数据融合带来的指数级复杂度问题。解决了聚类过程中产生的过分割以及欠分割问题,保证了轨迹提取的完整性和独立性以及聚类中心的自动选择。在后期的轨迹提取中,利用回溯算法寻找最优解,将轨迹具有的平滑不变约束融入剪枝函数的设计,快速剪掉无关的杂波分支,加快了搜索解的速度。结合鲁棒的特征检测算子和回溯策略,解决可变尺度红外小目标的检测问题,提高算法的实时性和鲁棒性。

    一种基于参数线性约束的多任务分词方法

    公开(公告)号:CN106844345A

    公开(公告)日:2017-06-13

    申请号:CN201710065928.1

    申请日:2017-02-06

    Applicant: 厦门大学

    Abstract: 一种基于参数线性约束的多任务分词方法,涉及基于深度学习的自然语言处理。使用不同分词标准的数据对不同分词模型进行初步训练;对于不同分词模型,共享部分参数,对另外的参数建立线性约束关系;建立统一的目标函数,进行不同分词模型的训练。利用参数的线性约束来建模不同分词模型之间的关系,使得不同分词标准模型的训练能够使用另外分词标准的训练数据。本发明算法明确、思路清晰,利用这个方法能够扩增现有分词模型的训练数据,提高中文分词任务的性能,更好地服务于基于分词的其他自然语言处理任务。

    基于数据依赖性和访问量云数据分配存储优化方法及系统

    公开(公告)号:CN105430074A

    公开(公告)日:2016-03-23

    申请号:CN201510779709.0

    申请日:2015-11-13

    CPC classification number: H04L67/1097 H04L67/327

    Abstract: 本发明公开一种基于数据依赖性和访问量云数据分配存储优化方法(1)初始阶段的数据分配,a:原始数据中的固定数据集分配到相应数据中心;计算非固定数据集中每一个数据集与其他数据集之间的相关度;b:依次分配每一个数据集,选择与之相关度最大的数据集;若无法分配则放置等待队列中,等待最后阶段分配;(2)运行阶段,a:根据传输开销将任务调度到传输开销最小的数据中心执行;b:执行完毕后若新产生任务与数据集,则首先更新任务集合,然后根据数据集与数据中心的相关度,选择相关度最大的数据中心放置中间数据集。本发明还公开一种实现上述方法的系统。采用本发明不仅考虑数据的访问量而且考虑数据间的依赖性,大大提高了云计算下的访问效率。

Patent Agency Ranking