-
公开(公告)号:CN115424696A
公开(公告)日:2022-12-02
申请号:CN202211374618.5
申请日:2022-11-04
Applicant: 之江实验室
Abstract: 本发明公开了一种基于迁移学习的中医罕见病中药处方生成方法和系统,包括以下步骤:步骤S1:得到中医知识学习模型;步骤S2:基于多头自注意力机制的LSTM模型生成对应的中药名序列;步骤S3:得到中药剂量生成模型;步骤S4:将所述中药名序列和所述特征数据集合并作为所述中药剂量生成模型的输入,依次生成每味中药推荐的剂量,最终生成完整的中药处方。本发明使用两段式迁移学习算法,以自建中医语料库为基础,训练中医领域的中医知识学习模型,使用中医临床罕见病例对中医知识学习模型进行修正。本方法模拟了中医医生的学习过程,其生成的中药处方也将更加契合患者的病情,充分利用了医生在临床诊疗过程中产生的经验性知识。
-
公开(公告)号:CN116991983A
公开(公告)日:2023-11-03
申请号:CN202311259460.1
申请日:2023-09-27
Applicant: 之江实验室
Abstract: 本发明公开一种面向公司资讯文本的事件抽取方法及系统,该发明在面向公司资讯文本的事件抽取任务中,面对噪声公司名对模型性能干扰的难题,提出一种新的标注规则,将噪声公司名纳入实体识别的标注体系中,并设定噪声公司名对应的事件类别;将需要同时抽取公司名字段和判定公司名对应事件类型的噪音难题转换为简单的分类问题,极大地缓解了模型的压力,降低了任务的难度;并构建一种公司名及事件类型的两阶段抽取模型,提高了模型抽取公司名字段和判定公司名对应事件类别的精度。
-
公开(公告)号:CN116501898B
公开(公告)日:2023-09-01
申请号:CN202310781210.8
申请日:2023-06-29
Applicant: 之江实验室
IPC: G06F16/36 , G06F16/35 , G06F40/30 , G06F40/103 , G06F18/214 , G06N3/045 , G06N3/047 , G06N3/048 , G06N3/082 , G06Q40/00
Abstract: 本发明公开了一种适用于少样本和有偏数据的金融文本事件抽取方法和装置,针对金融事件任务中事件类型较多,不同事件发生地频率也不相同,往往存在少样本和有偏的情况,从事件主体和事件类型两个层面上对样本较少数据进行增强,有效地缓解了有偏及少样本类型数据对模型提取结果的影响;针对描述文本中同一事件主体出现多次且对应多个事件类型的难题和描述文本中多个事件主体对应同一事件类型的难题,构建了包括基于事件主体预测和事件类型预测两级分布处理的抽取模型,该抽取模型经过增强后训练样本的训练,能够提高各情况金融文本事件的准确抽取。
-
公开(公告)号:CN116306657A
公开(公告)日:2023-06-23
申请号:CN202310565366.2
申请日:2023-05-19
Applicant: 之江实验室
IPC: G06F40/295 , G06F16/33 , G06N20/00 , G06F16/35
Abstract: 本发明公开一种基于方阵标注和双仿射层注意力的实体抽取方法及系统。本发明由文本数据库模块、文本预处理模块、文本建模模块、输出模块四个部分组成。该系统是首次将图像语义分割的思想融入文本实体抽取的任务中,将传统的序列标注任务转变成方阵标注任务,并使用双仿射层注意力机制将序列表示的语义向量转化为长宽均为文本序列长度的方阵,缓解了中文文本实体识别任务中实体边缘检测难,检测精度低的问题。
-
-
-