一种面向医疗的少样本多模态细粒度实体分类方法及系统

    公开(公告)号:CN119917669A

    公开(公告)日:2025-05-02

    申请号:CN202510414327.1

    申请日:2025-04-03

    Applicant: 南开大学

    Abstract: 本发明涉及电数字数据处理技术领域,尤其涉及一种面向医疗的少样本多模态细粒度实体分类方法及系统,方法包括如下步骤:构建少样本训练集、少样本验证集及少样本测试集,并扩充文本信息得到扩充训练集;获得句子的文本表征;获得图像的全局视觉表征、局部对象表征及跨模态语义表征;获得优化后的单模态表征;获得多模态融合表征;计算每个细粒度实体类别的预测概率及二元交叉熵损失;进行迭代优化训练,直至达到设定次数,在少样本验证集上进行性能验证,在少样本测试集上开展最终效果评估。本发明提供的方法及系统通过有效地抽取层次化多模态特征提升细粒度分类的性能,可为医疗领域提供更加精确可靠的实体分类技术。

    一种多模态方面级情感分析方法

    公开(公告)号:CN116108186B

    公开(公告)日:2023-06-20

    申请号:CN202310390653.4

    申请日:2023-04-13

    Applicant: 南开大学

    Abstract: 本发明涉及人工智能技术领域,提供一种多模态方面级情感分析方法。该方法包括:采集数据并对数据进行预处理,生成图片数据和文本数据对应的语法依赖树,并抽取数据的多模态特征;搭建方面词注意模块,并通过方面词注意模块获取与方面词相关的方面词语义信息,生成语义特征;根据多模态特征和语法依赖树构建第一卷积网络,并构建多模态权重关联矩阵,通过多模态权重关联矩阵对第一卷积网络迭代更新;引入语义特征对应的情感值,并使用第一卷积网络对带有情感值的语义特征进行训练,生成面向方面词的情感特征;根据语义特征和情感特征构建第二卷积网络,输入待识别数据并获取识别结果,该方法有效地提高了情感分析的准确度和效率。

    数据处理方法及装置、电子设备、计算机可读存储介质

    公开(公告)号:CN116150700A

    公开(公告)日:2023-05-23

    申请号:CN202211556844.5

    申请日:2022-12-06

    Abstract: 本公开提供了一种数据处理方法及装置、电子设备、计算机可读存储介质。该方法包括:基于目标对象的时间序列数据获取目标对象的隐藏特征向量;基于目标对象的文本数据获取目标对象的实体特征向量和全局特征向量;其中,实体特征向量用于表征文本数据中实体的特征,全局特征向量用于表征文本数据的特征;将实体特征向量融合隐藏特征向量,获得实体融合特征向量,以及,将隐藏特征向量融合实体特征向量,获得隐藏融合特征向量;基于隐藏融合特征向量、实体融合特征向量和全局特征向量确定目标对象的多模态融合特征;基于目标对象的多模态融合特征预测目标对象出现目标状态的概率。本公开的实施例能够提高预测的准确性。

    一种关系表非键属性特征抽取与数据生成方法

    公开(公告)号:CN108920501B

    公开(公告)日:2021-09-03

    申请号:CN201810511653.4

    申请日:2018-05-25

    Applicant: 南开大学

    Abstract: 本发明提供了一种关系表非键属性特征抽取与数据生成方法。该方法可细分为三个处理阶段:特征抽取、特征变换、目标数据集生成。该方法首先对原始数据集进行特征抽取,获取特征空间,对两非键属性间频数的联合分布进行相关性度量排序;然后对抽取自原始数据集的特征空间进行特征变换;最后依照相关性度量系列从特征变换后的特征空间生成目标数据集。本发明提供了两种应用场景:特定数据模式下数据生成场景和预测数据集随时间变化的场景。本发明不但完善了关系表数据生成的研究,而且拓展了数据生成的应用场景。

    文档级别的事件论元抽取方法

    公开(公告)号:CN112528676A

    公开(公告)日:2021-03-19

    申请号:CN202011506990.8

    申请日:2020-12-18

    Applicant: 南开大学

    Abstract: 本发明提出了一种文档级别的事件论元抽取方法,本发明公开的方法是以非结构化的文档文本作为输入数据,构建基于深度学习的文档级别事件论元抽取模型,包含两个阶段,一个预训练阶段用于微调训练好的文本表示模型,一个抽取模型的训练和预测阶段用于学习各类事件角色的特征和生成预测结果,在两个阶段中均利用了事件角色的语义信息作为文本特征的扩充,以生成更加准确的事件论元抽取结果。对于普遍使用的文档级别事件论元抽取数据集,本发明的方法效果显著优于目前现有的文档级别事件论元抽取方法,证明事件角色的语义信息有助于从文档中进行事件论元的抽取。

    电子医疗记录数据的缺失值填充方法

    公开(公告)号:CN110957015A

    公开(公告)日:2020-04-03

    申请号:CN201911210250.7

    申请日:2019-12-02

    Applicant: 南开大学

    Abstract: 本发明提出了一种结合患者特征缺失规律的电子医疗记录数据的缺失值填充方法。本发明方法是构建由两个循环神经网络构成的联合模型,综合利用未缺失医疗数据的数值信息与患者特征的缺失规律,以判断患者生理状态并提取对应的状态特征,从而根据对应时刻患者的生理状态对各个特征缺失的值进行推断,实现合乎客观事实的患者特征缺失值的填充。对于缺失规律是非随机性的电子医疗记录数据,本发明方法的效果显著优于其他未考虑缺失规律的数据填充模型,证明医疗数据中的非随机缺失性质有助于模型判断患者生理状态,并且有益于模型对数据缺失值进行合理地填充。

    等领域。一种面向Twitter的社交广告可投放性分析方法

    公开(公告)号:CN104268130B

    公开(公告)日:2017-02-15

    申请号:CN201410494291.4

    申请日:2014-09-24

    Applicant: 南开大学

    Abstract: 一种面向Twitter的社交广告可投放性分析方法。包括:创新地结合Twitter用户多种不同来源的语料信息,构建多源Twitter语料库,有效扩充Twitter短文本,便于推断用户发布内容的潜在广告价值,以实现精准广告受众定位;借鉴LDA模型思想,提出多源Twitter语料主题分析模型,对用户发布内容进行隐含语义分析;基于语义分析结果,设计特征选择、过滤和表示算法,构建逻辑回归分类器,关于广告可投放性进行分类,作为广告推荐的决策依据。本发明充分利用用户发布信息特点,能够准确推断其潜在广告价值。通过本发明可得到符合用户真实意图的推断结果。本发明可用于Twitter等社交网络下的广告推荐

    原子转移自由基沉淀聚合法制备单分散的聚合物微球树脂

    公开(公告)号:CN102838709B

    公开(公告)日:2016-03-30

    申请号:CN201110166276.3

    申请日:2011-06-21

    Applicant: 南开大学

    Abstract: 本发明涉及一种采用原子转移自由基沉淀聚合法制备单分散的聚合物微球树脂的方法。所述的聚合物微球是交联度为50~95%的多烯类单体与其它功能性单烯类单体的共聚物微球,其粒径为200纳米至5微米,粒径多分散度≤1.03。上述聚合物微球是通过原子转移自由基沉淀聚合法制备的,微球表面带有原子转移自由基聚合活性引发基团,可进一步进行表面修饰。本发明具有条件简单、易于操作、原料价格便宜、表面活性基团含量可控的特点。所得单分散的“活性”纳米/微米聚合物微球可用于色谱柱的填料、药物缓释、以及催化剂和生物活性分子的载体。

    表面亲水性的分子印迹聚合物微球及其制备方法

    公开(公告)号:CN102059104B

    公开(公告)日:2014-04-16

    申请号:CN200910228423.8

    申请日:2009-11-17

    Applicant: 南开大学

    Abstract: 表面亲水性的分子印迹聚合物微球及其制备方法,本发明涉及一种表面亲水性的分子印迹聚合物微球的制备方法。所述分子印迹聚合物微球交联度在60%以上,粒径为1~5μm,表面具有亲水性高分子刷,在纯水溶液体系中对模板分子具有优异的分子识别性能。它们是采用可逆加成-裂解链转移(RAFT)可控自由基聚合技术两步法合成的。本发明具有合成方法简单、适用范围广、产品纯净等优点。所得分子印迹聚合物微球在色谱固定相、生物样品分析、医学临床免疫分析、食品与环境监测、模拟酶催化、仿生传感器等众多领域具有广阔的应用前景。

Patent Agency Ranking