-
公开(公告)号:CN119646196A
公开(公告)日:2025-03-18
申请号:CN202411893560.4
申请日:2024-12-20
Applicant: 南开大学 , 新奥新智科技有限公司
IPC: G06F16/334 , G06F16/3332 , G06F16/335 , G06F16/31
Abstract: 本发明涉及人工智能技术领域,提供一种检索增强生成优化方法、系统、设备、产品及介质,包括:获取原始文档,对原始文档进行整理与索引构建得到检索文档;构建混合检索器,通过混合检索器得到第一候选文档;通过第一候选文档生成假设文档,通过混合检索器对检索文档进行二次混合检索得到第二候选文档;计算第二候选文档的信息关联度;对第二候选文档进行筛选得到粗筛选文档;对粗筛选文档进行重组与分段得到分段文档,计算分段文档中单词的关键信息密度分数得到单词的词汇关键信息密度分数;根据细筛选阈值和词汇关键信息密度分数对分段文档进行筛选,得到目标文档。本发明有效提升了检索增强的可靠性和检索质量。
-
公开(公告)号:CN118152581A
公开(公告)日:2024-06-07
申请号:CN202211557077.X
申请日:2022-12-06
Applicant: 马上消费金融股份有限公司 , 南开大学
IPC: G06F16/36
Abstract: 本公开提供了一种知识图谱补全方法及装置、电子设备、计算机可读介质,该方法包括:获取第一实体以及第一实体在多个模态下的单模态关系;其中,单模态关系用于表征实体之间在单一模态下的关系;基于各个模态下的第一实体和第一实体的单模态关系预测出第一实体对应的至少一个候选实体,并基于第一实体、第一实体的单模态关系和至少一个候选实体获得至少一个候选实体的嵌入分数;基于各个模态下的嵌入分数和各个模态的权重从至少一个候选实体中确定第一实体对应的第二实体;其中,第一实体、单模态关系和第二实体为知识图谱中的三元组。根据本公开的实施例能够提高知识图谱补全的准确性。
-
公开(公告)号:CN116166770A
公开(公告)日:2023-05-26
申请号:CN202211233682.1
申请日:2022-10-10
Applicant: 马上消费金融股份有限公司 , 南开大学
IPC: G06F16/33 , G06F16/35 , G06F40/279 , G06F18/214 , G06F18/241 , G06N3/04
Abstract: 本公开提供了一种实体链接模型的训练方法及装置、实体链接方法及装置,该方法包括:对链接训练样本和链接训练样本对应的链接训练样本信息进行特征提取,获得链接训练样本的第一特征向量;链接训练样本是训练实体链接模型采用的样本;链接训练样本信息是与链接训练样本关联的信息;对链接训练样本的第一特征向量进行编码,获得链接训练样本的编码;基于链接训练样本的编码,获得链接训练样本的预测类型;预测类型是预测到的类型信息;基于链接训练样本的预测类型和链接训练样本的第一标准类型信息调整实体链接模型的参数。根据本公开的实施例能够提高实体链接模型的泛化能力,以及减少过拟合的情况。
-
公开(公告)号:CN116151254A
公开(公告)日:2023-05-23
申请号:CN202211556169.6
申请日:2022-12-06
Applicant: 马上消费金融股份有限公司 , 南开大学
IPC: G06F40/295 , G06N3/0895 , G06N3/0499 , G06N3/0464 , G06N3/0442 , G06F18/25
Abstract: 本公开提供了一种数据处理方法及计算机可读存储介质,所述数据处理方法用于对命名实体识别模型进行训练,包括:获取有标签训练样本对和无标签训练样本对;对应每个训练样本对,得到相应训练样本对对应的潜在表示特征并融合,进而,通过进行命名实体预测,得到有标签训练样本对的第一预测结果,以及无标签训练样本对的第二预测结果;根据每个训练样本对的潜在表示特征得到相应训练样本对的重构特征;基于第一预测结果、第二预测结果、各样本对和各样本对的重构特征确定三个损失函数,根据三个损失函数对命名实体识别模型进行训练。本公开实施例采用半监督训练,能够在保证模型准确率的情况下降低训练成本。
-
公开(公告)号:CN112417125B
公开(公告)日:2023-03-24
申请号:CN202011383042.X
申请日:2020-12-01
Applicant: 南开大学
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/242 , G06F40/126 , G06F40/289 , G06N3/092 , G06N3/0455 , G06N3/0442
Abstract: 本发明属于人工智能领域,涉及自然语言生成和情感分析,为对开放域对话系统引入内容连贯性控制和情绪合理性控制,提出一种基于深度强化学习的开放域对话回复方法及系统。该方法包括,获取对话输入内容进行预处理;预处理后的信息输入对话回复控制模型进行处理,对话回复控制模型包括对话生成模块、内容连贯性控制模块和情绪合理性控制模块,对话生成模块用于生成对话回复,内容连贯性控制模块用于使对话上下文内容连贯,情绪合理性控制模块用于句子情绪分类和判断回复情绪是否合理;输出内容连贯且情绪合理的对话回复。
-
公开(公告)号:CN112541923B
公开(公告)日:2022-04-08
申请号:CN202011412045.1
申请日:2020-12-03
Applicant: 南开大学
Abstract: 本发明属于人工智能技术领域,具体涉及医疗眼底图数据集,特别是针对眼底图数据集迁移学习的视杯视盘分割方法。该方法通过骨干分割网络和两个领域判别器的对抗训练,提取眼底图数据集间的通用特征,并利用注意力模块对特征进行加权,解决了视杯视盘界限模糊的问题,排除了其余多种眼底病灶对分割任务的干扰。在不使用目标数据集标注信息的前提下,算法在眼底图数据集迁移过程中保持较高的视杯视盘分割精度,有效解决了标注眼底数据不足对于传统自动青光眼筛查方法性能的限制。
-
公开(公告)号:CN112465150A
公开(公告)日:2021-03-09
申请号:CN202011402595.5
申请日:2020-12-02
Applicant: 南开大学
IPC: G06N20/00
Abstract: 本发明公开了一种基于真实数据增强的多元时序数据缺失值填充方法,通过编码器压缩真实数据为数据表征向量,之后通过生成器结合真实数据增强从数据表征向量从生成完整的数据向量,最后通过判别器分辨真实数据与生成数据。整个模型通过生成对抗式训练优化编码器、生成器与判别器的损失,从而使生成器生成的数据足够接近真实数据以迷惑判别器,最后用生成器的生成数据填充多元时序数据中的缺失值。该方法以带编码器的生成对抗网络为框架,在模型的编码器、生成器、判别器中都运用了真实数据,使模型生成的数据更加真实可靠,可有效用于缺失值的填充。
-
-
公开(公告)号:CN102952236B
公开(公告)日:2017-07-07
申请号:CN201110249358.4
申请日:2011-08-29
Applicant: 南开大学
IPC: C08F226/06 , C08F220/06 , C08F222/14 , C08F2/38 , C08J9/26 , B01J20/26 , B01J20/28 , B01J20/30
Abstract: 本发明涉及一种适于水溶液体系的分子印迹聚合物微球的简便制备方法。所述分子印迹聚合物微球交联度在50%以上,粒径为0.2~5微米,且其表面接枝有亲水性高分子刷。它们是采用亲水性大分子链转移剂诱导的可逆加成‑裂解链转移(RAFT)沉淀聚合技术一步法合成的。本发明具有合成方法简单、适用范围广、产品纯净等优点。所得分子印迹聚合物微球在色谱固定相、生物样品分析、医学临床免疫分析、食品与环境监测、模拟酶催化、仿生传感器等众多领域具有广阔的应用前景。
-
公开(公告)号:CN104462487A
公开(公告)日:2015-03-25
申请号:CN201410798427.0
申请日:2014-12-19
Applicant: 南开大学
IPC: G06F17/30
CPC classification number: G06F17/30707 , G06F17/2785
Abstract: 本发明提出了一种融合多信息源的个性化在线新闻评论情绪预测方法。本发明的方法是在基于单一信息源的在线新闻评论情绪预测的基础上提出了一种融合多信息源的在线新闻评论情绪预测方法。单一的信息源从用户评论,新闻文本和用户情绪投票这三个方面分别对在线新闻评论情绪进行预测,本发明通过结合多种异构信息源,极大地提高了预测的准确性。本发明提出的方法显著地优于其他在线新闻评论情绪预测的替代方法,并且在处理大量差异较大的评论集合时更具优势。本发明可用于用户情感分析和舆情监督。
-
-
-
-
-
-
-
-
-