一种检索增强生成优化方法、系统、设备、产品及介质

    公开(公告)号:CN119646196A

    公开(公告)日:2025-03-18

    申请号:CN202411893560.4

    申请日:2024-12-20

    Abstract: 本发明涉及人工智能技术领域,提供一种检索增强生成优化方法、系统、设备、产品及介质,包括:获取原始文档,对原始文档进行整理与索引构建得到检索文档;构建混合检索器,通过混合检索器得到第一候选文档;通过第一候选文档生成假设文档,通过混合检索器对检索文档进行二次混合检索得到第二候选文档;计算第二候选文档的信息关联度;对第二候选文档进行筛选得到粗筛选文档;对粗筛选文档进行重组与分段得到分段文档,计算分段文档中单词的关键信息密度分数得到单词的词汇关键信息密度分数;根据细筛选阈值和词汇关键信息密度分数对分段文档进行筛选,得到目标文档。本发明有效提升了检索增强的可靠性和检索质量。

    知识图谱补全方法及装置、电子设备、计算机可读介质

    公开(公告)号:CN118152581A

    公开(公告)日:2024-06-07

    申请号:CN202211557077.X

    申请日:2022-12-06

    Abstract: 本公开提供了一种知识图谱补全方法及装置、电子设备、计算机可读介质,该方法包括:获取第一实体以及第一实体在多个模态下的单模态关系;其中,单模态关系用于表征实体之间在单一模态下的关系;基于各个模态下的第一实体和第一实体的单模态关系预测出第一实体对应的至少一个候选实体,并基于第一实体、第一实体的单模态关系和至少一个候选实体获得至少一个候选实体的嵌入分数;基于各个模态下的嵌入分数和各个模态的权重从至少一个候选实体中确定第一实体对应的第二实体;其中,第一实体、单模态关系和第二实体为知识图谱中的三元组。根据本公开的实施例能够提高知识图谱补全的准确性。

    数据处理方法及计算机可读存储介质

    公开(公告)号:CN116151254A

    公开(公告)日:2023-05-23

    申请号:CN202211556169.6

    申请日:2022-12-06

    Abstract: 本公开提供了一种数据处理方法及计算机可读存储介质,所述数据处理方法用于对命名实体识别模型进行训练,包括:获取有标签训练样本对和无标签训练样本对;对应每个训练样本对,得到相应训练样本对对应的潜在表示特征并融合,进而,通过进行命名实体预测,得到有标签训练样本对的第一预测结果,以及无标签训练样本对的第二预测结果;根据每个训练样本对的潜在表示特征得到相应训练样本对的重构特征;基于第一预测结果、第二预测结果、各样本对和各样本对的重构特征确定三个损失函数,根据三个损失函数对命名实体识别模型进行训练。本公开实施例采用半监督训练,能够在保证模型准确率的情况下降低训练成本。

    一种基于眼底图数据集迁移学习的视杯视盘分割方法

    公开(公告)号:CN112541923B

    公开(公告)日:2022-04-08

    申请号:CN202011412045.1

    申请日:2020-12-03

    Applicant: 南开大学

    Abstract: 本发明属于人工智能技术领域,具体涉及医疗眼底图数据集,特别是针对眼底图数据集迁移学习的视杯视盘分割方法。该方法通过骨干分割网络和两个领域判别器的对抗训练,提取眼底图数据集间的通用特征,并利用注意力模块对特征进行加权,解决了视杯视盘界限模糊的问题,排除了其余多种眼底病灶对分割任务的干扰。在不使用目标数据集标注信息的前提下,算法在眼底图数据集迁移过程中保持较高的视杯视盘分割精度,有效解决了标注眼底数据不足对于传统自动青光眼筛查方法性能的限制。

    基于真实数据增强的多元时序数据填充方法

    公开(公告)号:CN112465150A

    公开(公告)日:2021-03-09

    申请号:CN202011402595.5

    申请日:2020-12-02

    Applicant: 南开大学

    Abstract: 本发明公开了一种基于真实数据增强的多元时序数据缺失值填充方法,通过编码器压缩真实数据为数据表征向量,之后通过生成器结合真实数据增强从数据表征向量从生成完整的数据向量,最后通过判别器分辨真实数据与生成数据。整个模型通过生成对抗式训练优化编码器、生成器与判别器的损失,从而使生成器生成的数据足够接近真实数据以迷惑判别器,最后用生成器的生成数据填充多元时序数据中的缺失值。该方法以带编码器的生成对抗网络为框架,在模型的编码器、生成器、判别器中都运用了真实数据,使模型生成的数据更加真实可靠,可有效用于缺失值的填充。

    在线新闻多模态情感分析方法

    公开(公告)号:CN109376775A

    公开(公告)日:2019-02-22

    申请号:CN201811181032.0

    申请日:2018-10-11

    Applicant: 南开大学

    Abstract: 本发明提出了一种在线新闻多模态情感分析方法。本发明公开的方法是综合利用在线新闻中的文本和图像内容,构建多模态深度学习模型,实现多种模态数据特征的充分融合,并据此对读者阅读新闻后的情感进行分析和预测。对于真实的带有图像的新闻数据,本发明的方法效果显著优于其他不考虑图像信息的情感分析模型,证明了新闻中的图像有助于整个新闻事件的阐述,影响读者的阅读情感。

    一种融合多信息源的个性化在线新闻评论情绪预测方法

    公开(公告)号:CN104462487A

    公开(公告)日:2015-03-25

    申请号:CN201410798427.0

    申请日:2014-12-19

    Applicant: 南开大学

    CPC classification number: G06F17/30707 G06F17/2785

    Abstract: 本发明提出了一种融合多信息源的个性化在线新闻评论情绪预测方法。本发明的方法是在基于单一信息源的在线新闻评论情绪预测的基础上提出了一种融合多信息源的在线新闻评论情绪预测方法。单一的信息源从用户评论,新闻文本和用户情绪投票这三个方面分别对在线新闻评论情绪进行预测,本发明通过结合多种异构信息源,极大地提高了预测的准确性。本发明提出的方法显著地优于其他在线新闻评论情绪预测的替代方法,并且在处理大量差异较大的评论集合时更具优势。本发明可用于用户情感分析和舆情监督。

Patent Agency Ranking