一种仿人类复杂问题检索方法、电子设备及存储介质

    公开(公告)号:CN119782463A

    公开(公告)日:2025-04-08

    申请号:CN202411840111.3

    申请日:2024-12-13

    Abstract: 本发明提供了一种仿人类复杂问题检索方法、电子设备及存储介质,该方法包括:对原始问题语句进行拆解处理,以得到若干个原子问题语句;根据若干个原子问题语句之间的关联关系,确定若干个原子问题语句之间的执行顺序;根据每一原子问题语句对应的语句类型,确定每一原子问题语句对应的目标检索信源;根据若干原子问题语句之间的执行顺序,依次通过每一原子问题语句对应的目标检索信源,对该原子问题语句进行检索,得到每一原子问题语句对应的原始答复语句;对若干原始答复语句进行语义整合,得到原始问题语句对应的目标答复语句,以通过意图识别、问题拆解、逻辑规划、扩展生成以及动态执行等多个模块协同工作,有效解决了复杂问题的检索难题。

    针对包含边框的视频拷贝检测方法及装置

    公开(公告)号:CN113971770B

    公开(公告)日:2024-10-29

    申请号:CN202010648949.8

    申请日:2020-07-07

    Abstract: 本发明涉及一种针对包含边框的视频拷贝检测方法及装置,该方法包括:从样本视频中抽取多个第一关键帧图像;基于图像边缘由外向内遍历第一关键帧图像,去除纯色像素点区域,得到多个非纯色像素点为边缘的第二关键帧图像;对第二关键帧图像进行二次遍历,去除纯色像素点个数大于第一阈值的图像区域;从每个第二关键帧图像中提取图像特征,得到多个第一多维图像特征向量;基于多个第一多维图像特征向量与视频库中存储的视频的多个第二多维图像特征向量建立索引,获取多个拷贝视频帧图像;根据时间信息,将多个拷贝视频帧图像进行整合,获得拷贝视频片段,由此,可以实现对视频中存在的多处拷贝视频片段的准确检测,并确定其在原视频中的位置。

    图片匹配方法、装置、电子设备以及存储介质

    公开(公告)号:CN112650867B

    公开(公告)日:2024-09-24

    申请号:CN202011561238.3

    申请日:2020-12-25

    Abstract: 本发明实施例公开了一种图片匹配方法、装置、电子设备以及存储介质。该方法包括:获取目标文本,基于预先训练的特征提取模型提取所述目标文本的文本特征信息;将所述文本特征信息与预设图库中各图片的图片特征信息进行匹配,其中,所述各图片的图片特征信息基于所述预先训练的特征提取模型对各图片提取得到,所述特征提取模型包括文本特征提取子模型、图片特征提取子模型以及分别与所述文本特征提取子模型、所述图片特征提取子模型连接的联合特征提取子模型;将与所述文本特征信息相匹配的图片确定为所述目标文本的匹配图片。通过本发明实施例公开的技术方案,实现了文本自动配图,提升文本的观感质量,激发读者的阅读兴趣,提升读者的阅读体验。

    评论生成模型训练方法和装置、信息生成方法和装置

    公开(公告)号:CN117591948B

    公开(公告)日:2024-09-03

    申请号:CN202410082714.5

    申请日:2024-01-19

    Abstract: 本公开提供了一种评论生成模型训练方法和装置,涉及人工智能技术领域,具体涉及自然语言处理、深度学习、大模型等技术领域。具体实现方案为:获取文本样本集,文本样本集包括:第一文本样本,第一文本样本包括:展示文本以及与展示文本相关的情感立场文本;获取预先构建的评论生成网络,评论生成网络包括:编码器和解码器,编码器分别对展示文本和情感立场文本进行建模,得到评论全局特征向量;解码器用于对评论全局特征向量进行解码,得到评论结果信息;将从文本样本集中选取的第一文本样本输入评论生成网络,得到评论生成网络输出的评论结果信息;基于评论结果信息,得到训练完成的评论生成模型。

    金融风险线索确定方法、装置、设备和介质

    公开(公告)号:CN114936282B

    公开(公告)日:2024-06-11

    申请号:CN202210470144.8

    申请日:2022-04-28

    Abstract: 本公开实施例涉及一种金融风险线索确定方法、装置、设备和介质。该方法包括:获取待分类文本,并对待分类文本进行分词处理,得到各目标词语;基于各目标词语和目标词向量索引表,生成待分类文本对应的第一融合词向量组合;其中,目标词向量索引表基于初始文本样本集和预设向量转换算法预先构建,初始文本样本集为文本分类模型的训练样本集,预设向量转换算法用于将文本转换为多级别的词向量;将第一融合词向量组合输入文本分类模型,并根据模型输出结果确定待分类文本的目标文本类型;基于目标文本类型确定待分类文本是否为金融分线线索。通过上述技术方案,有效地提升了文本分类速度,进而提升线上金融业务中违规行为信息的发现效率。

    基于预训练模型的通用立场检测方法、装置和存储介质

    公开(公告)号:CN117972420A

    公开(公告)日:2024-05-03

    申请号:CN202410038893.2

    申请日:2024-01-10

    Abstract: 本申请涉及自然语言处理技术领域,尤其涉及一种基于预训练模型的通用立场检测方法、装置和存储介质。包括:获取待检测文本和待检测立场目标;将待检测文本和待检测立场目标输入通用立场检测模型,预测待检测文本对于待检测立场目标的立场类别概率分布;立场类别用于表示待检测文本对于待检测立场目标的立场;通用立场检测模型为根据至少一个文本、至少一个立场目标、每个文本的立场类别和每个文本的立场类型预先训练得到;立场类型用于表示文本的立场类别是否依赖于立场目标;将立场类别概率分布中最大概率数值对应的立场类别,确定为待检测文本对于待检测立场目标的立场类别。本申请实施例用于解决立场检测的检测效果较差的问题。

    一种通用数据获取系统
    49.
    发明公开

    公开(公告)号:CN117472720A

    公开(公告)日:2024-01-30

    申请号:CN202311826887.5

    申请日:2023-12-28

    Abstract: 本申请涉及数据处理技术领域,特别是涉及一种通用数据获取系统,该系统包括处理器和存储有计算机程序、目标应用程序和可读性源码的存储器,当计算机程序被处理器执行时,实现以下步骤:获取到目标应用程序的初始运行数据并获取到可读性源码中的目标参数,根据目标参数确定可读性源码中包括起始钩子点和结束钩子点的钩子点,根据钩子点设置钩子函数,在运行目标应用程序时调用钩子函数得到通用数据,通过定位钩子点以及设置钩子函数,改变了目标应用程序的原始程序运行逻辑,自动得到通用数据,可以获取因加密等问题不能正确请求相关页面请求连接及返回的数据内容,并解决了获取目标应用程序的通用数据的低效问题,提高了通用数据的获取效率。

    一种多模态大型语言模型训练方法、电子设备及存储介质

    公开(公告)号:CN117409431A

    公开(公告)日:2024-01-16

    申请号:CN202311412797.1

    申请日:2023-10-27

    Abstract: 本发明提供了多模态大型语言模型训练方法、电子设备和存储介质,涉及计算机技术应用领域,包括:利用第一训练样本对图文对齐模型进行训练,得到训练后的图文对齐模型;第二训练样本对大型语言模型进行训练,第一训练样本对包含一个第一图像样本和对应的原始文本;第一图像样本仅包括自然图像;第二训练样本集包括多个第二训练样本对,每个第二训练样本对包含一个第二图像样本和对应的问答对文本,其中,第二图像样本中设置有目标检测框,第二图像样本至少包括文档、表格、图表和自然图像。本发明能够理解不同种类的图表和文档数据,且具有对图片中的区域准确定位的能力,能够解锁更加多样的多模态能力。

Patent Agency Ranking