一种图像多分类模型生成方法、装置、设备及存储介质

    公开(公告)号:CN119204144A

    公开(公告)日:2024-12-27

    申请号:CN202411724739.7

    申请日:2024-11-28

    Abstract: 本申请公开了一种图像多分类模型生成方法、装置、设备及存储介质,涉及计算机视觉技术领域,首先对公开数据集中的图像分配类别标签,组成图像集合,然后将图像集合中的图像划分为子块和缩略图,并分别经过特征提取之后送入编码器进行处理,构建分级跨模态注意力模块,之后将训练图像输入至分级跨模态注意力模块之后与编码提示进行拼接,输入特征提取网络模型和解码器得到解码输出,最后计算解码输出的交叉熵损失并加权求和,通过梯度下降优化模型参数得到图像多分类模型,利用该图像多分类模型能够实现高精度图像多分类。

    一种基于虚幻引擎的神经辐射场渲染方法及框架

    公开(公告)号:CN117911633B

    公开(公告)日:2024-05-31

    申请号:CN202410313130.4

    申请日:2024-03-19

    Abstract: 本申请公开了一种基于虚幻引擎的神经辐射场渲染方法及框架,首先对拍摄的待重建场景视频进行关键帧抽取得到图像序列,然后根据图像序列对三维场景结构和相机参数进行预估得到预估结果,再根据预估结果和图像序列对神经辐射场渲染框架进行训练,导出渲染素材,最后将虚幻引擎蓝图资产送入虚幻引擎进行自动渲染得到渲染结果,在虚幻引擎中呈现实时的、高质量的重建图像。通过对神经辐射场渲染框架的训练、渲染素材的自动导出以及虚幻引擎进行自动渲染能够快速获得高精度3D模型,简化3D模型的生产的过程,提高了制作效率。

    一种容器平台运维方法及系统

    公开(公告)号:CN117608764B

    公开(公告)日:2024-04-26

    申请号:CN202410073181.4

    申请日:2024-01-18

    Abstract: 本申请公开了一种容器平台运维方法及系统,其涉及容器运维技术领域,首先利用大语言模型对输入的自然语言指令进行提取得到结构化执行信息,然后利用大语言模型提取结构化执行信息生成多条多步骤可执行路径,从多条多步骤可执行路径中选取最优路径,最后将最优路径的结构化执行信息结合系统动作表和运行参数缓存进行API调用,输出API调用结果。通过利用大语言模型的理解能力和知识存储能力,将输入的自然语言方式由程序自动转换到执行计划及API的调用,进而达到降低管理系统的难度,减轻运维的效果,只需进行简单描述便能实现批量化操作。

    一种大场景双机联动相机校准方法、设备及系统

    公开(公告)号:CN117812466A

    公开(公告)日:2024-04-02

    申请号:CN202410224473.3

    申请日:2024-02-29

    Abstract: 本发明公开了一种大场景双机联动相机校准方法、设备及系统,该方法包括以下步骤:基于广角相机拍摄整体场景区域得到广角图像,得到对应的长焦图像集与实时云台位置信息;对广角ROI图像集与长焦图像集逐一进行特征点与特征向量提取;基于LightGlue深度学习特征匹配网络,对提取的特征点和特征向量进行匹配计算,找到广角ROI图像与长焦图像中的同名点对,计算射影变换矩阵,建立广角图像像素位置和长焦相机位置的空间关联关系;基于多项式回归方法拟合函数;完成广角相机与长焦相机双机联动校准并可视化输出。本发明实现了细节长焦云台摄像机与广角相机的空间坐标自动校准,在监控、摄影和视频拍摄等领域提供了更高的校准效率、准确性和灵活性。

    一种媒资内容交换装置及方法
    6.
    发明公开

    公开(公告)号:CN117540040A

    公开(公告)日:2024-02-09

    申请号:CN202410033852.4

    申请日:2024-01-10

    Abstract: 本申请公开了一种媒资内容交换装置及方法,在内容生产工具向驱动器或虚拟文件夹发送列表操作时按需获取文件信息,组织成文件列表发送至内容生产工具进行展示,接收到读取操作指令并将其重定向至媒资系统/媒体内容库中,获得素材文件并发送至内容生产工具进行加工操作得到成品文件;在接收到内容生产工具发送的成品文件之后,将写操作指令转化为媒资存储写操作指令,将成品文件写入媒资系统/媒体内容库中进行保存。通过媒资内容交换装置与媒资系统/媒体内容库直接进行数据交换,避免了文件内容额外的迁移操作,也无需开放存储共享,在确保安全内容访问的同时提高生产工作效率,大幅降低网络带宽占用以及降低生产端存储占用。

    网络设备和资源分享的方法

    公开(公告)号:CN117424928A

    公开(公告)日:2024-01-19

    申请号:CN202311733234.2

    申请日:2023-12-18

    Inventor: 罗天 高江杰

    Abstract: 本发明提供了一种网络设备和资源分享的方法,包括:设备发现:本机设备启动P2P连接服务,并准备自身设备信息,同时部署多播DNS和发现服务在整个网络内发布自身设备信息和探测其他网络设备;资源分享:本机设备获取其他网络设备的信息,并根据信息与对应设备建立P2P连接,通过P2P连接通信分享资源信息。本发明无需用户指定设备IP地址,零配置接入,设备和资源状态能实时同步更新,可以运行在所有支持标准IP协议栈的操作系统平台和设备上,不同的操作系统也能直接分享资源信息。

    基于级联编码的新闻事件抽取方法

    公开(公告)号:CN117408242A

    公开(公告)日:2024-01-16

    申请号:CN202311723815.8

    申请日:2023-12-15

    Abstract: 本发明公开了一种基于级联编码的新闻事件抽取方法,属于新闻事件文本结构化领域,包括步骤:S1,标注待预测以及提取的新闻事件类型、触发词和论元信息,构建新闻事件抽取数据集;S2,利用预训练模型构建事件抽取模型,并利用构建的新闻事件抽取数据集来训练事件抽取模型中的事件类型预测子模块、触发词提取子模块和论元提取子模块;S3,利用步骤S2中训练好的事件抽取模型来构建级联编码的事件抽取模型,利用所述模型对输入的新闻事件进行内容提取,获得结构化的事件信息抽取结果等;本发明能够对新闻事件内容进行高效的类型预测、触发词提取以及论元提取,为事件图谱构建、新闻内容库构建以及新闻脉络分析等实现提供数据支撑。

    基于神经辐射场的三维模型重建方法、设备和介质

    公开(公告)号:CN116958453A

    公开(公告)日:2023-10-27

    申请号:CN202311211058.6

    申请日:2023-09-20

    Abstract: 本发明提供了一种基于神经辐射场的三维模型重建方法、设备和介质,方法包括以下步骤:提取目标的先验信息:采集多视角的RGB图像并进行处理得到目标的位姿信息;神经辐射场模型训练:使用目标的位姿信息训练神经辐射场模型,完成三维模型的隐式表达;生成初始的mesh模型:采用面绘制算法从神经辐射场中提取一个mesh模型作为初始mesh模型;优化目标的三维模型:基于初始mesh模型,利用可微分的光栅化渲染得到渲染图像并计算渲染损失进行反向传播,从而对三维模型的几何形状和外观纹理进行优化;导出通用三维模型。本发明可以完成大范围场景的三维重建并且具有更好的通用性,其得到的模型可以在大多数的三维模型处理软件中使用。

Patent Agency Ranking