-
公开(公告)号:CN118485292A
公开(公告)日:2024-08-13
申请号:CN202410769593.1
申请日:2024-06-14
Applicant: 杭州宇泛智能科技股份有限公司 , 杭州电子科技大学
IPC: G06Q10/0633 , G06N20/00
Abstract: 本申请实施例提供一种基于人工智能的工作流自动生成和算力分配方法及装置,方法包括:根据工作流生成指令和预设自然语言分析模型确定对应的任务需求和与任务需求对应的模型类型,并根据任务需求和各模型类型之间的依赖关系确定对应的任务结构;根据当前系统算力和预设模型库中各模型类型的算力需求确定对应的算法模型和算力分配策略,根据算法模型和任务结构中的模型搭配关系构建得到任务工作流,并根据算力分配策略为任务工作流中的各算法模型调度相应的系统算力;在实时算力占用数据超过预设算力阈值时,根据当前系统算力和任务工作流中待运行的算法模型的算力需求更新算力分配策略;本申请能够有效提高工作流生成的高效性和准确性。
-
公开(公告)号:CN118279251A
公开(公告)日:2024-07-02
申请号:CN202410342801.X
申请日:2024-03-25
Applicant: 杭州电子科技大学
IPC: G06T7/00 , G06N3/0455
Abstract: 本发明公开了一种用户生成视频质量评估方法及装置,通过构建视频质量评价模型,避免忽视过滤机制导致的评价准确性下降;通过双阈值自适应调整权重阈值策略,避免评价模型对失真信息建模能力的不足;通过视觉聚焦策略,设计全新的空域窗口,对原空域窗口进行补充,使评价模型空时域失真信息充分交互,初始阶段能够充分感知空域信息,最后阶段能够充分学习时域失真信息;在窗口注意力模块的基础上,增加基于中心凹效应的可学习窗口相对位置偏移表来表示不同窗口在全局的相对位置,避免全局位置信息的缺失,此外,在局部自注意力中设置了与面积成正比的区域面积因子,用于平衡不同面积窗口的通道组注意力权重,避免评价模型在全局建模方面的不足。
-
公开(公告)号:CN118200517A
公开(公告)日:2024-06-14
申请号:CN202410350928.6
申请日:2024-03-26
Applicant: 杭州电子科技大学
IPC: H04N17/00 , H04N21/44 , H04N21/442 , H04N21/234 , H04N21/24 , G06N3/045 , G06N3/0464
Abstract: 本发明公开了基于注意选择的用户原创视频质量评估方法。首先待评估视频经过时序小块采样模块得到重组帧集合,随后将重组帧集合输入到训练好的参数固定的ASNet,经过多阶段加工和过滤操作得到高阶空时域失真特征token集合,随后输入回归器得到待评估用户原创视频的得分。本发明设计了时序小块采样模块用以细颗粒度地保留时空域的失真信息,同时通过注意力筛选transformer网络多阶段加工和过滤视觉信息,确保模型能够高效地处理和分析复杂场景下视频中的视觉信息,从而提取出失真程度表征性强的语义特征。
-
公开(公告)号:CN118138764A
公开(公告)日:2024-06-04
申请号:CN202410239624.2
申请日:2024-03-04
Applicant: 杭州微帧信息科技有限公司 , 杭州电子科技大学
IPC: H04N19/146 , H04N19/154
Abstract: 本发明公开了一种确定编码参数值的方法、装置、电子设备和存储介质,所述方法包括:为编码参数预设N个参数值,遍历预设的该N个参数值对批量源视频依次进行编码,获取批量源视频中各源视频的编码参数值‑码率‑视频质量数据集,从而拟合出批量源视频中各源视频的RD曲线;通过确定批量源视频在目标平均码率约束下在RD曲线中视频质量最优点的斜率值反向确定视频质量最优点,进而确定对应的最优编码参数取值。本发明提供的方法在批量源视频转码的场景下,实现了对批量源视频转码时针对不同内容的视频设置不同的编码参数取值,使批量源视频整体在目标约束量的约束下达到视频质量最优。
-
公开(公告)号:CN118101940A
公开(公告)日:2024-05-28
申请号:CN202410245913.3
申请日:2024-03-05
Applicant: 杭州电子科技大学
IPC: H04N19/136 , H04N19/142 , H04N19/137 , H04N19/42 , H04N7/18 , G06V20/40 , G06V10/82 , G06V20/70 , G06N3/0464 , G06V40/20
Abstract: 本发明属于监控视频的压缩领域,特别涉及一种面向监控视频的多目标编码方法。包括以下步骤:(1)构建背景帧序列更新模块,对背景图像帧进行重建,得到重构背景帧;(2)构建多目标下的视频压缩模块,使用语义目标检测网络来连续检测并持续跟踪特定的语义参考对象,利用特征提取网络将语义参考对象转换为紧凑特征表示,将语义参考对象和紧凑特征进行传输编码,(3)构建重构视频帧模块将重建的前景与重构背景帧#imgabs0#结合,生成重构帧#imgabs1#本发明针对多目标情况下的监控视频数据传输,可以在节省码率的前提下,传输监控视频的数据信息。
-
公开(公告)号:CN118018877A
公开(公告)日:2024-05-10
申请号:CN202410142890.3
申请日:2024-02-01
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
Abstract: 本发明属于脉冲数据处理技术领域,涉及一种面向脉冲相机的高效数据流处理方法,其编码端的数据压缩过程包括:步骤一,通过脉冲流分块模块将获取的原始脉冲流切割分块,得到原始脉冲块;步骤二,通过脉冲流凝聚模块压缩所述的原始脉冲块,得到压缩脉冲流;步骤三,将原始脉冲块和压缩脉冲流输入脉冲损失像素标记器,分析压缩造成的脉冲损失来进行信息补偿,后经像素级分类器输出量化二进制信息帧;步骤四,通过压缩脉冲‑信息整合器将压缩脉冲流、量化二进制信息帧和解码端的提示信息进行整合,生成最终的二进制数据流。相较于传统的脉冲压缩方案,本发明可以大大降低整个过程的复杂度,具有省时高效的优点。
-
公开(公告)号:CN117974778A
公开(公告)日:2024-05-03
申请号:CN202311833777.1
申请日:2023-12-28
Applicant: 杭州电子科技大学
IPC: G06T7/73 , G06V10/44 , G06V10/764 , G06V10/82 , G06V10/80 , G06V10/52 , G06N3/0499 , G06N3/08
Abstract: 本发明公开了一种基于多层局部模式的多视角目标地理定位方法。首先进行理论建模;然后构建多层本地模式交叉注意网络,网络基于双分支的架构,每个分支由主干、交叉注意力块、分区池化块以及多层聚合块组成;再对多层本地模式交叉注意网络进行训练;通过训练好的多层本地模式交叉注意网络实现多视角目标地理定位。现有的方法通常侧重于从最终的特征映射中提取细粒度信息,而忽略了中间层输出的重要性。在本发明中,首先提取不同层的特征映射,并且使用交叉注意块来建立不同层的特征映射信息之间的相关性,改进了浅层特征的语义表达。本发明提出了多层聚合块对通过分割得到的高关联特征块进行聚合。
-
公开(公告)号:CN117808897A
公开(公告)日:2024-04-02
申请号:CN202410025434.0
申请日:2024-01-08
Applicant: 杭州电子科技大学
IPC: G06T7/80 , G06T7/246 , G06V10/774 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种可用于不确定位姿的神经辐射场重建与重定位方法。本发明解决了由于位姿输入有噪声甚至没有位姿输入时神经辐射场新视角合成精度问题:由于神经辐射场需要准确的位姿输入,本发明使用无检测器的sfm框架优化相机位姿并进行神经辐射场和位姿回归器的训练。本发明增强了强大的定位性能,减少了与基于结构的方法的差距,同时保持了姿态回归的优势:具有低内存占用的快速推理和扩展到大型环境的能力。
-
公开(公告)号:CN113128344B
公开(公告)日:2024-02-02
申请号:CN202110297430.4
申请日:2021-03-19
Applicant: 杭州电子科技大学
Abstract: 本发明方法公开了一种多信息融合的立体视频显著性检测方法。本发明方法首先通过2D视频序列的色彩特征、空间特征、中心位置特征计算,得到2D空间显著图;基于时空一致性,在2D空间显著图的基础上获得2D运动显著图;然后利用不同区域的深度差异度计算深度空间显著图;提取深度变化的信息,获得深度运动图;最后使用多层细胞自动机融合产生的视频序列的四种显著图,得到立体视频的显著图。本发明方法根据人眼视觉注意力对色彩、空间位置、物体远近的敏感机制,尤其利用深度信息与运动信息在立体视觉显著性检测中的重要作用,融合了多种立体视频在空间和时间上的特征,消除单一特征计算显著性带来的噪声影响。
-
公开(公告)号:CN117376582A
公开(公告)日:2024-01-09
申请号:CN202311377320.4
申请日:2023-10-23
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种仿射运动估计的整数线性方程求解加速方法及装置,该方法首先在对数字视频图像帧进行仿射运动估计时,生成梯度搜索的初始运动向量。其次根据初始运动向量,计算当前图像编码单元与参考图像编码单元的图像梯度差异,构建待求解的差异运动向量方程组,并化简。然后对化简结果进行运算,得到差异运动向量方程组的解。最后根据解,计算得到当前图像编码单元的最优运动向量。该装置包括运动向量生成模块、方程组构建模块、方程组化简模块、方程组求解模块和运动向量输出模块。本发明消除了化简算法的除法延迟,大幅降低了资源消耗,能够实现高效率和高精度的整数化简运算。
-
-
-
-
-
-
-
-
-