-
公开(公告)号:CN117612529A
公开(公告)日:2024-02-27
申请号:CN202311612001.7
申请日:2023-11-29
Applicant: 浙江大学 , 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
IPC: G10L15/22 , G10L15/18 , G10L15/26 , G10L21/0208
Abstract: 本发明公开了一种虚拟数字人的交互方法及装置,包括初始化语义不完整标志位和声音采集和图像采集,使用语音活动检测算法,检测降噪后的有效用户声音是否为人声,将客户端中用户的声音转换成文字,并根据语义不完整标志位进行预处理,并判断保存的文本语义是否完整,进行流式回复生成或生成针对语义完整的问句,并调整语义不完整标志位;进行语音生成并加入虚拟数字人的待生成列表和连续帧图片生成,生成正在说话的虚拟人头部身体连续帧图片或是沉默的虚拟人头部身体连续帧图片;将生成的图像和语音传输到客户端进行展示并从采集阶段重新循环。本发明能够降低噪音的误识别率,保证用户语句的语义完整并提高语音的生成速度。
-
公开(公告)号:CN119946353A
公开(公告)日:2025-05-06
申请号:CN202411901236.2
申请日:2024-12-23
Applicant: 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
Abstract: 本发明公开了一种反电信欺诈的虚假人脸视频多模态帧级检测方法,特点是检测方法主要包括数据预处理、构建待训练的音视频神经网络检测模型、对检测模型的训练和对目标视频的检测识别的步骤;优点是同时利用了视频的视觉特征和音频特征,通过构建多模态神经网络,将视觉信息和音频信息进行深度融合。传统的伪造视频检测方法往往仅依赖于视觉特征,而本发明结合了音频信号,使得检测更加全面;通过对音视频特征的联合分析,本发明能够有效提高伪造视频片段检测的准确性,尤其是在伪造音视频同步欺诈场景中具有显著优势。
-
公开(公告)号:CN117745371A
公开(公告)日:2024-03-22
申请号:CN202311055527.X
申请日:2023-08-22
Applicant: 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
IPC: G06Q30/0601 , G06Q30/0282 , G06F16/9535 , G06F16/9536
Abstract: 本发明公开了一种基于条件扩散模型的公平性推荐方法,包括获取推荐系统的原始数据集,经筛选、编码、过滤,进行数据归一化处理后得到用户‑物品交互矩阵;将用户‑物品交互矩阵通过扩散模型处理得到初始的推荐矩阵,通过降低模型总损失函数值对扩散模型的参数进行训练,当模型总损失函数值降至最小值时扩散模型的参数收敛,由此时的模型参数优化扩散模型得到训练后的用户‑物品评分矩阵;根据训练后的用户‑物品评分矩阵中的物品评分进行排序,为用户推荐物品评分高的物品;本发明还提供了一种基于条件扩散模型的公平性推荐系统;本发明的优点在于实现了推荐效用并保证推荐的公平性,综合考虑了推荐的公平性,效用目标以及公平性目标。
-
公开(公告)号:CN116993420A
公开(公告)日:2023-11-03
申请号:CN202310889221.8
申请日:2023-07-19
Applicant: 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
IPC: G06Q30/0273 , G06Q30/0241
Abstract: 本发明公开了一种动态环境下的广告关键词分配方法,特点是从待流量主决策分配的广告关键词组中随机选取一个广告关键词作为当前广告关键词;获取所有广告商对当前广告关键词的出价意愿,将当前广告关键词以及对应的出价意愿存入预设的关键词库中;对预构建的投放意愿模型进行初始化并计算,得到流量主将当前广告关键词分配给每个广告商的决策意愿;将决策意愿作为分配概率,流量主根据概率将当前广告关键词随机分配给对应的广告商;从获取的广告关键词组中随机选取一个未被分配的广告关键词作为当前广告关键词并重复上述步骤直至获取的广告关键词组中的所有广告关键词均已被分配,完成广告关键词分配;优点是实现了流量主的广告收入增值。
-
公开(公告)号:CN118674239A
公开(公告)日:2024-09-20
申请号:CN202411155492.1
申请日:2024-08-22
IPC: G06Q10/0631 , G06Q10/0639 , G06Q10/067
Abstract: 本发明公开了一种面向多实体复杂场景的服务生态抽象及隐性需求分析方法,包括如下步骤:步骤一,进行服务实体及关系建模,之后进行服务能力及流程建模,完成服务生态抽象建模;步骤二,基于服务生态模型、服务日志分析及性能监测报告,评价当前服务现状,之后借助大模型能力,将当前服务状态指标作为输入,挖掘当前服务隐性需求;步骤三,基于粗糙‑模糊综合决策,确定最佳隐性需求。本发明的面向多实体复杂场景的服务生态抽象及隐性需求分析方法,能够有效的挖掘出最佳的隐性需求。
-
公开(公告)号:CN118129132A
公开(公告)日:2024-06-04
申请号:CN202410255247.1
申请日:2024-03-06
Abstract: 本发明提供了具备灵活调峰功能的三介质锅炉及储能系统,属于储能系统技术领域。现有机组存在调峰能力不足和低负荷运行效率低等问题。本发明包括锅炉系统,汽轮机系统、熔盐储热系统、导热油储热系统、换热器系统;锅炉系统包括炉膛,水冷壁、下降管、汽包、过热器、再热器、熔盐加热器、烟道隔墙、烟道挡板门、导热油加热器、省煤器;汽轮机系统包括高压缸和中压缸;熔盐储热系统包括冷盐罐、热盐罐、冷盐泵、热盐泵和调节阀门;导热油储热系统包括冷导热油罐、热导热油罐、冷导热油泵、热导热油泵和调节阀门;换热器系统包括熔盐‑导热油换热器,导热油‑汽水换热器、熔盐‑汽水换热器和调节阀门。本发明具有满足电网灵活性调峰需求的优点。
-
公开(公告)号:CN115083411A
公开(公告)日:2022-09-20
申请号:CN202210842968.3
申请日:2022-07-18
IPC: G10L15/22 , G10L15/26 , G10L25/24 , G10L15/08 , G10L15/06 , G10L15/02 , G06N3/08 , G06N3/04 , G06K9/62
Abstract: 本发明公开了一种基于特征融合的语音识别方法,包括:步骤1、获取语音数据,对所述语音数据的文本内容进行标签标注,将语音数据与标注标签组成训练集;步骤2、构建基于特征融合的语音识别网络,所述语音识别网络包括特征提取模块,数据处理模块,特征融合模块,注意力模块以及识别模块;步骤3、采用步骤1的训练集,对语音识别网络进行训练,获得用于语音转文本的语音识别模型;步骤4、将待识别的语音数据输入至步骤3获得的语音识别模型,经识别分析后,输出语音数据对应的高质量识别文本。本发明还提供了一种语音识别装置。本发明提供的方法通过提取语音中多种特征进行识别,从而提高语音识别的准确率,获得高质量语音转文字的文本内容。
-
公开(公告)号:CN119888580A
公开(公告)日:2025-04-25
申请号:CN202510348096.9
申请日:2025-03-24
IPC: G06V20/40 , H04N19/132 , H04N19/13 , G06V10/80 , G06V10/82 , G06N3/0455
Abstract: 本发明公开了一种服务监管场景下视频表征融合方法,包括如下步骤:步骤一,选择训练数据,对于较短的视频选择Panda70M数据集,对于较长的视频选择Charades、CharadesEgo、ActivityNet和Valley的caption数据;步骤二,首先获取feature cube,然后创建帧表征融合模块,通过帧表征融合模块使用静态的注意力掩码,让每个Query只需关注feature cube中固定的局部的token,或者使用动态的注意力掩码,让每个Query关注的子立方体的位置按需变化;步骤三,以Q‑Former为基础,基于步骤一选择的训练数据创建三个损失函数进行联合训练,完成视频表征融合。本发明的服务监管场景下视频表征融合方法,通过步骤一至步骤三的设置,便可简单有效的实现视频表征的融合了。
-
公开(公告)号:CN118657300A
公开(公告)日:2024-09-17
申请号:CN202411150960.6
申请日:2024-08-21
IPC: G06Q10/063 , G06F18/22
Abstract: 本发明公开了基于系统熵和价值质量的多指标服务生态系统评估方法,包括如下步骤:步骤一,采用数据清洗、多源数据嵌入的方法对服务数据进行统一表征,实现服务多源异构数据对齐;步骤二,从参与者所获得价值的总和及系统熵角度评估服务生态系统;步骤三,基于模糊综合决策,根据时间、吞吐量、延迟、可靠性、成本来评估服务生态系统质量;步骤四,计算服务生态系统综合指标,完成对于服务生态系统的评估。本发明的基于系统熵和价值质量的多指标服务生态系统评估方法,统一多源异构数据,克服数据兼容性难题,为综合评估奠定基础。
-
公开(公告)号:CN118364234A
公开(公告)日:2024-07-19
申请号:CN202410555817.9
申请日:2024-05-07
IPC: G06F18/15 , G06F18/241 , G06N3/0464 , G06N3/08 , G06N3/0895
Abstract: 本发明公开了一种多视角缺失数据补全方法及装置、电子设备、存储设备,包括:获取多视角缺失数据样本、标签样本及掩码样本,构建视角块信息矩阵、标签矩阵和缺失掩码矩阵;根据视角块缺失掩码矩阵对信息矩阵进行实例归一化;构建基于生成对抗网络的多视角缺失数据补全模型;将视角块信息矩阵、标签矩阵和缺失掩码矩阵进行拼接,从拼接后的数据中随机采样,得到两个不同批次的多视角缺失数据拼接样本,再输入多视角缺失数据补全模型,通过重构掩蔽信息矩阵的方式进行训练,得到训练后的多视角缺失数据补全模型;将多视角缺失数据拼接样本输入优化后的多视角缺失数据补全模型进行补全,得到补全结果后进行反归一化,得到最终补全结果。
-
-
-
-
-
-
-
-
-