-
公开(公告)号:CN117222003A
公开(公告)日:2023-12-12
申请号:CN202311237647.1
申请日:2023-09-25
Applicant: 杭州电子科技大学 , 杭州电子科技大学平湖数字技术创新研究院有限公司
IPC: H04W64/00 , H04W4/33 , H04W4/021 , H04W4/02 , G06N3/045 , G06N3/0442 , G06N3/08 , H04W4/80 , H04W84/12
Abstract: 本发明属于室内定位领域,公开了一种应用于室内定位的Wi‑Fi和蓝牙信号融合方法,主要围绕Wi‑Fi和蓝牙信号的深度特征进行提取与融合。该方法针对收集到的信号中部分信号缺失的问题,使用卡尔曼滤波算法进行缺失值补偿;通过长短期记忆网络针对Wi‑Fi和蓝牙信号进行特征提取,捕捉信号的时间序列依赖性;引入了多头自注意力模型,捕捉信号特征之间的关系,为各信号特征分配权重,并与原始输入进行结合,获得加权后的特征表示;采用了级联策略来高效融合加权的Wi‑Fi和蓝牙信号特征。本发明为Wi‑Fi和蓝牙信号提供了一种新的融合策略,目的是更有效地捕获其关键信息,从而在经济高效的定位方案中实现误差的减小。
-
公开(公告)号:CN116863964A
公开(公告)日:2023-10-10
申请号:CN202310991831.9
申请日:2023-08-08
Applicant: 杭州电子科技大学 , 杭州电子科技大学平湖数字技术创新研究院有限公司
Abstract: 本发明公开了一种基于双线性池化融合动静态特征的语音情感识别方法。该方法首先对收集的语音数据提取24维静态特征,再基于静态特征计算得到动态特征。然后分别使用LSTM网络提取动、静态特征的时序特征表示,经过双线性融合后利用注意力机制融合为话语级特征,再经过功率归一化后输入全连接层,识别情感种类。本方法通过双线性池化融合语音数据的静态特征与动态特征,使二者可以互补学习,从而生成更丰富的特征表示,同时利用注意力机制取代传统双线性池化方法中的池化操作,识别结果更具优势。
-
公开(公告)号:CN119130782A
公开(公告)日:2024-12-13
申请号:CN202411250562.1
申请日:2024-09-06
Applicant: 浙江大学 , 杭州万维镜像科技有限公司 , 杭州电子科技大学
IPC: G06T3/04 , G06N3/0475 , G06N3/045 , G06N3/094 , G06N3/0464 , G06N3/048
Abstract: 本发明提出了一种基于语义和风格信息引导的房间装修风格迁移方法。该方法首先提取原始房间图片的语义解析特征,然后将原始房间图片、参考风格图片以及语义解析特征,一同作为训练样本,将改变风格后的房间图片作为标签,构建训练集。利用生成器网络提取房间照片特征以及参考图片特征,通过双分支归一化模块,以参考图片特征调整归一化过程,得到空间结构信息和纹理细节信息,再通过AFF特征融合,最后输出具有参考风格的房间图像。并使用判别器网络,以标签为基准,判别生成的图像,完成网络训练。最后向训练后的生成器网络输入原始房间图片及其语义解析特征,以及参考风格图片,生成具有参考风格的房间图像,完成装修风格迁移。
-
公开(公告)号:CN119295586A
公开(公告)日:2025-01-10
申请号:CN202411362107.0
申请日:2024-09-27
Applicant: 杭州电子科技大学
IPC: G06T11/00 , G06F18/213 , G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于多层级特征的文本描述引导生成人脸图像的方法。通过将扩散模型的反向采样分成两个阶段,首先在输入文本描述的引导下,将高斯分布随机采样映射到图像隐空间,然后根据文本描述中出现的属性词进行编码,对属性词向量和文本描述向量进行特征融合,并提取属性词向量中与年龄描述相关的内容。然后将隐空间表示、融合特征以及与年龄描述相关的特征一同输入扩散模型中,实现从不同层级对生成图像进行约束,减少生成图像的不确定性,提高文本与生成图像之间的语义一致性。
-
公开(公告)号:CN118969006A
公开(公告)日:2024-11-15
申请号:CN202411250579.7
申请日:2024-09-06
Applicant: 杭州电子科技大学 , 杭州万维镜像科技有限公司 , 杭州鸿雁电器有限公司
IPC: G10L21/028 , G10L21/0208 , G10L25/30 , G10L25/18
Abstract: 本发明公开了一种基于先分离后补偿的两阶段人声伴奏分离方法。在第一阶段,首先提取混合音频信号的振幅谱特征和相位特征,利用堆叠沙漏架构从混合音频信号的振幅谱特征中分离出人声与伴奏的振幅谱特征。在损失函数中添加附加项,对分离源进行约束,使得预测的人声信号中尽可能包含较少的伴奏信号,预测的伴奏信号尽可能包含较少的人声信号。在第二阶段,使用基于门控TCN和非对称卷积网络串联的信号补偿模型,对第一阶段的分离结果进行补偿,通过膨胀卷积捕捉到音乐信号中长时间的依赖关系,并有效过滤无关的信息,利用非对称卷积的平行结构提取细粒度特征,得到更加纯净的人声与伴奏音轨。
-
公开(公告)号:CN117912108A
公开(公告)日:2024-04-19
申请号:CN202410048795.7
申请日:2024-01-12
Applicant: 浙江大学 , 杭州万维镜像科技有限公司 , 杭州电子科技大学 , 杭州鸿雁电器有限公司
Abstract: 本发明公开了一种应用于智能家居领域的人体姿态估计方法。采用Haar小波变换将输入图像进行多尺度分解,生成关注局部细节的特征图。然后基于DCA方法,将局部细节特征图与初步特征进行深度融合。最后输入到多级不同分辨率网络中,得到姿态估计结果。本方法通过小波变换有效捕捉人体边缘、纹理信息和局部微动,适应智能家居中的复杂场景。基于DCA的融合方法提升了特征间的独立性和非线性关系,降低信息冗余。多级网络的使用进一步维护了图像细节,提高了关键点预测的准确性。在智能家居环境中提供了卓越的姿态检测准确度和局部特征表现力,为智能照明、家庭安全、智能家电控制等应用场景提供了更为精确和及时的人体动作识别解决方案。
-
公开(公告)号:CN117687505A
公开(公告)日:2024-03-12
申请号:CN202311425222.3
申请日:2023-10-30
Applicant: 杭州电子科技大学
Abstract: 本申请公开了一种基于摄像头的鼠标光标的控制方法、装置及计算机设备,涉及人机交互技术领域,解决了目前存在由于特殊用户群里通常有运动限制,会造成特殊用户群体使用不便,导致对鼠标光标控制效率较低的问题。该方法包括:每隔预设时间间隔从人脸视频流中截取初始人脸图像帧,并进行预处理,得到人脸图像帧,按照时序关系将每个人脸图像帧输入目标检测模型中,得到多个人脸部位状态信息,并对其进行标注,得到多个目标人脸部位状态信息,计算至少一个当前人脸部位状态持续时间;基于至少一个当前人脸部位状态持续时间确定鼠标光标的目标动作,并控制鼠标光标执行目标动作。
-
公开(公告)号:CN116369858A
公开(公告)日:2023-07-04
申请号:CN202310380714.9
申请日:2023-04-10
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种睡眠鼾声暂停分类方法及装置,属于信号处理与医疗监测技术领域,该方法包括采集监测者的睡眠过程中的音频信号,将音频信号分为鼾声与非鼾声;将相邻两次鼾声间隔时间在该时间范围内的鼾声间隔记作鼾声暂停;计算某次鼾声暂停前一段时间内或与前一次鼾声暂停之间的所有鼾声的响度平均值和短时能量平均值;提取此次鼾声暂停的前一次鼾声,计算此次鼾声的响度和短时能量,将此次鼾声的响度与响度平均值进行比较,将此次鼾声的短时能量与短时能量平均值进行比较,将鼾声暂停分为病理性鼾声暂停或正常鼾声暂停。采用该方法可以区分病理性鼾声暂停或正常鼾声暂停,有助于提高后续OSA疾病诊断的准确率。
-
公开(公告)号:CN114925923B
公开(公告)日:2023-04-07
申请号:CN202210592618.6
申请日:2022-05-27
Applicant: 杭州电子科技大学
Abstract: 本发明公布了一种提高非监测单元积水深度预报精度的方法,利用STARMA模型得到监测点积水深度预报值;利用InfoWorks ICM模型得到地表积水深度预报值;根据是否包含监测点,将地表单元分为监测单元和非监测单元;确定监测单元对应的监测点;对于监测单元,利用InfoWorks ICM模型和STARMA模型融合后的预报值,作为最终预报值;构建提高非监测单元积水深度预报精度的神经网络,利用监测单元的最终预报值、InfoWorks ICM模型预报值和STARMA模型预报值训练神经网络,基于该神经网络提高非监测单元的积水深度预报精度。本发明在城市排水防涝、海绵城市和应急管理等领域具有广阔应用前景。
-
公开(公告)号:CN114925923A
公开(公告)日:2022-08-19
申请号:CN202210592618.6
申请日:2022-05-27
Applicant: 杭州电子科技大学
Abstract: 本发明公布了一种提高非监测单元积水深度预报精度的方法,利用STARMA模型得到监测点积水深度预报值;利用InfoWorks ICM模型得到地表积水深度预报值;根据是否包含监测点,将地表单元分为监测单元和非监测单元;确定监测单元对应的监测点;对于监测单元,利用InfoWorks ICM模型和STARMA模型融合后的预报值,作为最终预报值;构建提高非监测单元积水深度预报精度的神经网络,利用监测单元的最终预报值、InfoWorks ICM模型预报值和STARMA模型预报值训练神经网络,基于该神经网络提高非监测单元的积水深度预报精度。本发明在城市排水防涝、海绵城市和应急管理等领域具有广阔应用前景。
-
-
-
-
-
-
-
-
-