-
公开(公告)号:CN118155215A
公开(公告)日:2024-06-07
申请号:CN202410125336.4
申请日:2024-01-30
Applicant: 浙江大学 , 浙江智琮科技有限公司
IPC: G06V30/184 , G06V30/18 , G06V30/19
Abstract: 本发明公开了一种基于ControlNet的汉字笔画提取方法及装置,包括以下步骤:(1)从多种字体文件中提取每个汉字图像的笔画相互交叠部分并标注,将汉字图像和对应的标注图像配对,构建笔画交叠区域标注所需的训练数据集,并对ControlNet模型进行预训练;(2)将待提取笔画的原始汉字图像输入训练好的ControlNet模型,预测得到标注笔画交叠区域的笔画检测图像;(3)根据笔画交叠区域检测图像,从原始汉字图像中分割出笔画交叠区域和笔画片段;(4)将属于一个笔画的笔画片段组合,得到完整的独立笔画。利用本发明,不需要使用标注笔画类型的标准字体数据集就可以较为准确地从各种风格字体的高分辨率汉字图像中提取独立的高分辨率笔画。
-
公开(公告)号:CN113571030B
公开(公告)日:2023-10-20
申请号:CN202110825341.2
申请日:2021-07-21
Applicant: 浙江大学
IPC: G10H1/00
Abstract: 本发明公开了一种基于听感和谐度评估的MIDI音乐修正方法和装置,包括:获取MIDI音乐;对MIDI音乐进行调性识别,包含和弦识别、依据乐理规则的和弦的合理性评估,以及包含从音高、音强、音长以及演奏位置四个方面进行的音符的和谐度评估;依据和弦进行的合理性评估结果进行和弦合理性提升;依据音符的和谐度评估进行音符的和谐度提升;其中,和弦合理性提升包括违和和弦的规避、平淡和弦的美化、离调和弦的避免与解决、首尾和弦的补充;该方法和装置根据乐理规则有效识别与分析出其音乐的和弦进行与音符和谐度的不足,并对其进行相应的润色,以提高智能生成音乐的和谐度。
-
公开(公告)号:CN111613195B
公开(公告)日:2022-12-09
申请号:CN201910132652.3
申请日:2019-02-22
Applicant: 浙江大学
IPC: G10H1/00
Abstract: 本公开涉及音频拼接方法、装置及存储介质。该方法包括:确定各个待拼接音频的音频片段;对于各个待拼接音频中的第一待拼接音频的第一音频片段和第二待拼接音频的第二音频片段,根据第一音频片段的相邻音频片段和第二音频片段的相邻音频片段中的至少一项,确定第一音频片段与第二音频片段之间的和谐度;根据各个待拼接音频中的每两个待拼接音频的音频片段之间的和谐度,确定每两个待拼接音频之间的匹配的音频片段;根据每两个待拼接音频之间的匹配的音频片段,对各个待拼接音频的音频片段进行拼接。本公开能够自动化地进行音频拼接,并能够提高音频片段之间的拼接自然程度。
-
公开(公告)号:CN111613199B
公开(公告)日:2022-08-09
申请号:CN202010398381.9
申请日:2020-05-12
Applicant: 浙江大学 , 不亦乐乎科技(杭州)有限责任公司
IPC: G10H7/00
Abstract: 本发明公开了一种基于乐理与统计规则的MIDI序列生成装置,包含一个计算机系统,所述计算机系统被配置为:接收和弦信息序列、节奏型以及调性;依据接收的调性初始化一个八度内12个音的音高初始概率;依据和弦约束、旋律运动约束、重复音约束以及音阈约束对12个音的音高初始概率进行和弦修正、旋律运动修正、重复音修正以及音阈修正,获得12个音的音高概率分布;按照音高从高到低的顺序依次从音高概率分布中选择一个音符进行条件筛选,将满足筛选条件的音符添加到已生成旋律;综合已生成旋律和节奏型生成MIDI文件。该MIDI序列生成装置能够根据给定的旋律生成多样性的MIDI序列。
-
公开(公告)号:CN111590381B
公开(公告)日:2022-01-25
申请号:CN202010494961.8
申请日:2020-06-03
Applicant: 浙江大学
Abstract: 本发明涉及一种数控机床的气幕发生装置及数控机床,属于环保制造及降尘降雾技术领域。气幕发生装置包括套接在机床主轴末端的喷嘴,喷嘴包括:环形本体,为中空设置,其空腔用于储存或暂缓气体,环形本体的底端设有出气缝;固定机构,设置在环形本体的顶部,并连接机床主轴末端;进气口,连通环形本体的空腔,并与高压气源的输出管道相连,将高压气体输入空腔内。通过固定机构与机床主轴相适配,出气缝自环形本体的底端吹出形成空心气幕屏障,对于容易被空气携带走的呼吸性粉尘和切削冷却液在加工过程中产生的水雾或油雾进行物理沉降。
-
公开(公告)号:CN111716946B
公开(公告)日:2021-07-20
申请号:CN202010493215.7
申请日:2020-06-03
Applicant: 浙江大学
Abstract: 本发明涉及一种印材夹具和印稿上印装置,属于印章篆刻技术领域。包括:基座,所述基座设有上下敞开的方形的夹装通道,所述夹装通道内设有Z轴定位机构和XY轴限位机构,所述基座上还设有对所述XY轴限位机构进行固定的锁紧机构。将印材放置在夹装通道内,通过Z轴定位机构和XY轴限位机构实现对印材的三轴定位。同时,通过锁紧机构对XY轴限位机构进行锁紧,以防止在上印过程中机械振动,使XY轴限位机构定位不稳定。本发明装夹和拆卸印材方便,可以同时设置多个XY轴限位机构,满足不同大小的印材的装夹需求,适用于人工和机械篆刻上印或印稿上印,大大提高生产过程中的装夹效率和定位精确度。
-
公开(公告)号:CN112232022A
公开(公告)日:2021-01-15
申请号:CN202011104155.1
申请日:2020-10-15
Applicant: 浙江大学
IPC: G06F40/109
Abstract: 本发明公开了一种动态调整参数的汉字字形与布局设计方法和系统,包括:(1)针对每个汉字,确定字形图像与字形矢量轮廓对应关系,并提取字形图像中的字骨架,对字骨架剪枝后构建骨架点集,将字形轮廓上的轮廓节点与最近的骨架点匹配,被匹配的骨架点为骨架关键点;(2)构建矢量字形模型包括以下组成信息:骨架关键点集,轮廓节点相对于匹配骨架关键点的第一偏移向量,轮廓节点之间纵横对齐信息,轮廓节点所属闭合轮廓信息,字形面积占据字身框的比例;(3)通过可视化的实时输入参数,可以基于该矢量字形模型实现对汉字结构、笔形特点的调整以及汉字作品布局的设计,满足用户需求。
-
公开(公告)号:CN111785296A
公开(公告)日:2020-10-16
申请号:CN202010459989.8
申请日:2020-05-26
Applicant: 浙江大学
IPC: G10L25/51
Abstract: 本发明涉及一种基于重复旋律的音乐分段边界识别方法,属于音频信号处理技术领域。包括:1)对音频提取chroma特征,首尾零填充,聚合每相邻的N帧形成新的帧向量,所有帧向量构成新的帧特征向量序列;2)计算帧特征序列中每个帧向量与其他帧向量的欧氏距离,得到自相似矩阵S;3)基于自相似矩阵S,得到第i个帧向量最近邻帧的集合Ni,并得到自相似矩阵S的递归图R;4)将递归图R经时间延迟处理,得到时间延迟矩阵L;5)对L进行线段规整及去噪,再反时间延迟处理得到递归图R’;6)检测出所有的线段并进行线段聚簇,从线段最多的簇开始依次处理,得到音乐分段边界点集合B。可提升对音乐中重复旋律的识别能力,在更短时长内对音乐进行分段。
-
公开(公告)号:CN111613198A
公开(公告)日:2020-09-01
申请号:CN202010399290.7
申请日:2020-05-12
Applicant: 浙江大学 , 不亦乐乎科技(杭州)有限责任公司
Abstract: 本发明公开了一种MIDI的节奏型识别方法,包括:将MIDI片段按照音阈分布拆分成低音区和中高音区;将MIDI片段按照一定单位长度划分成N个单元,并将每个单元对应的时间长度划分成多个时间步,分别统计低音区和中高音区每个时间步音符出现的频数;针对低音区和中高音区,分别统计N个单元对应时间步上的音符出现的平均频数;该平均频数按照时间步排成的序列即表示节奏型特征。还公开了一种基于节奏型的音乐风格确定方法和基于节奏型的演奏方式确定方法。这三种方法简单,为自动作曲与自动伴奏提供了新的思路。
-
公开(公告)号:CN111590381A
公开(公告)日:2020-08-28
申请号:CN202010494961.8
申请日:2020-06-03
Applicant: 浙江大学
Abstract: 本发明涉及一种数控机床的气幕发生装置及数控机床,属于环保制造及降尘降雾技术领域。气幕发生装置包括套接在机床主轴末端的喷嘴,喷嘴包括:环形本体,为中空设置,其空腔用于储存或暂缓气体,环形本体的底端设有出气缝;固定机构,设置在环形本体的顶部,并连接机床主轴末端;进气口,连通环形本体的空腔,并与高压气源的输出管道相连,将高压气体输入空腔内。通过固定机构与机床主轴相适配,出气缝自环形本体的底端吹出形成空心气幕屏障,对于容易被空气携带走的呼吸性粉尘和切削冷却液在加工过程中产生的水雾或油雾进行物理沉降。
-
-
-
-
-
-
-
-
-