Patent search ap:("浙江大学") AND inv:"张克俊" Page 1

1.

发明公开
一种基于动态规划与抑扬格的旋律结构边界检测方法审中-实审

公开(公告)号：CN117953836A

公开(公告)日：2024-04-30

申请号：CN202311807981.6

申请日：2023-12-26

Applicant: 浙江大学 , 浙江大学长三角智慧绿洲创新中心

Inventor： 张克俊 , 汪嘉麒 , 张铁耀 , 张启元 , 俞佳兴 , 吴鑫达

IPC: G10H1/00

Abstract: 本发明公开了一种基于动态规划与抑扬格的旋律结构边界检测方法，包括：(1)将音频二进制文件MIDI转换为音符序列信息，用音乐理论自动化量化框架对音符序列信息进行量化；(2)依据量化好的网格线进行音符节奏重要性赋值以及赋值修正；(3)根据音符的节奏重要性赋值，对音乐中最小结构单元RPS进行相似性判断以及分类；(4)采用动态规划DP算法进行RPS分割。利用本发明，能够根据音乐中重复与发展的结构特性来提取音乐中最小的结构单元。

2.

发明公开
一种基于节奏和音高稳定性的旋律骨架提取方法审中-实审

公开(公告)号：CN115985271A

公开(公告)日：2023-04-18

申请号：CN202211602687.7

申请日：2022-12-13

Applicant: 浙江大学 , 浙江大学长三角智慧绿洲创新中心

Inventor： 张克俊 , 唐睿源 , 张铁耀 , 吴鑫达 , 汪嘉麒 , 俞佳兴

IPC: G10H1/00 , G10H1/22 , G10H1/40

Abstract: 本发明公开了一种基于节奏和音高稳定性的旋律骨架提取方法，包括以下步骤：(1)接收旋律信息序列，使用自适应的混合分析率量化方法进行音符量化；(2)依据量化后的旋律信息序列，根据每个音符的属性，将音符归类为长强音、节拍重音、切分音和修饰音；(3)根据音符的归类设计韵律节点的判定规则，并根据判定规则提取每条旋律的韵律节点；(4)依据提取的韵律节点，以两个或三个音符为一组划分旋律动机边界；(5)基于音高螺旋阵列，计算旋律动机边界中的骨干音。利用本发明，能够根据音乐声学线索，提取能够吸引听众注意力的音乐元素。

3.

发明公开
一种基于Web的智能中文字库在线协作设计系统审中-实审

公开(公告)号：CN117933188A

公开(公告)日：2024-04-26

申请号：CN202311849748.4

申请日：2023-12-29

Applicant: 浙江大学 , 浙江智琮科技有限公司

Inventor： 沈吕可晟 , 殷叶航 , 洪子帧 , 戴昕蕾 , 徐辉男 , 韩亚鹏 , 张克俊

IPC: G06F40/109

Abstract: 本发明公开了一种基于Web的智能中文字库在线协作设计系统。它包括系统核心渲染引擎模块、矢量字体编辑存储结构与在线字体协作通信模块、深度学习插件融合模块，具体为：基于HTML5的Canvas进行实现，基于多种设计模式进行渲染引擎的实现；针对矢量字体编辑存储结构采用直线和三阶贝塞尔曲线对字形轮廓曲线进行描绘表示，针对在线字体协作通信包括同一字库多人对不同字同时在线设计和多人对同一个字进行在线设计；基于云环境进行实现，依托深度学习风格迁移算法，适用于为字体设计师提供目标设计字体的全字符集高质量位图生成，并将生成的位图以垫图参考的形式放置于矢量设计面板之下。本发明的有益效果是：能够提高字体设计效率、质量，节省成本。

4.

发明公开
一种自监督的多模态融合音乐推荐方法审中-实审

公开(公告)号：CN116127126A

公开(公告)日：2023-05-16

申请号：CN202211560638.1

申请日：2022-12-07

Applicant: 浙江大学

Inventor： 张克俊 , 唐睿源 , 马玏 , 吴鑫达 , 张铁耀 , 仲崇珺

IPC: G06F16/68 , G06F16/64

Abstract: 本发明公开了一种自监督的多模态融合音乐推荐方法，包括：收集多模态数据；对多模态数据进行特征提取和特征加权融合，得到视频‑文本融合向量和音频‑情感融合向量；将视频‑文本融合向量和对应的音频‑情感融合向量投影至公共空间，得到正样本对，通过随机采样构建负样本对；采用多模态对比学习策略，进行匹配训练；根据需要进行音乐推荐的视频数据，得到待匹配视频‑文本融合向量；将已有音乐数据的音频‑情感加权结果与待匹配视频‑文本融合向量一同投影到公共空间，计算相似度矩阵并排序，推荐相似度最高的音乐作为视频背景音乐。利用本发明，能够根据给定的视频推荐模态特征相近的背景音乐，可用于电商广告的视频配乐工作。

5.

发明授权
一种用植物奏乐的乐器及其控制方法有权

公开(公告)号：CN106601219B

公开(公告)日：2023-05-02

申请号：CN201610178497.5

申请日：2016-03-25

Applicant: 浙江大学

Inventor： 张克俊 , 胡旭升 , 段轲 , 梁家铭 , 梁策

IPC: G10H1/34 , G10H3/12 , G10H1/00

Abstract: 本发明公开了一种用植物奏乐的乐器，包括：植物盆，栽种有与人互动的植物；检测模块，连接与地绝缘的植物用于检测人触碰植物不同位置所产生的电信号变化；控制芯片，用于输出电信号至所述检测模块，并根据电信号变化产生不同的音频控制信号；音频播放模块，用于接收到所述控制芯片因人触碰植物不同位置而输出的音频控制信号，并输出不同频率的声音；电源模块，用于为控制芯片和音频播放模块提供工作电压；本发明还公开了一种用植物奏乐的乐器的控制方法；本发明可以通过触摸植物来创作音乐的全新人机交互体验，触碰植物不同部位可以发出不同的频率的声音，为艺术家探索新的音乐形式并进行创作打开了一张新的大门。

6.

发明公开
字体生成模型的训练方法、装置、设备及存储介质审中-实审

公开(公告)号：CN115828848A

公开(公告)日：2023-03-21

申请号：CN202111082877.6

申请日：2021-09-15

Applicant: 浙江大学 , 深圳市腾讯计算机系统有限公司

Inventor： 张克俊 , 张瑞 , 凌永根 , 陈堉东 , 许伟欣 , 陈妍 , 张正友 , 李英明 , 王柏林 , 吴泳林 , 李一非

IPC: G06F40/109 , G06V20/62 , G06V30/18 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/047 , G06N3/08

Abstract: 本申请公开了一种字体生成模型的训练方法、装置、设备及存储介质，属于机器学习领域。所述方法包括：获取n种样本字体的字体风格图像、第一文字的字体内容图像和第一文字在n种样本字体下的样本文字图像；调用字体生成模型对n种样本字体的字体风格图像中的风格特征进行学习，以及对第一文字的字体内容图像中的内容特征进行学习，从而预测出第一文字在n种样本字体下的预测文字图像；根据n种样本字体下的预测文字图像与n种样本字体下的样本文字图像之间的n组误差，对字体生成模型进行训练。本申请能够使字体生成模型同时适应多种字体，强化字体生成模型对不同字体的字体细节差异方面的特征提取能力，使得字体生成的质量提升且稳定性提高。

7.

发明公开
基于生成对抗网络的多风格动态组字方法有权

公开(公告)号：CN114359038A

公开(公告)日：2022-04-15

申请号：CN202210041793.6

申请日：2022-01-14

Applicant: 浙江大学

Inventor： 张克俊 , 陈泽文 , 殷叶航 , 张瑞 , 王柏林

IPC: G06T3/00 , G06T3/40 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种基于生成对抗网络的多风格动态组字方法，包括：将汉字表述成IDS序列，IDS序列包含多个组成汉字的子结构的字符和表征子结构的布局信息的IDC字符；构建每个子结构的字形矢量模型，依据IDC字符呈现的子结构的布局信息对子结构的字形矢量模型进行矢量组合得到汉字的字形矢量模型；利用基于生成对抗网络构建的风格优化模型，对汉字的字形矢量模型对应的字形图像进行风格优化处理。该方法通过图形学方法进行初步动态组字，并基于对抗网络对多种风格字体的动态组字结果进行优化，从而实现更好的字形结体效果。

8.

发明授权
基于消息传递网络的音乐图结构信息生成模型的构建方法有权

公开(公告)号：CN110008373B

公开(公告)日：2021-02-26

申请号：CN201910192306.4

申请日：2019-03-14

Applicant: 浙江大学

Inventor： 季俊涛 , 任宇凡 , 黄怡璠 , 邱兆林 , 刘洪甫 , 李灿晨 , 张克俊

IPC: G06F16/683

Abstract: 本发明公开了一种基于消息传递网络的音乐图结构信息提取与生成模型的构建方法，包括：(1)将音乐表达成音乐无向图；(2)在获得音乐无向图后，对音乐无向图进行编码，即采用节点特征提取更新函数提取音乐无向图中节点的隐藏特征；(3)将获得的隐藏特征输入至解码器中，经解码输出预测的音乐无向图；(4)计算预测的音乐无向图与步骤(2)中的音乐无向图的交叉熵损失函数值，利用交叉熵损失函数值更新解码器参数和节点特征提取更新函数的权重参数，以实现对解码器和编码器的训练，训练好的编码器即为音乐图结构信息提取模型，训练好的解码器即为音乐图结构信息生成模型。还公开了一种生成的音乐图结构信息生成模型作为音乐生成器的应用。

9.

发明公开
一种利用生成对抗网络的篆刻作品定制化设计生成装置有权

公开(公告)号：CN112132916A

公开(公告)日：2020-12-25

申请号：CN202010833531.4

申请日：2020-08-18

Applicant: 浙江大学

Inventor： 殷叶航 , 陈泽文 , 赵延吉 , 伍文棋 , 张瑞 , 张克俊

IPC: G06T11/00 , G06T11/20 , G06N3/04 , G06N3/08 , G06K9/62

Abstract: 本发明公开了一种利用生成对抗网络的篆刻作品定制化设计生成装置，包括通信连接的终端和服务器；所述服务器中存储有基于深度学习生成的风格化篆字字形数据；所述终端为用户提供篆刻作品的设计操作平台，用户通过设计操作平台编辑文字内容，从服务器下载文字内容对应的风格化篆字字形数据，同时通过设计操作平台编辑风格化篆字字形数据的设计风格，并生成满足设计风格的篆刻作品对应的印面图像，将印面图像发送至服务器存储。该篆刻作品定制化设计生成装置利用人工智能技术，让没有篆刻经验的用户也能通过电脑与手机上的简单交互实现个性化的篆刻印章定制生成。

10.

发明公开
一种基于乐理与统计规则的MIDI序列生成装置有权

公开(公告)号：CN111613199A

公开(公告)日：2020-09-01

申请号：CN202010398381.9

申请日：2020-05-12

Applicant: 浙江大学 , 不亦乐乎科技(杭州)有限责任公司

Inventor： 李晨啸 , 计紫豪 , 张克俊

IPC: G10H7/00

Abstract: 本发明公开了一种基于乐理与统计规则的MIDI序列生成装置，包含一个计算机系统，所述计算机系统被配置为：接收和弦信息序列、节奏型以及调性；依据接收的调性初始化一个八度内12个音的音高初始概率；依据和弦约束、旋律运动约束、重复音约束以及音阈约束对12个音的音高初始概率进行和弦修正、旋律运动修正、重复音修正以及音阈修正，获得12个音的音高概率分布；按照音高从高到低的顺序依次从音高概率分布中选择一个音符进行条件筛选，将满足筛选条件的音符添加到已生成旋律；综合已生成旋律和节奏型生成MIDI文件。该MIDI序列生成装置能够根据给定的旋律生成多样性的MIDI序列。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification