歌词生成模型训练方法、歌词生成方法、装置及存储介质

    公开(公告)号:CN115114474B

    公开(公告)日:2024-10-25

    申请号:CN202110286728.5

    申请日:2021-03-17

    发明人: 韩文静 王晓瑞

    IPC分类号: G06F16/683 G06F40/211

    摘要: 本公开提供一种关于一种歌词生成模型训练方法、歌词生成方法、装置及存储介质,涉及人工智能领域。包括:获取第一歌词文本,第一歌词文本至少包括一首或多首歌曲的歌词、歌曲中每一句歌词的字数信息;将第一歌词文本转换为训练字符;根据训练字符,对预设网络模型进行训练,得到歌词生成模型;歌词生成模型用于根据输入的待生成歌词的约束条件,生成与约束条件对应的待生成歌词,约束条件至少包括:输入文本以及待生成歌词中每句歌词的字数,待生成歌词包括输入文本,歌词生成模型具备识别训练字符的能力。基于此,歌词生成模型训练装置可以通过在训练歌词文本中增加字数信息,提高歌词生成模型生成符合字数要求的歌词的能力。

    一种基于网络游戏的语音交互控制系统

    公开(公告)号:CN118787935A

    公开(公告)日:2024-10-18

    申请号:CN202411254992.0

    申请日:2024-09-09

    发明人: 黎春燕

    摘要: 本发明公开了一种基于网络游戏的语音交互控制系统,所述交互控制系统包括语音数据库、语音信息监测模块和语音信息分析处理模块,所述语音数据库包括第一数据库和第二数据库,所述第一数据库用于存储游戏指令,所述第二数据库用于存储游戏用关键字,所述语音信息监测模块在监测到用户的移动终端正在运行游戏时,开启语音信息监测,并设监测到语音信息为待传送信息,所述语音信息分析处理模块根据待传送信息的信息长度和待传送信息中的关键字情况判断是在游戏中执行游戏指令所对应的操作还是将待传送信息传输给游戏队友。

    信息处理方法、装置、电子设备及存储介质

    公开(公告)号:CN113920968B

    公开(公告)日:2024-09-27

    申请号:CN202111177249.6

    申请日:2021-10-09

    摘要: 本申请公开了一种信息处理方法、装置、电子设备及存储介质,具体实现方案为:获取预定范围内任意一个歌词的句数及每句歌词的字数范围;根据构建的节奏组数据库进行节奏拼接,得到分别对应所述任意一个歌词的节奏信息;其中,所述节奏信息与所述预定范围内任意一个歌词的句数及每句歌词的字数范围相匹配,且每句节奏信息中音的数量与所述每句歌词中的字数相一致。采用本申请,可以针对多种歌词实现歌词自适应的配节奏。

    文案配置方法、装置、设备及存储介质

    公开(公告)号:CN118690044A

    公开(公告)日:2024-09-24

    申请号:CN202410724738.6

    申请日:2024-06-05

    摘要: 本申请公开了一种文案配置方法、装置、设备及存储介质,涉及计算机技术领域。所述方法包括:获取用户输入的提示信息,提示信息用于表示用户的文案配置需求;根据提示信息和历史配置记录,得到至少一个第一文案类型,历史配置记录用于指示历史时间段内配置过的文案类型;确定至少一个第一文案类型分别对应的比例,第一文案类型对应的比例用于表示第一文案类型被配置的概率;按照至少一个第一文案类型分别对应的比例,从文案库中选择目标文案,目标文案用于终端设备根据用户选择的文案音色,生成目标文案对应的音频。本申请通过结合提示信息和历史配置记录,增多了目标文案可选择的文案类型,且通过比例分析保证了目标文案和提示信息的符合度。

    跨语言文本中实体语义识别处理方法、系统及存储介质

    公开(公告)号:CN118675530A

    公开(公告)日:2024-09-20

    申请号:CN202410800961.4

    申请日:2024-06-20

    发明人: 汤敬华 郑波 孙琪

    摘要: 本申请公开了一种跨语言文本中实体语义识别处理方法、系统及存储介质,根据不同单词和相同单词在不同语言类别中进行发声的音素的长度不同,记录多个音素不同组成方式和对应的含义,将一串发声的音素对应的多个单词构建语句表。将语句表中的多类语言类别的单词翻译为同一语义类别,使得能够按照单词的语义来进行语义识别。本申请根据用户停顿情况进行语义的检测相较于普通按照前一个单词进行检测,能够更加准确地进行语义识别,通过语句表进行多种语言的语义识别,大大减轻了计算机的计算量,更加准确快速的对其进行跨语言文本的语义识别。即,本申请的方案可以把包含不同语言类别的语句翻译成预设的语言类别的语句,且翻译准确性高。

    特征构建方法、跨模态检索方法、装置及计算机存储介质

    公开(公告)号:CN118673177A

    公开(公告)日:2024-09-20

    申请号:CN202411157219.2

    申请日:2024-08-22

    摘要: 本申请提出一种特征构建方法、跨模态检索方法、跨模态检索装置以及计算机存储介质。所述特征构建方法包括:对原始模态数据进行分割,获取若干分割数据段;将所述原始模态数据输入模态编码器,提取所述原始模态数据的局部模态特征和全局模态特征;利用所述局部模态特征,获取每一分割数据段的目标粒度特征;将所述全局模态特征和所有所述目标粒度特征拼接,得到目标模态特征;建立所述目标模态特征与预设查询特征的对齐关系,得到所述原始模态数据的多粒度检索特征。通过上述特征构建方法,通过局部特征和全局特征表征模态数据,构建多粒度检索特征,实现不同模态数据之间的精细化特征对齐。

    车载音乐播放方法、装置、设备及存储介质

    公开(公告)号:CN118642678A

    公开(公告)日:2024-09-13

    申请号:CN202410708766.9

    申请日:2024-06-03

    摘要: 本申请公开了一种车载音乐播放方法、装置、设备及存储介质,涉及车辆技术领域,公开了车载音乐播放方法,包括:根据多模态情绪识别模型、用户语音数据以及用户图像数据得到当前驾驶情绪;根据音乐情绪分类模型确定各本地音乐文件的目标情绪类型;根据当前驾驶情绪和各本地音乐文件的目标情绪类型在多个本地音乐文件中选择目标播放音乐文件并播放。通过上述方式,可准确高效识别出用户的当前情绪,同时保证了音乐播放端可准确快速的对音乐进行分类,并将当前驾驶情绪和各本地音乐文件的目标情绪类型进行结合,选择目标播放音乐文件进行播放,有助于驾驶员进行情绪调节,从而提高驾驶安全性和舒适度,为用户提供了更多的个性化、精准的服务。

    一种基于动态窗口word2vec模型的音乐推荐方法及系统

    公开(公告)号:CN118626671A

    公开(公告)日:2024-09-10

    申请号:CN202411096185.0

    申请日:2024-08-12

    发明人: 周好 陆韬

    摘要: 本发明公开了一种基于动态窗口word2vec模型的音乐推荐方法及系统,该方法建立音乐推荐模型,从音乐文件中提取音乐元素的特征向量输入所述音乐推荐模型,得到相似音乐预测结果;音乐推荐模型为基于动态窗口的word2vec模型,通过连续两个音符的音高变化量、时值变化量和力度变化量的加权和,计算动态窗口的大小。本发明能够根据音乐内容的实际复杂性自动调整窗口大小,这增强了模型的适应性和灵活性,使其能更准确地捕捉音乐的语义和结构特征;能够提高推荐系统的准确度,增强用户体验。