图片生成方法、装置、设备及可读存储介质

    公开(公告)号:CN116597047A

    公开(公告)日:2023-08-15

    申请号:CN202310200510.2

    申请日:2023-02-28

    Abstract: 本申请公开了一种图片生成方法、装置、设备及可读存储介质。本方案中,首先,获取用户的图片生成请求,图片生成请求中包括用户的至少一个个性化信息;再基于用户的至少一个个性化信息,生成包括与用户的至少一个个性化信息对应的领域元素信息的文本描述信息;最后,基于文本描述信息生成融合有领域元素信息个性化图片,并将个性化图片提供给用户。在本方案中,用户只需输入一些个性化信息,就可以为用户生成包含专业的领域元素信息的文本描述,并生成融合有专业的领域元素信息的个性化图片,该图片生成技术对于专业性较差的用户同样适用,降低了对用户专业性的依赖。

    一种对话回溯方法、装置、存储介质及设备

    公开(公告)号:CN115934910A

    公开(公告)日:2023-04-07

    申请号:CN202211549638.1

    申请日:2022-12-05

    Abstract: 本申请公开了一种对话回溯方法、装置、存储介质及设备,该方法包括:首先接收目标用户发出的第一目标对话并确定其对应的第一目标文本;然后根据第一目标文本确定目标用户所处的目标业务场景及包含预设场景意图和预设关键场景信息的目标对话状态,接着接收目标用户发出的第二目标对话并确定其对应的第二目标文本,再根据第二目标文本确定目标用户所处的开放对话场景及包含开放场景意图的开放对话状态;当开放场景意图和预设场景意图不存在冲突时,从开放对话状态切换至目标对话状态进行对话回溯,并根据回溯结果向目标用户反馈回复对话。由于本申请能够在多轮对话中实现不同对话场景和意图之间的切换和回溯,从而提高了回溯效果和用户的交互体验。

    语音翻译方法、装置、电子设备和存储介质

    公开(公告)号:CN115936024A

    公开(公告)日:2023-04-07

    申请号:CN202211738470.9

    申请日:2022-12-30

    Abstract: 本发明提供一种语音翻译方法、装置、电子设备和存储介质,其中方法包括:获取待翻译的用户语音;基于用户语音中各语种的分词数量,确定所述用户语音对应的语种翻译方向;基于所述语种翻译方向,对所述用户语音进行翻译,得到所述用户语音的翻译文本。本发明提供的方法、装置、电子设备和存储介质,通过在获取到待翻译的用户语音之后,基于用户语音中各语种的分词数量确定语种翻译方向以实现语音翻译,在解决多语种混讲场景下的语种适应问题,减轻用户操作负担,提高语音翻译的灵活性的同时,大大降低了语音翻译的时延,提高了语音翻译的响应速度。

    听障用户语音合成方法、装置、设备及存储介质

    公开(公告)号:CN115132167B

    公开(公告)日:2025-04-18

    申请号:CN202210922652.5

    申请日:2022-08-02

    Abstract: 本申请公开了一种听障用户语音合成方法、装置、设备及存储介质,在确定目标听障用户的发音质量满足第一发音质量条件时,获取到第一语音合成模型,模型训练时的训练数据以健全人发音数据的音色、文本以及相似听障韵律合成,相似听障韵律为与健全人发音数据的韵律相似的听障用户的发音数据的韵律,基于此训练的模型能够学习到健全人发音的风格。进一步,将模型中韵律编码模块的编码特征固定为目标听障用户的韵律特征,将音色编码模块的编码特征固定为目标听障用户的音色特征,得到的处理后语音合成模型作为目标听障用户的个性化语音合成模型,能够合成个性化语音,且由于模型学习到了健全人的发音风格,使得最终合成的语音更加顺畅、清晰。

    听障用户语音合成方法、装置、设备及存储介质

    公开(公告)号:CN115132167A

    公开(公告)日:2022-09-30

    申请号:CN202210922652.5

    申请日:2022-08-02

    Abstract: 本申请公开了一种听障用户语音合成方法、装置、设备及存储介质,在确定目标听障用户的发音质量满足第一发音质量条件时,获取到第一语音合成模型,模型训练时的训练数据以健全人发音数据的音色、文本以及相似听障韵律合成,相似听障韵律为与健全人发音数据的韵律相似的听障用户的发音数据的韵律,基于此训练的模型能够学习到健全人发音的风格。进一步,将模型中韵律编码模块的编码特征固定为目标听障用户的韵律特征,将音色编码模块的编码特征固定为目标听障用户的音色特征,得到的处理后语音合成模型作为目标听障用户的个性化语音合成模型,能够合成个性化语音,且由于模型学习到了健全人的发音风格,使得最终合成的语音更加顺畅、清晰。

    通话管理方法及相关装置、电子设备、系统、存储介质

    公开(公告)号:CN115103062A

    公开(公告)日:2022-09-23

    申请号:CN202210303627.9

    申请日:2022-03-24

    Abstract: 本申请公开了一种通话管理方法及相关装置、电子设备、系统、存储介质,其中,通话管理方法包括:获取第一通话用户在若干历史通话中涉嫌违法活动的统计数据;基于统计数据满足第一条件,确定第一通话用户为违法用户;获取违法用户的信用数据;响应于信用数据满足第二条件,限制违法用户通话。上述方案,能够有助于提升通话管理的有效性。

Patent Agency Ranking