-
公开(公告)号:CN119440449A
公开(公告)日:2025-02-14
申请号:CN202411570616.2
申请日:2024-11-05
Applicant: 海信视像科技股份有限公司
Abstract: 本申请提供一种显示设备和图像显示方法,该显示设备包括显示器和控制器。显示器显示应用界面,应用界面包括第一输入区、第二输入区以及图像展示区。控制器被配置为响应于接收到用户在第一输入区输入的触控指令,控制显示器在第一输入区显示用户绘制的第一图像;基于图像生成模型对第一图像进行处理得到第二图像,并控制显示器在图像展示区显示第二图像;响应于接收到用户输入的第一描述文本,控制显示器在第二输入区显示第一描述文本;基于图像生成模型对第一描述文本和第一图像进行处理,得到符合第一描述文本的第三图像,并控制显示器在图像展示区显示第三图像。本申请能够解决显示设备生成的图像与用户真实期望偏差过大的问题。
-
公开(公告)号:CN117812279A
公开(公告)日:2024-04-02
申请号:CN202311258706.3
申请日:2023-09-27
Applicant: 海信视像科技股份有限公司
IPC: H04N21/233 , H04N21/2343 , H04N21/234 , G10L21/10
Abstract: 本申请一些实施例示出一种服务器、终端、显示设备及数字人交互方法,所述方法包括:在接收到终端上传的图像数据和音频数据后,基于图像数据确定数字人形象数据,以及基于音频数据确定数字人语音特征;在接收到显示设备发送用户输入的语音数据后,根据语音数据生成播报文本;基于播报文本、数字人语音特征和数字人形象数据生成数字人数据;将数字人数据发送至显示设备。本申请实施例通过终端上传图像数据和音频数据实现数字人形象和声音的定制,并将定制的数字人应用到与终端关联的显示设备,使得显示设备在接收到语音数据后,以定制数字人的形象和声音展示与语音数据对应反馈数据,将数字人定制推广下沉到个人用户。
-
公开(公告)号:CN117370605A
公开(公告)日:2024-01-09
申请号:CN202210751784.6
申请日:2022-06-28
Applicant: 海信视像科技股份有限公司
IPC: G06F16/783 , G06N3/0464 , G06N3/045 , G06N3/08 , G10L15/16 , G10L15/22 , G10L17/02 , G10L17/18 , G10L17/22 , G10L25/18 , G10L25/30 , G10L25/63 , G10L25/90
Abstract: 本公开涉及一种虚拟数字人驱动方法、装置、设备和介质,包括:获取用户信息,用户信息包括语音信息和图像信息;根据用户信息,确定用户意图和用户情感;根据用户意图确定虚拟数字人的回复文本,以及根据用户意图和用户情感确定虚拟数字人的回复情感;根据回复文本确定虚拟数字人肢体动作,以及根据回复情感确定虚拟数字人情感表达方式,实现自然拟人化的虚拟人交互状态,提高虚拟数字人的拟真性和表达自然度。
-
公开(公告)号:CN111783995B
公开(公告)日:2022-11-29
申请号:CN202010537532.4
申请日:2020-06-12
Applicant: 海信视像科技股份有限公司
IPC: G06N20/00
Abstract: 本申请提供的分类规则获取方法及装置,能够将经过SWEM模型分类后的数据作为样本数据,并且分别确定所有类别中的第一衡量指数和第二衡量指数最小的目标类别;第一衡量指数最小,说明该目标类别中的数据可分性差,第二衡量指数最小,说明该第二衡量指数对应的两个目标类别之间的可分性差。进而需要确定出这两个目标类别内重合的目标样本数据,并对目标样本数据的类别进行修改,以使其与其他类别明显区分,形成包含预设分类规则在内的新的分类规则。本申请的技术方案能够根据衡量指数确定需要修改类别的目标样本数据,形成更加具体和准确的分类规则,可应用于多版本迭代的数据集,适用范围比较广。
-
公开(公告)号:CN114118064A
公开(公告)日:2022-03-01
申请号:CN202010879686.1
申请日:2020-08-27
Applicant: 海信视像科技股份有限公司
IPC: G06F40/232 , G06N3/04 , G06N3/08 , G10L15/22
Abstract: 本申请实施例提供了一种显示设备、文本纠错方法及服务器,显示设备包括显示器和控制器,控制器被配置为:响应于接收到用户输入的语音命令,对语音命令进行语音转换,得到待纠错文本;控制显示器显示待纠错文本;基于音形相近混淆集和图注意力机制对待纠错文本进行纠错,得到初始纠错文本,对待纠错文本和初始纠错文本进行候选召回,根据召回文本的排序结果得到最终纠错文本;控制显示器将待纠错文本刷新为最终纠错文本。本申请实施例根据待纠错文本对应的混淆集生成发音相似知识图谱和形状相近知识图谱,将汉字的拼音及字形相关知识融入图神经网络,抽取相近字符间的深层语义信息,可有效利用音形相近的知识,提高检错纠错的正确率及召回率。
-
公开(公告)号:CN113609269A
公开(公告)日:2021-11-05
申请号:CN202110907729.7
申请日:2021-08-09
Applicant: 海信视像科技股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/35
Abstract: 本申请公开了一种分层意图架构构建方法、意图更新方法及显示设备,在构建分层意图架构时,基于示例信息和槽位信息,计算每两个二级意图的意图相似度,对二级意图进行聚类形成一级意图,构建分层意图架构。在进行意图更新时,计算当前轮次对话对应的每个初始意图的特征分数,并基于分层意图架构中获得对应的关联意图及其特征分数;再结合历史意图的特征分数、历史关联意图的特征分数、历史用户行为的特征分数和历史系统行为的特征分数进行初始意图概率更新。可见,该方法及显示设备,通过构建分层意图架构和充分考虑对话历史和不同意图下的NLU结果,进而更准确地进行跨意图的对话意图更新,以准确识别出目标意图,并向用户反馈准确的交互结果。
-
公开(公告)号:CN112633211A
公开(公告)日:2021-04-09
申请号:CN202011603169.8
申请日:2020-12-30
Applicant: 海信视像科技股份有限公司
IPC: G06K9/00
Abstract: 本申请公开了一种服务设备及人机交互方法。用于解决采用多模态的信号来提高人机交互的适用性和稳定性的问题。本申请实施例中,采用人脸检测的方法从视频数据中提取多帧图像中的目标对象;并采用人脸特征点检测算法获取该目标对象的唇部图像;采用滑动窗口以及对齐处理等操作对唇部图像进行处理,得到待处理唇部图像序列;对待处理唇部图像序列进行初步粗分类,筛选掉虽有耦合性但不支持的唇语;对筛选过后唇部图像序列进行唇语识别,得到唇语识别结果;根据唇语识别的结果,执行相应的操作。
-
公开(公告)号:CN119520934A
公开(公告)日:2025-02-25
申请号:CN202411570694.2
申请日:2024-11-05
Applicant: 海信视像科技股份有限公司
IPC: H04N21/854 , H04N21/8545 , G10L15/22 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/0455
Abstract: 本申请实施例提供一种图像生成方法、装置及显示设备,该方法包括:获取用户输入的多模态信息;基于图像生成模型中的编码网络分别对多模态信息中的各模态信息进行处理,得到各模态信息对应的特征向量;基于图像生成模型中的融合网络对各模态信息分别对应的特征向量进行融合处理,得到融合向量;基于多模态信息,通过图像生成模型中的多阶段网络对融合向量进行处理,得到多模态信息对应的目标图像。本申请实施的图像生成方法能够基于多模态信息生成对应图像。
-
公开(公告)号:CN111949782B
公开(公告)日:2024-10-22
申请号:CN202010790355.0
申请日:2020-08-07
Applicant: 海信视像科技股份有限公司
IPC: G06F16/332 , G06F16/36
Abstract: 本申请提供了一种信息推荐方法和服务设备,用以为对应于查询语句的答案实体生成推荐语句,使用户能够依据推荐语句较为全面的了解答案实体。该服务设备,包括:输入接口和处理器;该处理器被配置为:当通过输入接口接收到查询语句时,将查询语句输入至已配置的问答系统,以得到查询语句对应的回复语句;在已建立的知识图谱中查找到与回复语句相关联的答案实体;依据答案实体已配置的属性‑属性值之间的对应关系,生成推荐语句;推荐语句包括预设数量N个属性、以及对应的属性值,N大于等于1。
-
公开(公告)号:CN117648027A
公开(公告)日:2024-03-05
申请号:CN202211695705.0
申请日:2022-12-28
Applicant: 海信视像科技股份有限公司
Abstract: 本发明涉及一种虚拟人交互方法、装置、电子设备和介质,包括:通过获取目标用户相对于智能设备的空间位置参数;根据空间位置参数,在多个预设范围内确定目标预设范围;确定目标预设范围对应的虚拟人图像为目标用户对应的目标虚拟人图像,其中,目标虚拟人图像中包含的目标虚拟人对应一个预设角度;针对目标虚拟人,根据空间位置参数和预设角度,获取目标虚拟人在目标坐标系中的视线参数,其中,目标坐标系是根据智能设备的显示界面进行构建的;根据视线参数、以及目标虚拟人眼球在目标坐标系中的至少一个初始关键点坐标,确定目标虚拟人的视线方向。采用该方法能够使得目标用户与虚拟人进行交流互动时自动面向用户,实现与用户的眼神交流互动。
-
-
-
-
-
-
-
-
-