图文处理方法和展示方法、装置、设备和存储介质

    公开(公告)号:CN112882678B

    公开(公告)日:2024-04-09

    申请号:CN202110276188.2

    申请日:2021-03-15

    Inventor: 龙云翔 姚刚

    Abstract: 本申请公开了一种图文处理方法和展示方法、装置、设备和存储介质,涉及图像处理技术领域,尤其涉及人工智能技术和计算机视觉技术。具体实现方案为:根据屏幕展示尺寸,对图文混排的目标图片进行切图处理,以形成至少两个子图片;对所述子图片中的文本进行文字识别,以得到文字识别结果;建立文字识别结果与所述文本在所述目标图片中文本位置之间的对应位置关系;所述文字识别结果用于在屏幕中滚动展示所述目标图片的过程中,根据所述对应位置关系对所述文字识别结果进行展示。本公开实施例的技术方案,能有效处理图文混排的图片,提供文字识别结果的配合展示效果。

    图像展示方法、装置、设备和存储介质

    公开(公告)号:CN112988012A

    公开(公告)日:2021-06-18

    申请号:CN202110322172.0

    申请日:2021-03-25

    Abstract: 本公开公开了一种图像展示方法、装置、设备和存储介质,涉及人工智能技术领域,尤其涉及智能显示领域。具体实现方案为:确定目标图像中是否包括文字信息;若所述目标图像中包括所述文字信息,则根据所述目标图像在显示屏中的展示情况,确定是否满足辅助阅读条件;若满足辅助阅读条件,则输出所述文字信息对应的辅助阅读信息。本公开在较小的屏幕中进行包括文字信息的目标图像的展示时,无需局部放大等手动操作,即可实现对目标图像中的文字信息的辅助输出,减少了用户对显示屏的交互操作,进而提高了显示屏的使用寿命。

    智能设备的交互方法、装置、设备及存储介质

    公开(公告)号:CN111968631A

    公开(公告)日:2020-11-20

    申请号:CN202010605326.2

    申请日:2020-06-29

    Inventor: 龙云翔

    Abstract: 本申请提出了一种智能设备的交互方法、装置、设备及存储介质,涉及语音识别、语音交互、自然语言处理和人机交互技术领域,具体实现方案为:接收用户的语音指令;根据语音指令进行意图预测以生成预测意图;当预测意图包括多模态交互意图时,生成多模态交互预指令并发送至多模态识别组件,以使多模态采集组件根据多模态交互预指令预采集多模态数据。根据本申请能够提高多模态交互效率,缩短用户进行多模态交互时的等待时延,提升用户体验。

    智能设备的交互方法、装置、设备及存储介质

    公开(公告)号:CN111968631B

    公开(公告)日:2023-10-10

    申请号:CN202010605326.2

    申请日:2020-06-29

    Inventor: 龙云翔

    Abstract: 本申请提出了一种智能设备的交互方法、装置、设备及存储介质,涉及语音识别、语音交互、自然语言处理和人机交互技术领域,具体实现方案为:接收用户的语音指令;根据语音指令进行意图预测以生成预测意图;当预测意图包括多模态交互意图时,生成多模态交互预指令并发送至多模态识别组件,以使多模态采集组件根据多模态交互预指令预采集多模态数据。根据本申请能够提高多模态交互效率,缩短用户进行多模态交互时的等待时延,提升用户体验。

    图像展示方法、装置、设备和存储介质

    公开(公告)号:CN112988012B

    公开(公告)日:2022-09-27

    申请号:CN202110322172.0

    申请日:2021-03-25

    Abstract: 本公开公开了一种图像展示方法、装置、设备和存储介质,涉及人工智能技术领域,尤其涉及智能显示领域。具体实现方案为:确定目标图像中是否包括文字信息;若所述目标图像中包括所述文字信息,则根据所述目标图像在显示屏中的展示情况,确定是否满足辅助阅读条件;若满足辅助阅读条件,则输出所述文字信息对应的辅助阅读信息。本公开在较小的屏幕中进行包括文字信息的目标图像的展示时,无需局部放大等手动操作,即可实现对目标图像中的文字信息的辅助输出,减少了用户对显示屏的交互操作,进而提高了显示屏的使用寿命。

    智能设备的控制方法、装置、计算机设备及存储介质

    公开(公告)号:CN112947104A

    公开(公告)日:2021-06-11

    申请号:CN202110204297.3

    申请日:2021-02-23

    Abstract: 本公开公开了一种智能设备的控制方法、装置、计算机设备及存储介质,涉及计算机技术领域,尤其涉及语音技术、计算机视觉、智能搜索、深度学习等人工智能领域。具体实现方案为:获取内容播放请求,其中,所述播放请求中包含参考图像;在所述参考图像为指定类型图像的情况下,将所述播放请求发送给与所述智能设备关联的终端;在获取到所述终端返回的确认消息的情况下,基于所述参考图像,遍历内容库以获取与所述参考图像对应的目标内容;播放所述目标内容。从而使得智能设备即满足了识字量有限的儿童用户可以获取内容的需求,又保证了家长可以对儿童使用智能设备的情况及阅读内容进行全面管控。

    图文处理方法和展示方法、装置、设备和存储介质

    公开(公告)号:CN112882678A

    公开(公告)日:2021-06-01

    申请号:CN202110276188.2

    申请日:2021-03-15

    Inventor: 龙云翔 姚刚

    Abstract: 本申请公开了一种图文处理方法和展示方法、装置、设备和存储介质,涉及图像处理技术领域,尤其涉及人工智能技术和计算机视觉技术。具体实现方案为:根据屏幕展示尺寸,对图文混排的目标图片进行切图处理,以形成至少两个子图片;对所述子图片中的文本进行文字识别,以得到文字识别结果;建立文字识别结果与所述文本在所述目标图片中文本位置之间的对应位置关系;所述文字识别结果用于在屏幕中滚动展示所述目标图片的过程中,根据所述对应位置关系对所述文字识别结果进行展示。本公开实施例的技术方案,能有效处理图文混排的图片,提供文字识别结果的配合展示效果。

Patent Agency Ranking