多终端多语言实时视频群内私聊的方法及系统

    公开(公告)号:CN109688363A

    公开(公告)日:2019-04-26

    申请号:CN201811651791.9

    申请日:2018-12-31

    CPC classification number: H04N7/147 G06F17/289 G10L13/086 G10L15/26 H04L65/605

    Abstract: 本发明公开了一种实现多终端多语言实时视频群内私聊的方法及系统,移动终端在聊天群组里的移动终端中选定至少一个私聊的第二移动终端并采集视频流、音频流和时间戳进行压缩分别发送至流媒体服务器和识别服务器,业务服务器向数据库服务器请求查询其他移动终端的预留信息以判断是否需要进行语言翻译并建立直接通信路径,当需要进行翻译时识别服务器将第一音频流转码为第一语言文本并由翻译服务器进行翻译为第二语言文本,并由合成服务器转换为第二音频流并发送至流媒体服务器,混流服务器像流媒体服务器调取视频流及第二音频流混流成第二视频文件,并发送至其他移动终端,使不同的移动终端之间能实现无语言障碍的多终端多语言实时视频群内私聊。

    双向概率性的自然语言重写和选择

    公开(公告)号:CN109635270A

    公开(公告)日:2019-04-16

    申请号:CN201811151807.X

    申请日:2018-09-29

    Inventor: 冯鹿 邢博纳

    Abstract: 本公开涉及双向概率性的自然语言重写和选择。语音识别系统根据前向和后向统计语言模型(SLM)二者来在具有低概率的位置处执行令牌的插入、删除和替换编辑,以产生重写令牌序列。可以产生多个重写,并且分数取决于根据SLM的令牌的概率。可以根据自然语言语法来解析重写令牌序列以产生进一步加权的分数。可以使用基于树的搜索算法来迭代地重写令牌序列以找到最佳重写。输入令牌序列到重写令牌序列的映射可以被存储在缓存中,并且可以通过使用所缓存的重写(当存在时)来绕过搜索最佳重写。对产生相同的新的重写令牌序列的各种初始令牌序列的分析可用于改进自然语言语法。

    一种识别待翻译对象的方法、装置和设备

    公开(公告)号:CN109145893A

    公开(公告)日:2019-01-04

    申请号:CN201710464302.8

    申请日:2017-06-19

    Inventor: 侯柏岑

    Abstract: 本发明公开了一种识别待翻译对象的方法。该方法包括:响应于待译文本识别的触发操作,获取用于输入待翻译对象的拍摄图像;识别在所述拍摄图像的识别区域中用于标注文本的标记符号;识别在所述拍摄图像的识别区域中所述标记符号标注出的文本,作为待翻译对象。通过本发明实施例提供的方法,一方面,用户可以不必尝试不同的位置、角度来拍摄待翻译对象,从而待翻译对象识别时的用户操作得以简化。另一方面,通过标记符号来识别待翻译对象,能够避免因识别出的内容包含待翻译对象之外的其他内容,从而应用程序就能够更为准确地对待翻译对象进行识别。此外,本发明还公开了一种识别待翻译对象的装置和设备。

    基于注意力机制的目标变换方法

    公开(公告)号:CN109033095A

    公开(公告)日:2018-12-18

    申请号:CN201810866277.0

    申请日:2018-08-01

    CPC classification number: G06F17/289 G06K9/20 G06N3/0454 G06N3/0481 G06N3/084

    Abstract: 本发明涉及一种基于注意力机制的目标变换方法,包括:训练神经网络模型:步骤1,使用随机数初始化神经网络模型的参数;步骤2,输入一张属于类别X的图像x到模型的生成器G中,进入编码阶段,x经过一个卷积层来计算出第一层特征图f1。利用上述训练得到的神经网络模型进行图像的目标变换,通过在模型中引入注意力机制,使模型能够在目标变化任务中识别出需要转换的目标物体,从而将目标和背景区分开。同时,通过构建注意力一致损失函数和背景一致损失函数来保证原始图像和转换图像的背景一致性。

    呈现图像中描绘的文本的翻译

    公开(公告)号:CN105706077B

    公开(公告)日:2018-12-11

    申请号:CN201480061355.X

    申请日:2014-11-05

    CPC classification number: G06F17/289 G06T11/00 G06T19/006 G06T2219/004

    Abstract: 包括编码在计算机存储介质上的计算机程序的方法、系统和装置,用于呈现图像描绘的文本的附加信息。一方面,方法包括接收图像。识别所述图像中描绘的文本。基于所述图像中描绘的所述文本的布置,为所述图像选择呈现场境。每个呈现场境对应于图像内的文本的特定布置。每个呈现场境具有用于呈现关于所述文本的附加信息的对应的用户界面。用于每个呈现场境的所述用户界面不同于用于其他呈现场境的所述用户界面。识别对应于所选择的呈现场境的用户界面。使用所识别的用户界面,为所述图像中描绘的所述文本的至少部分呈现附加信息。所述用户界面在所述图像之上的覆盖中呈现所述附加信息。

    一种基于迁移学习策略的蒙汉神经机器翻译方法

    公开(公告)号:CN108829684A

    公开(公告)日:2018-11-16

    申请号:CN201810428618.6

    申请日:2018-05-07

    CPC classification number: G06F17/289

    Abstract: 本发明是为解决目前蒙汉机器翻译译文质量低、翻译效果差问题提出的。蒙古语属于低资源语言,收集大量的蒙汉平行双语语料库极为困难,本发明中迁移学习策略可以有效的解决这一难题。迁移学习策略是运用已有的知识对不同但是相关领域问题进行求解的方法。首先,利用大规模的英-汉平行语料基于神经机器翻译框架进行训练;其次,将大规模的英-汉平行语料训练好的翻译模型参数权重迁移到蒙汉神经机器翻译框架中,利用现有的蒙-汉平行语料训练神经机器翻译模型;最后,将基于迁移学习策略的神经机器翻译译文和统计机器翻译译文就BLEU值和译文流利度进行对比和评价。通过运用控制变量法,得出迁移学习策略有效提高了蒙汉机器翻译性能。

    一种音频传输方法和移动翻译设备

    公开(公告)号:CN108769891A

    公开(公告)日:2018-11-06

    申请号:CN201810548214.0

    申请日:2018-05-31

    CPC classification number: H04S1/00 G06F17/289

    Abstract: 本发明实施例涉及翻译技术领域,公开了一种音频传输方法和移动翻译设备。本发明中的音频传输方法,应用于移动翻译设备,移动翻译设备至少包括两个音频声道,音频传输方法包括:采集待翻译数据,将待翻译数据传送至预设的翻译服务器;接收来自翻译服务器的翻译后数据;根据预设的对应关系,确定出翻译后数据对应的一音频声道;将翻译后数据通过所确定的音频声道输出。本发明实施方式中的实现传输方法和移动翻译设备使得无需交换硬件设备,双方可以分别听到所需语言的语音,避免两种语言的语音互相干扰,避免影响对语音语义的理解。

    互联网广告生成方法及装置

    公开(公告)号:CN108764967A

    公开(公告)日:2018-11-06

    申请号:CN201810404551.2

    申请日:2018-04-28

    Inventor: 张峰

    CPC classification number: G06Q30/0276 G06F17/289 G06Q30/0277

    Abstract: 本发明公开了一种互联网广告生成方法及装置。所述互联网广告生成方法包括步骤:A、从互联网广告中获取文本信息;B、将所述文本信息采用机器翻译为符合目标语言的语言文本;C、展示互联网广告的同时,用语音播放所述翻译的语言文本。通过采用本发明的互联网广告生成方法及装置,能够够吸引用户的注意,让互联网广告变得生动有趣,提高了互联网广告的投放效果。

    属性信息多语机器翻译子系统的翻译方法

    公开(公告)号:CN108763225A

    公开(公告)日:2018-11-06

    申请号:CN201810480430.6

    申请日:2016-06-28

    CPC classification number: G06F17/289 G06F17/2881 G06Q30/0601

    Abstract: 本分案申请公开了一种属性信息多语机器翻译子系统的翻译方法,属于电商信息翻译领域,用于解决属性信息翻译的问题,技术要点是先读取商品的每一条属性名或者属性值,在商品信息的汉英蒙藏维多语平行语料库中检索是否存在该属性名或者属性值,如果存在该属性名或者属性值,则直接根据汉英蒙藏维多平行语料库给出该属性名或属性值的多语言翻译结果,效果是实现了属性信息翻译。

Patent Agency Ranking