-
公开(公告)号:CN112037768B
公开(公告)日:2024-10-22
申请号:CN201910906754.6
申请日:2019-09-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请提供了一种语音翻译方法、装置、电子设备及计算机可读存储介质,该方法包括:将待翻译语音信号进行切分,并提取切分后的每个语音片段的语音特征;对每个语音片段的语音特征进行语音编码,得到每个语音片段的编码结果;对每个语音片段的编码结果进行解码,得到每个语音片段所对应的目标语言的文本。基于本申请实施例所提供的方案,至少能够提高翻译准确性和翻译效率中的至少一个方面。
-
公开(公告)号:CN117524263A
公开(公告)日:2024-02-06
申请号:CN202210887903.0
申请日:2022-07-26
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请实施例提供了一种数据处理方法、设备唤醒方法、电子设备及存储介质,该方法中,待处理语音被转换成关键词音素序列,采用相似发音序列生成器,以序列生成的方式获得关键词音素序列对应的相似音素序列,从而得到待处理语音对应的第一数据处理结果。通过这种生成的方式来替代大规模的语音数据库的搜索方式,用较小的模型,便可实现对现实生活中可能出现的声音进行有效覆盖,从而提升区分易混淆发音的能力。其中,由电子设备执行的上述数据处理方法可以使用人工智能模型来执行。
-
公开(公告)号:CN115132175A
公开(公告)日:2022-09-30
申请号:CN202110736466.8
申请日:2021-06-30
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请实施例提供了一种语音识别方法、装置、电子设备及计算机可读存储介质,方法包括:获取待识别语音的第一语音识别结果;获取第一语音识别结果中目标文本单元的上下文信息和发音特征信息;基于上下文信息和发音特征信息,获取待识别语音的第二语音识别结果,其中该方案中多个步骤可以通过人工智能方法实现。该方案在修正语音识别结果的错误时,由于结合了目标文本单元的上下文信息和发音特征信息,使得修正过程中可以覆盖更多的错误类型,且修正结果准确性高。
-
公开(公告)号:CN103793680B
公开(公告)日:2018-10-23
申请号:CN201210420900.2
申请日:2012-10-29
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 提供一种用于估计头部姿势的设备和方法,所述设备包括:头部区域提取单元,用于从输入的深度图像提取头部区域;头部俯仰角估计单元,用于在头部区域中估计头部俯仰角;头部偏转角估计单元,用于在头部区域中估计头部偏转角;头部姿势合成单元,用于基于估计的头部俯仰角和头部偏转角来合成头部姿势。根据所述设备和方法,可不受光照变化影响而取得良好的头部姿势识别效果。
-
公开(公告)号:CN102855488A
公开(公告)日:2013-01-02
申请号:CN201110186535.9
申请日:2011-06-30
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 提供了一种3D手势识别方法和系统。所述3D手势识别系统包括:特征提取单元,从输入的视频序列的当前帧中提取网格深度特征GDF特征,并提取水平设置瞬间LSM特征和/或曲率直方图HOC特征;匹配单元,将特征提取单元提取的GDF特征与通过离线进行视图聚类而获得的多个聚类模板中的GDF特征进行匹配,以获得当前帧中的手势的朝向信息;支持向量机SVM分类器,基于特征提取单元提取的LSM特征和/或HOC特征以及匹配单元获得的朝向信息来识别当前帧中的手势。根据本发明的3D手势识别方法和系统没有手朝向的限制,并且能够成功解决自身遮挡问题。
-
公开(公告)号:CN119670725A
公开(公告)日:2025-03-21
申请号:CN202311219182.7
申请日:2023-09-20
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F40/205 , G06F40/30 , G06N3/045 , G06N3/08
Abstract: 本公开实施例提供了一种由电子设备执行的方法、电子设备和存储介质,涉及人工智能领域。该方法包括:接收第一用户针对对话系统的历史信息的内容修改指令;基于所述内容修改指令,在所述历史信息中确定需要修改的第一内容,并对确定的第一内容进行修改,获得第二内容;接收第二用户针对所述对话系统的对话输入;基于第二内容以及所述对话输入,使用所述对话系统获得对话输出。可选地,由电子设备执行的上述方法可以使用人工智能模型来执行。
-
公开(公告)号:CN118551774A
公开(公告)日:2024-08-27
申请号:CN202310211801.1
申请日:2023-02-27
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F40/58 , G06F40/42 , G06F18/22 , G06F40/289 , G06F18/214
Abstract: 本公开实施例提供了一种由电子设备执行的方法、电子设备和存储介质,涉及人工智能领域。该方法包括:基于待翻译信息,获取所述待翻译信息对应的至少一个第一单元,基于所述待翻译信息和至少一个第一单元之间的相似度,从至少一个第一单元中确定至少一个目标单元。可选的,由电子设备执行的上述方法可以使用人工智能模型来执行。
-
公开(公告)号:CN117291193A
公开(公告)日:2023-12-26
申请号:CN202211243383.6
申请日:2022-10-11
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F40/58 , G06F40/30 , G06F16/35 , G06F18/214
Abstract: 本申请提供一种机器翻译方法、设备及存储介质,涉及人工智能、机器学习等技术领域。通过获取待翻译信息,基于该待翻译信息,从多个候选领域转换器中确定该待翻译信息对应的目标领域转换器,基于该待翻译信息对应的目标领域转换器,得到翻译结果,由于每个候选领域转换器对应至少一个领域,在确定翻译过程中所需的领域转换器时,能够有针对性的选取与待翻译信息所属领域相对应的目标领域转换器,有助于提高翻译的准确性。
-
公开(公告)号:CN114254660A
公开(公告)日:2022-03-29
申请号:CN202011003004.7
申请日:2020-09-22
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F40/58 , G06F40/30 , G06F40/216
Abstract: 本申请实施例提供了一种多模态翻译方法、装置、电子设备及计算机可读存储介质,属于自然语言处理领域,该方法包括:获取源语言的多模态输入;根据所述多模态输入确定场景信息;基于所述场景信息,采用翻译模型获取目标语言的翻译内容。本申请的多模态翻译方法可以帮助翻译模型更好的判断当前的场景,从而减少语义理解的歧义现象,提高翻译的准确性。
-
公开(公告)号:CN113761834A
公开(公告)日:2021-12-07
申请号:CN202010486551.9
申请日:2020-06-01
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F40/126 , G06N3/04 , G06N3/08
Abstract: 公开了一种获取词向量的方法,包括:在编码信息中得到目标词对应的编码,在第一向量信息中得到所述编码对应的第一部分词向量;根据目标词,在第二向量信息中得到所述目标词对应的第二部分词向量;合并所述第一部分词向量和第二部分词向量,得到所述目标词的词向量。同时,可以使用人工智能模型来执行由电子设备执行的上述方法。
-
-
-
-
-
-
-
-
-