-
公开(公告)号:CN117648950A
公开(公告)日:2024-03-05
申请号:CN202210970384.4
申请日:2022-08-12
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Inventor: 庄毅萌
IPC: G06N3/0455 , G06N3/08
Abstract: 本申请实施例提供一种神经网络模型的训练方法、装置、电子设备及存储介质,涉及人工智能技术领域。该方法包括:获取包括多个初始文本,对每个初始文本中的目标区段进行掩码处理,得到目标区段对应的掩码区段,将每个初始文本及其对应的掩码区段作为一个训练样本,对神经网络模型进行,其中,训练过程中样本的掩码区段的第一词元预测结果是根据样本的非掩码区段和掩码区段预测出的,样本的目标区段的第二词元预测结果是根据样本的非掩码区段和目标区段预测出的,模型的训练总损失是根据各样本对应的目标区段、第一文本预测结果和第二文本预测结果确定的。基于本申请实施例提供的训练方法,可以有效提高训练得到的模型的性能。
-
公开(公告)号:CN113127615A
公开(公告)日:2021-07-16
申请号:CN202010049188.4
申请日:2020-01-16
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F16/332 , G06F16/33
Abstract: 本申请实施例提供了一种文本处理方法、装置、电子设备及计算机可读存储介质,涉及自然语言处理技术领域。该方法包括:获取与待处理的文本对应的多头注意力得分矩阵;对所述多头注意力得分矩阵进行校正得到多头协同注意力矩阵;基于所述多头协同注意力矩阵获取与所述文本对应的输出结果。本申请实施例提供的文本处理方法可以提高对文本处理的准确率,并使多头注意力机制有机会通过其他头修正多层的每一个头的得分并且获得更好的协同作用。
-
公开(公告)号:CN110555209A
公开(公告)日:2019-12-10
申请号:CN201810687680.7
申请日:2018-06-28
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请涉及深度学习领域,公开了一种训练词向量模型的方法及装置,其中,训练词向量模型的方法包括:获取第一信息,所述第一信息用于反映目标文本与上下文文本之间的关联程度;获取第二信息,所述第二信息用于反映目标文本之间的关联程度;根据所述第一信息和所述第二信息,对词向量模型进行训练,得到目标文本的词向量。本申请实施例的方法,弥补了大量未观察到的文本信息对的缺失统计信息,缓解共现矩阵极其稀疏的问题,有效提高词向量模型确定的词向量的准确度。
-
公开(公告)号:CN111353091B
公开(公告)日:2024-10-11
申请号:CN201811584382.1
申请日:2018-12-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F16/9535
Abstract: 本发明实施例提供了一种信息处理方法、装置、电子设备及可读存储介质,属于信息处理技术领域。该方法包括:获取用户的个性化信息;将用户的个性化信息提供给内容提供者,以使内容提供者基于获取到的个性化信息向用户提供内容。基于本发明实施例提供的方案,能够使内容提供者为用户提供更准确的个性化服务,提升用户的体验,更好的满足实际应用需求。
-
公开(公告)号:CN117972082A
公开(公告)日:2024-05-03
申请号:CN202311001646.7
申请日:2023-08-09
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F16/35 , G06F40/295 , G06N3/0464 , G06N3/08
Abstract: 提供了一种由电子设备执行的方法、电子设备和计算机可读存储介质,所述由电子设备执行的方法包括:使用第一语言模型,提取第一训练序列的第一通用知识表征;以及使用第一通用知识表征,更新第二语言模型。
-
公开(公告)号:CN115774992A
公开(公告)日:2023-03-10
申请号:CN202210674662.1
申请日:2022-06-14
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F40/211 , G06F40/30 , G06N3/0464 , G06N3/048 , G06N3/047 , G06N3/084
Abstract: 本申请实施例提供了一种信息处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,涉及人工智能技术领域。其中,信息处理方法包括:针对目标信息的输入序列中的至少两个目标向量进行基于快速傅里叶变换的特征交叉处理,得到目标信息的输出序列;针对目标信息的输出序列进行特征感知处理,得到目标信息的目标序列;其中,目标序列表示目标信息中的各个目标对象在目标信息中与其他目标对象相关的语义信息;该方法的实施有利于提升所确定语义信息的准确性。同时,由电子设备执行的上述信息处理方法可以使用人工智能模型来执行。
-
公开(公告)号:CN117131165A
公开(公告)日:2023-11-28
申请号:CN202210575089.9
申请日:2022-05-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F16/332 , G06F16/36 , G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本申请实施例提供了一种由电子设备执行的方法及相关设备,涉及人工智能技术领域。其中,由电子设备执行的方法包括:获取目标问题中的第一实体;基于与第一实体的共现关系,在包括至少两种语言的预设的知识库中获取第二实体;基于第二实体确定目标问题的答案。本申请通过与第一实体的共现关系,在包括至少两种语言的预设的知识库中获取第二实体,继而采用第二实体确定目标问题的答案,也即可以采用资源充足的其他语言知识库回答本地语言知识库无法支持的问题,解决由于知识库资源不足所导致的应答准确率和召回率低的问题。同时,由电子设备执行的上述方法可以使用人工智能模型来执行。
-
公开(公告)号:CN114330290A
公开(公告)日:2022-04-12
申请号:CN202011053142.6
申请日:2020-09-29
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Inventor: 庄毅萌
IPC: G06F40/211 , G06F40/284 , G06F40/30
Abstract: 提供一种语言模型的训练方法及装置。该语言模型的训练方法包括:接收输入的训练数据,其中,训练数据包括给定词和所述给定词的上下文;基于所述给定词和所述给定词的上下文,生成训练数据在目标语言中的词的上下文相关向量的代理,并且基于所述给定词的上下文,生成训练数据在源语言中的上下文相关的词向量;基于词的上下文相关向量的代理和上下文相关的词向量确定源语言和目标语言的对齐概率作为损失函数;并且基于所述损失函数进行训练,从而实现跨语言对齐的目的,提高了语言模型的质量。
-
公开(公告)号:CN112052313A
公开(公告)日:2020-12-08
申请号:CN201910491681.9
申请日:2019-06-06
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F16/332 , G06F3/0482
Abstract: 提供一种与智能应答系统交互的方法及设备。所述方法包括:接收用户输入;基于所述用户输入的内容,识别用户意图;自动与所述用户意图所涉及的智能应答系统进行交互,以实现所述用户意图。根据所述方法及设备,仅基于体现用户意图的用户输入即可自动与相应的智能应答系统进行交互,无需用户与智能应答系统直接进行交互就能够实现用户意图。
-
公开(公告)号:CN110928982A
公开(公告)日:2020-03-27
申请号:CN201810996512.6
申请日:2018-08-29
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F16/33 , G06F16/34 , G06F40/205 , G06N5/04
Abstract: 本申请实施例提出了一种机器阅读理解方法、设备和存储介质。该方法包括获取文章针对问题的第一对齐信息;根据获取的所述第一对齐信息,在所述文章中确定所述问题的答案。该方法能够提高回答问题的准确率。
-
-
-
-
-
-
-
-
-