代码处理方法、装置、电子设备和存储介质

    公开(公告)号:CN119847500A

    公开(公告)日:2025-04-18

    申请号:CN202510017430.2

    申请日:2025-01-06

    Abstract: 本发明涉及计算机技术领域,提供了一种代码处理方法、装置、电子设备和存储介质,其中方法包括:确定用户的代码指令对应的代码任务类型;从代码模块集合中确定代码任务类型对应的目标代码模块;基于代码模型以及目标代码模块,对代码指令进行响应;代码模块集合包括多种类型的代码任务对应的代码模块,每一代码模块是应用对应类型的代码任务对应的样本代码数据,进行低秩微调训练得到的,克服了目前行业领域模型定制的资源消耗大、易出现“知识杂糅”问题的缺陷,通过为不同的代码任务定制对应的代码模块,并采用低秩适应方式进行微调训练,对计算资源友好,且不会造成模型通用能力丢失,同时避免了“知识杂糅”问题,实现了模型性能的提升。

    对话生成方法及相关装置、设备和存储介质

    公开(公告)号:CN117932016A

    公开(公告)日:2024-04-26

    申请号:CN202311793037.X

    申请日:2023-12-22

    Abstract: 本申请公开了一种对话生成方法及相关装置、设备和存储介质,其中,对话生成方法包括:获取目标对象输入的第一对话文本;基于第一对话文本在目标信息源进行搜索,得到与第一对话文本相关的结构化数据;至少将结构化数据输入大语言模型进行处理,得到回应第一对话文本的第二对话文本;其中,大语言模型基于样本结构化数据及样本结构化数据以自然语言描述的样本描述文本进行参数微调得到,大语言模型在以下至少一种任务上执行参数微调:基于样本结构化数据复述样本描述文本、基于样本描述文本生成样本结构化数据。上述方案,能够提升对话回应的准确性,特别是在对话所涉主题超出大语言模型其训练数据时限的情况下。

    音频信号处理方法及相关装置、器件、套件和存储介质

    公开(公告)号:CN117041842A

    公开(公告)日:2023-11-10

    申请号:CN202311014661.5

    申请日:2023-08-11

    Abstract: 本申请公开了一种音频信号处理方法及相关装置、器件、套件和存储介质。该方法包括接收第一音频信号,并采集得到第二音频信号;其中,第一音频信号由充电仓发送,充电仓设有麦克风阵列,用于采集多通道音频信号,且充电仓处理多通道音频信号得到第一音频信号;基于第一音频信号的第一质量指标和第二音频信号的第二质量指标,在第一音频信号和第二音频信号中选择其中一者作为执行降噪处理的主音频信号且另一者作为执行降噪处理的辅音频信号;基于辅音频信号对主音频信号执行降噪处理,得到第三音频信号。上述方案,能够在实现助听器小型化的基础上,提高助听器的降噪能力,以提升助听器的播放质量。

    室内降噪系统、方法、装置、设备及可读存储介质

    公开(公告)号:CN115527517A

    公开(公告)日:2022-12-27

    申请号:CN202211128319.3

    申请日:2022-09-16

    Abstract: 本申请公开了一种室内降噪系统、方法、装置、设备及可读存储介质。室内降噪系统包括:麦克风阵列、摄像装置、处理器以及至少一个扬声器。麦克风阵列采集室内环境噪声,摄像装置采集听者图像,处理器基于摄像装置采集的听者图像,确定人耳位置,基于麦克风阵列采集的室内环境噪声以及人耳位置,确定人耳位置处的噪声;生成与所述人耳位置处的噪声幅度频率相同相位相反的声波作为降噪音频信号;将降噪音频信号发送至扬声器进行播放,该方案能够通过与所述人耳位置处的噪声幅度频率相同相位相反的声波反向消除人耳位置处的噪声,从而实现室内主动降噪。

    文档问答方法、装置、系统、电子设备及存储介质

    公开(公告)号:CN115934905A

    公开(公告)日:2023-04-07

    申请号:CN202211430115.5

    申请日:2022-11-15

    Abstract: 本发明涉及自然语言处理技术领域,提供一种文档问答方法、装置、系统、电子设备及存储介质,该方法利用粗排模型,得到目标文档库中的多个备选文档,利用精排模型得到每个备选文档与用户问题的相似度,并确定目标文档,进而确定用户问题对应的目标答案。粗排模型以及精排模型训练过程采用的样本包括内容文档对以及问题文档对集合,通过内容文档对可以使预训练粗排模型以及预训练精排模型在不引入人工标注的情况下学习到更充分的知识,不仅可以节约模型训练成本,提高训练效率,还可以解决高质量标注数据不足的问题。通过问题文档对集合,可以保证通过粗排模型以及精排模型可以为用户提供准确的目标答案。

    一种语义理解模型构建方法及装置、语义理解方法及装置

    公开(公告)号:CN112633007A

    公开(公告)日:2021-04-09

    申请号:CN202011519649.6

    申请日:2020-12-21

    Inventor: 王涛 刘权 陈志刚

    Abstract: 本申请公开了一种语义理解模型构建方法及装置、语义理解方法及装置,该语义理解模型构建方法包括:在获取到多语语料之后,先根据该多语语料生成训练样本、该训练样本的实际语种和该训练样本的实际语义信息,并将该训练样本输入多语种理解模型,得到该多语种理解模型输出的该训练样本的预测语种和该训练样本的预测语义信息;再根据该训练样本的预测语种、实际语种、预测语义信息及其实际语义信息,更新该多语种理解模型,并继续执行上述将该训练样本输入多语种理解模型的步骤,直至在达到预设停止条件时,根据该多语种理解模型构建语义理解模型,以使该语义理解模型能够对该至少两个语种下的语句进行语义理解。

    一种插件检索方法、装置、存储介质及设备

    公开(公告)号:CN117828024A

    公开(公告)日:2024-04-05

    申请号:CN202311872845.5

    申请日:2023-12-29

    Abstract: 本申请公开了一种插件检索方法、装置、存储介质及设备,该方法包括:首先获取待答复的目标问题文本;以及获取待检索的N个候选插件的插件文档;然后将目标问题文本和第i个候选插件的插件文档输入至预先构建的插件检索模型,预测得到目标问题文本和第i个候选插件的插件文档之间的余弦相似度;其中,插件检索模型是基于初始化的双编码模型,利用基于阈值的目标损失函数对样本问题和插件对进行检索训练得到的;接着,从预测得到的所有余弦相似度中筛选出高于预设相似度阈值的余弦相似度,并将其对应的候选插件作为检索到的目标插件。从而提高了插件检索结果的准确率,进而提高了目标用户的交互体验。

    行业代码模型的训练和行业代码处理方法、装置、一体机

    公开(公告)号:CN117251150A

    公开(公告)日:2023-12-19

    申请号:CN202311385096.3

    申请日:2023-10-23

    Abstract: 本发明提供一种行业代码模型的训练和行业代码处理方法、装置、一体机,方法包括:获取初始模型、通用代码模型,以及目标行业的预训练代码模型;分别基于初始模型、通用代码模型和预训练代码模型,对目标行业的样本代码进行处理,得到初始模型的初始输出、通用代码模型的通用输出和预训练代码模型的预训练输出;基于初始输出、通用输出、预训练输出,以及样本代码的代码标签,对初始模型进行参数迭代,得到目标行业的行业代码模型。本发明提供的方法、装置,大大缩减了行业代码模型的训练数据和训练时间,同时也提升了行业代码模型生成的行业代码的可靠性。

    助听显示方法及装置、充电仓、助听器套件和存储介质

    公开(公告)号:CN117041843A

    公开(公告)日:2023-11-10

    申请号:CN202311014737.4

    申请日:2023-08-11

    Abstract: 本申请公开了一种助听显示方法及装置、充电仓、助听器套件和存储介质。该方法包括获取由助听器的充电仓所采集到的音频信号,并获取充电仓所在环境的嘈杂程度、助听器的佩戴者在不同频段的听损程度中任一种参考信息;基于参考信息内的信息种类,分析音频信号中语音信号、噪声信号中至少一者在不同频段的信号强度;基于参考信息和信号强度,确定是否在充电仓上显示音频信号的识别文本。上述方案,能够使充电仓基于实际使用情况自适应显示识别文本,有助于提高用户使用充电仓的助听显示功能的便利性。

    文档问答方法、系统、电子设备及存储介质

    公开(公告)号:CN115905487A

    公开(公告)日:2023-04-04

    申请号:CN202211431023.9

    申请日:2022-11-15

    Abstract: 本发明涉及自然语言处理技术领域,提供一种文档问答方法、装置、系统、电子设备及存储介质,该方法利用粗排模型,得到目标文档库中的多个备选文档,利用精排模型得到每个备选文档与用户问题的相似度,并确定目标文档,进而确定用户问题对应的目标答案。粗排模型与精排模型基于目标领域内的问题文档对集合、第一困难负样本以及第二困难负样本,对基础粗排模型以及基础精排模型进行多轮迭代训练得到。困难负样本的引入,可以有效提升样本质量,解决目标领域的样本数据不足、标注困难的问题,降低模型训练难度,进而使训练得到的粗排模型和精排模型的鲁棒性得到提升,也可以提高目标答案的准确性。

Patent Agency Ranking