-
公开(公告)号:CN118916378A
公开(公告)日:2024-11-08
申请号:CN202411055531.0
申请日:2024-08-01
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06F16/242 , G06F40/30 , G06N5/022
摘要: 本发明实施例公开了一种模型编辑的方法和装置。本发明实施例中,通过确定三组待编辑查询语句,在知识数据库中检索到其对应的至少一条知识数据;确定每组待编辑查询语句以及至少一条知识数据的增强表征;根据增强表征确定对应的提示字符表征;确定每一个待编辑查询语句对应的输入嵌入表征;根据提示字符表征和输入嵌入表征的组合,对大规模语言模型进行编辑,生成更新后的大规模语言模型,并生成至少一个语义向量;根据三组待编辑查询语句分别对应的语义向量以及增强表征确定损失函数;根据损失函数对所述更新后的大规模语言模型进行编辑生成目标大规模语言模型。通过上述方法,可以实现终身模型编辑,并降低LLMs在编辑过程中产生的能力退化问题。
-
公开(公告)号:CN118427215A
公开(公告)日:2024-08-02
申请号:CN202410551317.8
申请日:2024-05-06
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06F16/2452 , G06F16/242 , G06F16/22 , G06F16/2455 , G06F40/126
摘要: 本申请实施例公开了一种结构化查询语句的生成方法、问答处理方法及对应装置。其中方法包括:获取会话中的当前问题对应的自然语言文本;对自然语言文本进行第一编码处理,得到自然语言文本对应的特征表示;将自然语言文本对应的特征表示与数据库所包含的各表格模式信息对应的特征表示进行匹配,将匹配得到的一个以上的表格模式信息作为参考表格模式信息,其中各表格模式信息对应的特征表示是对各表格模式信息分别进行第二编码处理后得到的;利用自然语言文本和参考表格模式信息生成文本序列;将文本序列输入查询语句预测模型,得到结构化查询语句。本申请降低了结构化查询语句的生成难度和人工成本,提高了生成效率和准确率。
-
公开(公告)号:CN116862535A
公开(公告)日:2023-10-10
申请号:CN202310637066.0
申请日:2023-05-31
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06Q30/018 , G06F16/33 , G06F40/30 , G06N5/02
摘要: 本申请公开了内容风险识别方法和装置,风险知识库处理方法和装置,内容风险识别模型处理方法和装置,以及电子设备。其中内容风险识别方法通过引入风险知识的代称知识,并建模目标商品、代称知识、风险知识三者之间的交互,这种更充分的交互方式有利于目标商品和风险知识之间更合理地语义匹配,实现了“代称”增强的内容风险识别。采用这种处理方式,使得只需要将新增风险知识加入到风险知识库中,无需重新训练内容风险识别模型,即可将目标商品与新增风险知识相关联,从而解决新风险知识的冷启动问题,实现新风险知识的覆盖。
-
公开(公告)号:CN116594920A
公开(公告)日:2023-08-15
申请号:CN202310401334.9
申请日:2023-04-14
申请人: 阿里巴巴(中国)有限公司
摘要: 本说明书实施例提供数据处理方法以及装置,其中所述数据处理方法,应用于客户端,包括:根据目标模型的单元运行顺序,确定目标数据处理单元,以及所述目标数据处理单元对应的待处理数据;针对所述目标数据处理单元创建单元会话任务;执行所述单元会话任务获得所述目标数据处理单元对应的单元运行内存,并利用所述目标数据处理单元在所述单元运行内存中处理所述待处理数据;在获得待处理数据对应的中间处理数据情况下,删除所述单元会话任务,释放所述单元运行内存。
-
公开(公告)号:CN116451787A
公开(公告)日:2023-07-18
申请号:CN202310127372.X
申请日:2023-02-16
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06N5/025 , G06Q10/0635
摘要: 本申请公开了内容风险识别方法、内容风险知识点构建及更新方法、内容风险识别语句生成方法。其中,内容风险识别方法通过将运营专家的内容风险识别知识通过特定领域语言形式进行表达,使得风险识别规则适用于符合知识点筛选条件的所有知识点,这样就无需在风险识别规则中对相关知识点进行枚举,只要为知识点设置属性信息,即可基于知识点的属性信息通过知识点筛选条件选取出适用于相关风险识别规则的知识点,由此可实现规则的快速迭代。同时,通过设置风险识别规则子句,并设置至少一个风险算子的目标风险要素值作为规则子句的构成要素,使得风险识别算法与风险识别规则相结合,这样即达到风险识别方式具有可解释性,又可利用风险算子提升泛化性。
-
公开(公告)号:CN116384405A
公开(公告)日:2023-07-04
申请号:CN202310147898.4
申请日:2023-02-10
申请人: 阿里巴巴(中国)有限公司
摘要: 本说明书实施例提供文本处理方法,文本分类方法及情感识别方法,其中所述文本处理方法包括:获取待处理文本,对待处理文本分别进行序列编码和语义编码,得到待处理文本的序列表征和语义表征,根据序列表征,利用预训练的脱敏模型,生成对应的噪声扰动,其中,脱敏模型是根据样本文本的样本语义表征和样本文本的样本脱敏语义表征进行敏感信息识别的对抗训练得到的,利用噪声扰动,对语义表征进行加噪处理,得到脱敏语义表征,根据脱敏语义表征,进行文本处理,得到目标处理结果。利用经过敏感信息识别的对抗训练的脱敏模型,生成高针对性的噪声扰动,得到高公平性的脱敏语义表征,提升了文本处理公平性和效率,降低了处理成本,具有良好通用性。
-
公开(公告)号:CN118349849A
公开(公告)日:2024-07-16
申请号:CN202410397247.5
申请日:2024-04-02
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06F18/214 , G06F18/40 , G06F40/58 , G06F40/237
摘要: 申请实施例公开了一种生成式模型的训练方法及装置,涉及人工智能技术领域。主要技术方案包括:获取包括多个第一训练语料和第二训练语料的训练数据;基于所述第一训练语料,进行从第一语言模型到第二语言模型的知识蒸馏,所述第一语言模型为大语言模型;基于所述第二训练语料,进行从所述知识蒸馏得到的第二语言模型到第三语言模型的知识蒸馏,所述第三语言模型为生成式模型;其中,所述第一语言模型、第二语言模型和第三语言模型的规模依次递减。本申请能够在保留大语言模型能力的同时,减小生成式模型的参数规模,从而降低对计算资源的消耗,提高响应速度。
-
公开(公告)号:CN113987119B
公开(公告)日:2024-07-02
申请号:CN202111166923.0
申请日:2021-09-30
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06F16/33 , G06F16/36 , G06F16/783 , G06V20/40 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/042 , G06N3/0442 , G06N3/045 , G06N3/0464
摘要: 本申请实施例公开了一种数据检索方法、跨模态数据匹配模型处理方法和装置。依据本申请实施例,在跨模态的检索中,对视频数据构建两部分特征数据,一部分是视频帧的图像内容特征,一部分是对应分类预测的多个分类标签的图像语义特征,从而使得视频数据的视频特征既有表征全局信息的内容特征,也有细粒度的语义特征,可以更准确地表征视频数据。其中,为了采用更多维度的语义特征对视频进行更准确地表征,还可以基于已有的初始图像语义特征进行扩展,收集与初始图像语义特征具有语义关联的扩展图像语义特征,本申请实施例还可以基于具有关联的至少一个初始图像语义特征的响应值推导扩展图像语义特征的响应值,丰富了视频的特征维度。
-
公开(公告)号:CN116205536B
公开(公告)日:2023-10-13
申请号:CN202310231352.7
申请日:2023-03-06
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06Q10/0639 , G06Q30/0601 , G06F18/22 , G06N3/006
摘要: 本说明书实施例提供对象评估方法、计算设备及可读存储介质,其中对象评估方法包括:提供第一用户数据,根据目标用户属性和第一属性值,将第一用户对应的第一用户粒子映射至预设坐标空间中,将第一用户粒子的当前坐标对应的属性值和目标对象之间的匹配度,确定为第一用户粒子的指标分数,以指标分数的变化趋势为目标,对第一用户粒子的坐标进行迭代更新,根据迭代更新后的各用户粒子之间指标分数的差异值,确定待评估对象的用户偏差度。将用户粒子映射在任意目标用户属性的坐标空间中,具有高适应度,且根据自迭代更新后用户粒子坐标间指标分数的差异值,确定用户偏差度,保证了准确性且提升了处理效率。
-
公开(公告)号:CN116663547A
公开(公告)日:2023-08-29
申请号:CN202310413988.3
申请日:2023-04-10
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06F40/289 , G06F16/36 , G06F16/35 , G06F16/45
摘要: 本说明书实施例提供样本生成方法以及装置,其中所述样本生成方法包括:获取目标任务关联的词单元序列;将所述词单元序列输入文本生成模型,获得目标文本;基于所述目标任务关联的知识图谱判断所述目标文本是否满足所述目标任务的筛选条件;在所述目标文本满足所述筛选条件的情况下,将所述目标文本输入媒体内容生成模型,获得目标媒体内容,并基于所述目标媒体内容获得所述目标任务的任务样本。实现了自动化生成目标任务场景下的大量任务样本,以便基于生成的任务样本对目标任务进行训练或评估。
-
-
-
-
-
-
-
-
-