-
公开(公告)号:CN119418142B
公开(公告)日:2025-05-16
申请号:CN202510026855.X
申请日:2025-01-08
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
Abstract: 本申请公开了一种基于深度学习的多模态数据特征处理方法、系统及介质,主要涉及多模态数据技术领域,用以解决由于传统技术无法识别多种类型的数据图像,进而无法在用户查找数据时提供多类型数据图像的问题。包括:获取各个类型的数据图像,将数据图像转化为结构化数据,确定对应的特征提取算法,获得特征数据;根据对齐因子,获取同属于相同对齐因子的特征数据,拼接成一个特征向量,获得降维后的数据矩阵;通过降维后的数据矩阵和对应的标签数据,训练预设深度学习模型;根据用户检索信息对应的降维后的数据矩阵;将降维后的数据矩阵作为训练好的预设深度学习模型的输入,获得标签数据;进而获取标签数据对应的各个类型的数据图像。
-
公开(公告)号:CN119418142A
公开(公告)日:2025-02-11
申请号:CN202510026855.X
申请日:2025-01-08
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
Abstract: 本申请公开了一种基于深度学习的多模态数据特征处理方法、系统及介质,主要涉及多模态数据技术领域,用以解决由于传统技术无法识别多种类型的数据图像,进而无法在用户查找数据时提供多类型数据图像的问题。包括:获取各个类型的数据图像,将数据图像转化为结构化数据,确定对应的特征提取算法,获得特征数据;根据对齐因子,获取同属于相同对齐因子的特征数据,拼接成一个特征向量,获得降维后的数据矩阵;通过降维后的数据矩阵和对应的标签数据,训练预设深度学习模型;根据用户检索信息对应的降维后的数据矩阵;将降维后的数据矩阵作为训练好的预设深度学习模型的输入,获得标签数据;进而获取标签数据对应的各个类型的数据图像。
-
公开(公告)号:CN119357348A
公开(公告)日:2025-01-24
申请号:CN202411301357.3
申请日:2024-09-18
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/3329 , G06F40/279 , G06F40/30 , G06N3/084
Abstract: 本发明提出的一种基于复杂网络语义的意图匹配方法、系统、装置及介质,所述方法包括:收集需求领域的问答数据集,对问答数据进行清洗、实体链接和词嵌入处理;基于LoRA对BERT模型进行调整和训练,在每轮训练中,进行向前传播、计算损失、反向传播和更新BERT模型参数;获取用户输入的问题数据,对问题数据进行处理和特征提取,输入到BERT模型中,生成意图匹配的最佳结果;通过收集用户输入的问答数据,定期更新BERT模型。本发明利用LoRA技术微调BERT模型,让模型在特定领域中进行训练,能够有效增强模型在特定领域中语义意图识别能力。
-
-