-
公开(公告)号:CN113902522A
公开(公告)日:2022-01-07
申请号:CN202111152619.0
申请日:2021-09-29
Applicant: 鹏城实验室
Abstract: 本发明公开了一种基于图神经网络的专利推荐方法及终端,所述方法包括:获取机构信息和专利信息,根据所述机构信息和所述专利信息构建机构与专利关系的知识图谱;根据所述机构与专利关系的知识图谱,基于图神经网络模型给卖方机构推荐与专利匹配度最高的买方机构列表,基于图神经网络模型给买方机构推荐与所述买方机构所提出的专利需求匹配度最高的卖方专利列表。本发明通过图谱的形式完成对专利及机构信息的抽取,经过编码及转化处理为图神经网络的图数据样本,利用图神经网络实现节点的图嵌入,采用预训练加微调的机制,经过推荐模型实现需求机构与待售专利之间的匹配,提高推荐质量。
-
公开(公告)号:CN119740087A
公开(公告)日:2025-04-01
申请号:CN202411597152.4
申请日:2024-11-08
Applicant: 鹏城实验室
IPC: G06F18/241 , G06F18/213 , G06F21/62 , G16H50/20 , G06N3/0455 , G06N3/048 , G06N3/08 , G06F17/18
Abstract: 本申请提供了一种基于高斯误差线性单元的业务处理方法、装置、设备,属于数据处理技术领域,通过获取高斯误差线性单元对应的目标函数,并获取业务处理模型在高斯误差线性单元之前针对目标数据包含的业务属性处理得到的业务特征元素,将业务特征元素进行拆分,得到第一子业务特征元素和第二子业务特征元素,获取第一服务节点根据目标函数对第一子业务特征元素处理得到的第一子特征,以及获取第二服务节点根据目标函数对第二子业务特征元素处理得到的第二子特征,根据第一子特征和第二子特征,确定目标子业务特征,根据目标子业务特征生成目标业务向量,并根据目标业务向量进行数据分析,能够在保证业务数据安全性的同时,提高业务处理的效率。
-
公开(公告)号:CN119398063A
公开(公告)日:2025-02-07
申请号:CN202411414815.4
申请日:2024-10-11
Applicant: 鹏城实验室
IPC: G06F40/58 , G06F40/51 , G06F40/205
Abstract: 本申请实施例提供了一种文本翻译方法、装置、电子设备以及存储介质,属于机器翻译技术领域。该方法包括:获取源语言下的原始文本;对原始文本进行初步翻译,得到目标语言下的初始翻译文本,并基于原始文本和初始翻译文本确定原始文本中的难点词语,以及难点词语在初始翻译文本中的初始单词译文;单独对原始文本中的难点词语进行单词解释,得到目标语言下的难点单词翻译文本;基于难点单词翻译文本对初始单词译文进行修正,得到修正后的目标单词译文,并基于目标单词译文更新初始翻译文本,得到原始文本在目标语言下的目标文本。本申请能够提高文本翻译结果的准确性。
-
公开(公告)号:CN118535886A
公开(公告)日:2024-08-23
申请号:CN202410767299.7
申请日:2024-06-13
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了一种文本数据质量评估方法及装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:获取待评估的文本数据集,文本数据集包括多个数据样本;对文本数据集中的多个数据样本进行样本相似处理,得到若干个相似样本子集;对相似样本子集内的数据样本进行合并处理,得到目标数据样本;根据目标数据样本的数据重复率对进行去重处理;将更新后的目标数据样本输入至预训练的质量评估模型中,得到与每个目标数据样本一一对应的样本评估等级;根据样本评估等级,确定文本数据集的数据集评估等级。本申请实施例能够自动化对文本数据集进行评估,提高了数据评估效率,以及为后续的大模型训练提供了高质量的训练库。
-
公开(公告)号:CN114218616B
公开(公告)日:2024-06-21
申请号:CN202111362064.2
申请日:2021-11-17
Applicant: 鹏城实验室
IPC: G06F21/71
Abstract: 本发明公开了一种归一化指数函数安全计算方法及系统,本发明提供的归一化指数函数安全计算方法中,根据归一化指数函数的待计算输入序列生成第一输入序列和第二输入序列,并且根据待计算输入序列生成第一输入序列和第二输入序列的公式中可以有多组解,将第一输入序列和第二输入序列分别分给第一计算终端和第二计算终端进行计算,在计算过程中,第一计算终端和第二计算终端之间传输的信息,都是根据随机数运算得到的,从而使得每个计算终端在计算过程中接收到的信息都是随机均匀分布的,计算终端无法根据接收到的信息来倒推得到真实的数据,从而避免了原始数据泄露,保证了数据的安全性。
-
公开(公告)号:CN115758064A
公开(公告)日:2023-03-07
申请号:CN202211288739.8
申请日:2022-10-20
Applicant: 鹏城实验室
Abstract: 本发明公开了基于高斯过程回归的数据隐私保护方法及相关设备,包括:获取训练数据和测试数据;计算协方差矩阵,根据训练数据进行高斯过程回归的训练;生成指数随机数,通过秘密分享技术,根据指数随机数在高斯整数环上进行指数计算;根据乔利斯基分解法将高斯过程回归中的正定矩阵进行分解,通过秘密分享技术,在高斯整数环上对分解后的正定矩阵进行求逆,构建高斯过程回归模型;根据高斯过程回归模型对测试数据进行预测。可以在不泄露输入矩阵隐私的前提下,提高指数运算的效率,实现安全求逆。
-
公开(公告)号:CN115422562A
公开(公告)日:2022-12-02
申请号:CN202210999123.5
申请日:2022-08-19
Applicant: 鹏城实验室
Abstract: 本发明所提供的一种联邦学习多方梯度的编码域聚合方法及系统,所述联邦学习多方梯度的编码域聚合方法包括:多个联邦参与终端分别将各自的本地数据集转化为量化梯度,并将所述量化梯度输入预训练编码器,得到编码梯度;服务器获取每个联邦参与终端对应的所述编码梯度,将所有编码梯度聚合,得到聚合结果,并将所述聚合结果输入预训练解码器,得到解码梯度;服务器根据所述解码梯度更新联邦学习模型,并将更新后的联邦学习模型发送至各个联邦参与终端。本发明通过多个联邦参与终端均使用预训练编码器各自计算得到编码梯度,使得通信时只需要通信编码梯度,服务器把编码梯度加起来用预训练解码器聚合结果,降低了计算代价和通信负担。
-
公开(公告)号:CN115391006A
公开(公告)日:2022-11-25
申请号:CN202210972749.7
申请日:2022-08-15
Applicant: 鹏城实验室
Abstract: 本发明公开了一种异构多集群的数据处理方法、装置、介质及终端,方法包括:在Kubernetes数据处理系统中增加新的Kubernetes虚拟节点,将每个所述Kubernetes虚拟节点与异构多集群中的每个异构集群相对应;基于所述Kubernetes虚拟节点为每个所述异构集群单独创建一个适配器;在Kubernetes数据处理系统中部署一个与所述适配器相对应的节点代理程序,其中,所述适配器通过所述节点代理程序可与Kubernetes的应用编程接口服务器通信;基于所述节点代理程序,将所述应用编程接口服务器对kubelet的操作转换为对异构集群的作业操作;本发明采用上述方法后解决了异构多集群调度较为困难的问题,实现了能够通过使用Kubernetes集群软件像数据处理普通的单集群一样去数据处理异构的多集群。
-
公开(公告)号:CN115270820A
公开(公告)日:2022-11-01
申请号:CN202210865989.7
申请日:2022-07-22
Applicant: 鹏城实验室
Abstract: 本发明公开了一种多语言翻译系统的持续学习方法、装置、终端及存储介质,方法包括:根据处理策略对翻译请求进行预处理;根据处理后的翻译请求分发对应的翻译模型,并通过翻译模型对处理后的翻译请求进行翻译推理;根据翻译结果进行置信度评估,并根据置信度评估结果触发请你翻译模式,将处理后的翻译请求调度至在线专家或其他用户侧;接收在线专家或其他用户侧反馈的翻译参考答案,激励翻译模型对反馈的翻译参考答案进行答案融合;接收其他用户侧反馈的翻译结果评分,并根据翻译结果评分及反馈的翻译参考答案对翻译模型进行持续学习,以扩充翻译模型的翻译分析数据和持续学习数据。本发明通过反馈打分和请你翻译的人机协作提高系统翻译性能。
-
公开(公告)号:CN114676795B
公开(公告)日:2022-08-23
申请号:CN202210582633.2
申请日:2022-05-26
Applicant: 鹏城实验室
Abstract: 本发明涉及模型训练技术领域,具体是涉及一种深度学习模型的训练方法、装置、设备及存储介质。本发明首先根据待训练的深度学习模型所需要的训练数据集的容量选择将训练数据集存储至本地节点的存储方式,之后完成训练数据集在本地节点的存储操作,最后本地节点采用训练数据集训练深度学习模型。本发明根据训练数据集的容量将训练数据集存储至本地节点,能够节省存储数据所需要的时间,进而节省了训练所需要的整体时间,从而提高了训练效率。
-
-
-
-
-
-
-
-
-