-
公开(公告)号:CN117874293A
公开(公告)日:2024-04-12
申请号:CN202410024477.7
申请日:2024-01-05
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/84 , G06F40/289 , G06F40/295 , G06F16/33 , G06N20/00
Abstract: 本申请提出一种文本转换模型的训练方法、非结构化文本数据的处理方法和装置,其中,具体的实施方案为:获取预训练好的文本转换模型,其中,文本转换模型是基于通用领域下的非结构化文本和对应的结构化文本训练得到的;获取目标业务领域下的非结构化文本样本;对非结构化文本样本进行结构化处理,以得到非结构化文本样本对应的结构化文本样本;根据非结构化文本样本以及对应的结构化文本样本,对文本转换模型进行训练,以得到适配于目标业务领域的目标文本转换模型,由此,基于预训练好的文本转换模型,无需大量的非结构化文本训练数据,即可得到适配于目标业务领域的目标文本转换模型,提高了目标文本转换模型进行文本转换的准确率。
-
公开(公告)号:CN116340313A
公开(公告)日:2023-06-27
申请号:CN202211617773.5
申请日:2022-12-15
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/22 , G06F16/242 , G06F16/27
Abstract: 本发明提供了一种基于多级目录的数据共享请求的处理方法以及装置,该方法包括:接收到客户端发送的数据共享请求;基于所述数据共享请求的字段从职能目录中获取到目标职能;获取到所述所述目标职能关联的数据目录;基于所述数据目录获取到所述数据共享请求的目标数据;将所述目标数据向所述客户端进行反馈。解决了现有技术中目录编制应用性差的技术问题。
-
公开(公告)号:CN117828053A
公开(公告)日:2024-04-05
申请号:CN202311866715.0
申请日:2023-12-29
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/332 , G06F40/279 , G06F40/30 , G06N5/04 , G06N20/00 , G06Q50/18
Abstract: 本公开提供一种非结构化文本处理方法、装置、设备及存储介质,涉及自然语言理解技术领域。在本公开的一些实施例中,获取待处理的法律文书页面和非结构化问题文本;对所述法律文书页面进行文本识别,得到法律文书文本;将所述法律文书文本输入已经训练得到的生成式特征提取模型中,得到所述法律文书文本对应的语义解答文本;将所述非结构化问题文本和语义解答文本输入生成式语言模型中,得到所述非结构化问题文本对应的问题解答文本,提高非结构化问题文本的解答文本的准确率。
-
-