-
公开(公告)号:CN115878760B
公开(公告)日:2023-05-23
申请号:CN202310147690.2
申请日:2023-02-10
申请人: 北京知呱呱科技服务有限公司 , 知呱呱(天津)大数据技术有限公司
IPC分类号: G06F16/33 , G06F16/901 , G06F40/253 , G06F40/30 , G06F40/289 , G06F40/216 , G06F40/194 , G06N3/0455 , G06N3/048 , G06N3/08 , G06Q50/18
摘要: 本发明公开了一种基于图匹配的跨语种专利检索方法及系统,通过对不同语种的专利构建专利文本树,匹配当前专利和对比专利的专利表征图中节点和边的关系,基于最优传输算法实现跨语种专利检索。本发明提出的专利检索方法,利用专利文本内部篇章、段落等结构特征与文本片段之间的相似度将不同语种的专利构建为图,充分利用了专利文本的结构特征和文本内在的关联信息,结合图注意力机制对专利节点进行编码,使用最优传输算法实现图匹配,提升了跨语种专利检索的查全率和查准率。
-
公开(公告)号:CN116028620A
公开(公告)日:2023-04-28
申请号:CN202310132408.3
申请日:2023-02-20
申请人: 知呱呱(天津)大数据技术有限公司
IPC分类号: G06F16/34 , G06F40/166 , G06F16/174 , G06N20/00
摘要: 本发明公开了一种基于多任务特征协同的生成专利摘要的方法及系统,基于多任务模型分别生成要解决的技术问题和有益效果、用途、核心方案、发明点、其他技术方案中的发明信息等生成文本,通过汇总生成专利摘要流程得到最终的专利摘要,实现输入原始专利文本自动撰写输出专利摘要的目的,降低了专利摘要撰写的人工成本,提升了专利摘要撰写的效率。
-
公开(公告)号:CN115794999B
公开(公告)日:2023-04-11
申请号:CN202310048755.8
申请日:2023-02-01
申请人: 北京知呱呱科技服务有限公司 , 知呱呱(天津)大数据技术有限公司
IPC分类号: G06F16/33 , G06F16/338 , G06F40/166 , G06F40/284 , G06F16/31 , G06F40/247
摘要: 本申请公开了一种基于扩散模型的专利文档查询方法及计算机设备,旨在解决目前专利检索的完整性和准确率不够理想的问题。本申请对于用户检索输入的较短文本,经分词得到若干关键词,分别送入三个扩散模型进行扩散生成,其中,将分词结果中各个关键词的聚类共同作为扩散模型的控制信号以限制扩散生成方向;三个扩散模型的训练语料分别来源于摘要、权利要求书和说明书,用于相应生成分别与摘要、权利要求、说明书语句表达形式相似的句子;进行检索后,将得到的三组专利文档进行加权整合,选取加权后相似度最高的若干篇专利文档作为用户的意图检索结果并输出;从而使检索的结果全面并更符合用户的真实检索意图,提高了专利检索的完整性和准确率。
-
公开(公告)号:CN115794999A
公开(公告)日:2023-03-14
申请号:CN202310048755.8
申请日:2023-02-01
申请人: 北京知呱呱科技服务有限公司 , 知呱呱(天津)大数据技术有限公司
IPC分类号: G06F16/33 , G06F16/338 , G06F40/166 , G06F40/284 , G06F16/31 , G06F40/247
摘要: 本申请公开了一种基于扩散模型的专利文档查询方法及计算机设备,旨在解决目前专利检索的完整性和准确率不够理想的问题。本申请对于用户检索输入的较短文本,经分词得到若干关键词,分别送入三个扩散模型进行扩散生成,其中,将分词结果中各个关键词的聚类共同作为扩散模型的控制信号以限制扩散生成方向;三个扩散模型的训练语料分别来源于摘要、权利要求书和说明书,用于相应生成分别与摘要、权利要求、说明书语句表达形式相似的句子;进行检索后,将得到的三组专利文档进行加权整合,选取加权后相似度最高的若干篇专利文档作为用户的意图检索结果并输出;从而使检索的结果全面并更符合用户的真实检索意图,提高了专利检索的完整性和准确率。
-
公开(公告)号:CN117521604B
公开(公告)日:2024-07-05
申请号:CN202311646442.9
申请日:2023-12-04
申请人: 北京知呱呱科技有限公司 , 知呱呱(天津)大数据技术有限公司
IPC分类号: G06F40/166 , G06N20/00
摘要: 本发明公开了一种基于大模型的商标生成方法及系统,该方法包括训练数据构建、大模型的训练、评分模型的训练、大模型强化训练、大模型生成商标以及用户数据再收集并模型再训练的步骤,可以真实的模拟用户的需求,在训练数据构建阶段尽可能多的生成各种情况的需求指令,通过结合用户的偏好数据,训练基于用户偏好的评分模型控制大模型生成出用户更加喜欢的商标名称。同时还可不断的收集用户选取商标的数据,不断的对大模型进行迭代优化,逐步提升大模型的效果,使得模型生成出来的商标更加贴近用户的需求和期望。
-
公开(公告)号:CN118013020B
公开(公告)日:2024-06-18
申请号:CN202410417485.8
申请日:2024-04-09
申请人: 北京知呱呱科技有限公司 , 知呱呱(天津)大数据技术有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F40/284 , G06Q50/18
摘要: 本申请公开了一种基于检索生成联合式训练的专利查询方法及系统,方法包括首先利用问题生成模型分析用户的初始查询,并生成一系列细化且关联度高的查询问题;随后,文档检索模型根据这些精心构造的查询问题对专利数据库进行检索,返回按相关性排列的专利文档列表;在此基础上,通过对检索结果的综合分析,特别是通过识别出的潜在硬负样本,自动分析正负样本的区别技术特征,进而能够动态调整和优化问题生成模型,以生成具有更高区分能力的查询问题,从而进一步提高检索的准确率。
-
公开(公告)号:CN117725247B
公开(公告)日:2024-04-26
申请号:CN202410172400.4
申请日:2024-02-07
申请人: 北京知呱呱科技有限公司 , 知呱呱(天津)大数据技术有限公司
IPC分类号: G06F16/58 , G06F16/583 , G06N3/0455 , G06N3/0464 , G06N3/0499 , G06N3/084 , G06V10/26 , G06V10/44
摘要: 本申请公开了一种基于检索及分割增强的扩散图像生成方法及系统,方法包括模型构建、数据集构建、模型训练以及图像生成,通过将图像检索及语义分割技术与扩散模型相结合,在扩散模型的文本生成图像过程中引入外部的检索图像及其语义分割结果,结合用户输入的描述文本和检索及语义分割得到的图像向量融合,丰富了输入信息种类。外部检索图像扩充了描述文本的语义;语义分割形成的构成部件拆解细化了对待生成图像的结构理解。本申请在理解基础上指导扩散模型更加准确、多样的生成图像,提高了生成图像的语义一致性和视觉质量,能够生成与文本描述更加匹配的图像。
-
公开(公告)号:CN117521604A
公开(公告)日:2024-02-06
申请号:CN202311646442.9
申请日:2023-12-04
申请人: 北京知呱呱科技有限公司 , 知呱呱(天津)大数据技术有限公司
IPC分类号: G06F40/166 , G06N20/00
摘要: 本发明公开了一种基于大模型的商标生成方法及系统,该方法包括训练数据构建、大模型的训练、评分模型的训练、大模型强化训练、大模型生成商标以及用户数据再收集并模型再训练的步骤,可以真实的模拟用户的需求,在训练数据构建阶段尽可能多的生成各种情况的需求指令,通过结合用户的偏好数据,训练基于用户偏好的评分模型控制大模型生成出用户更加喜欢的商标名称。同时还可不断的收集用户选取商标的数据,不断的对大模型进行迭代优化,逐步提升大模型的效果,使得模型生成出来的商标更加贴近用户的需求和期望。
-
公开(公告)号:CN117350304B
公开(公告)日:2024-02-02
申请号:CN202311639567.9
申请日:2023-12-04
申请人: 知呱呱(天津)大数据技术有限公司
IPC分类号: G06F40/35 , G06F40/216 , G06N3/045 , G06N3/0499 , G06N3/08
摘要: 本申请公开了一种多轮对话上下文向量增强方法及系统,方法包括通过Ernie3模型编码,智能化地从对话内容中提取出语义信息并形成初始上下文向量;接收预处理过的文本作为输入并通过各个下游任务进行学习,从而提取出不同的任务特性并形成增强向量;利用预训练的解码器评估增强向量的效果,随后引入了PPO策略与KL散度计算,确保增强向量与初始向量在分布上的相似性。本申请为多轮对话上下文提供了一个全新、高效的向量表示和增强方法,进一步提升了对话理解的准确性,为下游任务提供更为精准的信息。(56)对比文件Yu Sun etc..ERNIE 3.0: LARGE-SCALEKNOWLEDGE ENHANCED PRE-TRAINING FORLANGUAGE UNDERSTANDING ANDGENERATION.arXiv:2107.02137v1 [cs.CL].2021,全文.
-
公开(公告)号:CN117475086A
公开(公告)日:2024-01-30
申请号:CN202311773821.4
申请日:2023-12-22
申请人: 知呱呱(天津)大数据技术有限公司
IPC分类号: G06T17/00 , G06F40/211 , G06F40/289 , G06N3/0455 , G06N3/08
摘要: 本申请公开了一种基于扩散模型的科技文献附图生成方法及系统,方法包括通过获取目标文献中的图片文本描述以及对应图片,并形成训练数据对;然后利用训练数据,对扩散模型进行训练;最后将训练数据当中的图片描述性文本当中的各个组件以及各组件直接的联系给提取出来,并且将提取出来的组件以及关系融合至图片生成的过程当中。本方法能够理解附图说明内容并生成匹配的附图,帮助提高科研人员检索和阅读分析文献的效率,还能帮助科研人员更好地表达和呈现研究成果。
-
-
-
-
-
-
-
-
-