-
公开(公告)号:CN118963869A
公开(公告)日:2024-11-15
申请号:CN202411434124.0
申请日:2024-10-15
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
发明人: 贾承斌
IPC分类号: G06F9/448 , G06N5/022 , G06F16/901 , G06F16/903
摘要: 本申请公开了一种基于知识图谱的大模型任务调用执行方法及装置,其中所述方法包括以API信息中的函数信息为节点、函数间的调用依赖关系为边构建目标知识图谱,基于目标知识图谱构建函数注册表,基于目标知识图谱和函数注册表建立执行智能体;将获取的目标需求和用户请求输入大模型中进行理解,生成函数调用;执行智能体基于函数调用确定目标函数及函数调用依赖关系生成调用链,并执行所述调用链得到解析结果。本申请结合大模型与智能体,能够通过大模型解析用户需求生成准确的函数调用,然后通过执行智能体进行函数调用得到解析结果,显著提升了复杂任务的处理能力和系统的响应速度。
-
公开(公告)号:CN118709147B
公开(公告)日:2024-11-12
申请号:CN202411201040.2
申请日:2024-08-29
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F18/25 , G06F18/213 , G06F18/21 , G06F40/284 , G06F40/30 , G06V30/18 , G06V30/186 , G06V30/19 , G06V30/28
摘要: 本申请提供了一种汉藏语多模态的图文处理方法及处理系统,通过提取汉藏语图文信息中汉藏语图像模态的图像特征和汉藏语文本模态的文本特征以确定第一汉藏语图文交互特征信息,根据第一汉藏语图文交互特征信息确定第一交互特征量;将汉藏语图像模态的图像切分重组得到汉藏语图像副本,根据汉藏语图像副本的图像副本特征和文本特征确定第二汉藏语图文交互特征信息,根据第二汉藏语图文交互特征信息确定第二交互特征量;基于第一交互特征量和第二交互特征量输出所述汉藏语图文交互的交互结果。上述方案基于第一交互特征量和第二交互特征量输出交互结果,可实现汉藏语图文跨模态交互的语义关联,从而提高汉藏语图文跨模态交互处理结果的真实性。
-
公开(公告)号:CN117520479B
公开(公告)日:2024-11-05
申请号:CN202311520471.0
申请日:2023-11-14
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F16/33 , G06F16/35 , G06F40/117 , G06F40/242 , G06F40/247 , G06F40/58
摘要: 本申请涉及语料生成技术领域,尤其涉及一种基于AIGC的藏语场景化音频语料生成方法及装置,方法包括:根据藏语音频语料的需求领域建立对应的知识库;对知识库进行关键词提取;基于AIGC模型,根据提取到的关键词生成需求领域对应的汉语场景化文本语料;基于翻译引擎,将生成的汉语场景化文本语料翻译为藏语场景化文本语料;获取根据藏语场景化文本语料录制的藏语场景化音频语料,将藏语场景化音频语料和藏语场景化文本语料进行绑定;将绑定的藏语场景化音频语料和藏语场景化文本语料按照需求领域及场景进行分类入库。本申请中的技术方案,可以显著提高藏语场景化音频语料的生成效率,且生成的藏语场景化音频语料标准、规范,有利于标准化管理。
-
公开(公告)号:CN118796841A
公开(公告)日:2024-10-18
申请号:CN202411295094.X
申请日:2024-09-15
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F16/22 , G06F40/18 , G06F16/2458
摘要: 本申请提供了一种金融报表自动生成系统及其生成方法,通过对资产元数据进行卷积索引得到的索引结构特征确定报表索引损失;由索引结构特征之间的差异熵对资产元数据执行复用卷积操作,得到资产复用卷积序列,进而由资产复用卷积序列中各个复用特征之间的梯度差异和报表索引损失确定报表生成过程中资产属性之间的索引粒度;通过预设资产报表模版中各个模块结构特征之间的结构依存关系和报表索引损失确定对资产元数据进行初始索引时的索引代价;进一步通过索引代价和索引粒度对资产元数据进行索引复用,得到索引复用特征,进而自动生成金融资产报表。采用本申请的方案,可实现金融数据特征的索引复用,从而减小自动生成金融报表时的索引成本。
-
公开(公告)号:CN118761413A
公开(公告)日:2024-10-11
申请号:CN202411243539.X
申请日:2024-09-05
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F40/284 , G06F40/151 , G06F40/166 , G06F40/216 , G06F40/30 , G06N3/0442
摘要: 本申请提供了一种藏语文本自动标注方法及标注系统,首先获取藏语文本信息;对藏语文本信息进行语义特征提取,得到多个语义表征向量;进而根据各个语义表征向量之间的语义相似度和各个藏语字符的词性分布确定每个藏语字符的标签粒度,然后确定各个藏语文本内容的词性标注特征;进一步得到不同藏语关键词的词性向量,在根据各个词性向量在全文中的距离依赖关系和各个藏语文本内容的词性标签确定不同藏语关键词的词性区分度;进一步确定藏语文本信息的词性标记向量,进而根据词性标记向量对所述藏语文本信息进行自适应标注。采用本申请的方案,可实现藏语多义词和同形异义词的词性标注,从而提高藏语词性判断的准确率。
-
公开(公告)号:CN118036756B
公开(公告)日:2024-06-14
申请号:CN202410444187.8
申请日:2024-04-15
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06N5/04 , G06N5/022 , G06F16/332 , G06N3/042
摘要: 本申请公开了一种大模型多轮对话的方法、装置、计算机设备及存储介质,包括:将历史问答对和最新用户提问作为节点构建目标会话的图谱;计算历史问答对之间以及最新用户提问与历史问答对之间的相关性评分;构建图谱中的有向连接;根据相关性评分对图谱中的有向关系进行标记过滤,得到最新用户提问对应的联通子图;对联通子图进行低关联节点删除,得到与问题节点紧密相关且符合大语言模型token处理限制的关联历史问答对节点;将关联历史问答对及最新用户提问输入至大语言模型中,得到最新用户提问的输出结果。本申请可有效改善多轮对话的输出效率,防止信息损失和遗漏,保证了对话输出答案的准确性,降低了计算开销,节省了计算成本。
-
公开(公告)号:CN118036756A
公开(公告)日:2024-05-14
申请号:CN202410444187.8
申请日:2024-04-15
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06N5/04 , G06N5/022 , G06F16/332 , G06N3/042
摘要: 本申请公开了一种大模型多轮对话的方法、装置、计算机设备及存储介质,包括:将历史问答对和最新用户提问作为节点构建目标会话的图谱;计算历史问答对之间以及最新用户提问与历史问答对之间的相关性评分;构建图谱中的有向连接;根据相关性评分对图谱中的有向关系进行标记过滤,得到最新用户提问对应的联通子图;对联通子图进行低关联节点删除,得到与问题节点紧密相关且符合大语言模型token处理限制的关联历史问答对节点;将关联历史问答对及最新用户提问输入至大语言模型中,得到最新用户提问的输出结果。本申请可有效改善多轮对话的输出效率,防止信息损失和遗漏,保证了对话输出答案的准确性,降低了计算开销,节省了计算成本。
-
公开(公告)号:CN117273139B
公开(公告)日:2024-02-09
申请号:CN202311548752.7
申请日:2023-11-21
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06N5/025 , G06F18/23 , G06F16/901 , G06F16/9035
摘要: 本发明涉及一种基于开放数据的知识图谱动态风险识别方法及装置,包括获取文本数据得到待处理数据,抽取得到多个抽取结果,合并构建第一联通子图;确定核心事件,向量化核心事件得到事件向量和实体向量并合并,基于合并向量从向量索引库中检索出超过预设第一相似度阈值的历史事件向量;合并事件向量和历史事件向量构建第二联通子图;从预设图数据库中查询与核心事件具有关联的实体历史事件数据,得到完整联通子图;判断完整联通子图中与核心事件具有共同实体的事件是否存在预警事件类型。本发明提供了丰富且多维度的数据输入,为后续的分析打下了坚实的基础,更准确地从大量数据中(56)对比文件Muhua Wang等.Risk Assessment ofAlpine Skiing Events Based on KnowledgeGraph: A Focus on MeteorologicalConditions.ISPRS International Journal ofGeo-Information.2021,第1-15页.许诺;唐锡晋.基于百度热搜新闻词的社会风险事件5W提取研究.系统工程理论与实践.2020,(第02期),第334-342页.
-
公开(公告)号:CN117494732A
公开(公告)日:2024-02-02
申请号:CN202311535656.9
申请日:2023-11-17
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F40/58 , G06F40/126 , G06F40/289
摘要: 本申请涉及语种翻译技术领域,尤其涉及一种融合藏文构件元素特征的藏汉神经机器翻译方法及设备,方法包括:获取待翻译藏文数据;将待翻译藏文数据输入预先训练的翻译模型,得到汉文翻译结果。其中,翻译模型的训练过程,包括:获取藏文语料数据;对藏文语料数据进行分词;遍历分词后的藏文语料数据中的每个词汇,对每个词汇逐字进行构件元素提取;将同一词汇内每个字的构件元素按照字的前后顺序进行拼接,得到词汇对应的构件元素字符串;对每个词汇及其对应的构件元素字符串进行向量的训练和获取,得到词向量和词构件元素向量;将词向量和词构件元素向量进行融合,将融合向量作为训练数据训练翻译模型。本申请可以大幅提升翻译模型的翻译质量。
-
公开(公告)号:CN116089726B
公开(公告)日:2023-07-14
申请号:CN202310200016.6
申请日:2023-03-06
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F16/9535 , G06F40/58
摘要: 本申请涉及一种汉藏语多方言多模态的资源推荐方法和装置,所述方法包括如下步骤:识别出每一条内容资源所属的语种/方言类型,根据识别结果给所述内容资源打上相应的资源‑语言类型标签;提取用户的语言类型和兴趣点;从各种类型的内容资源中筛选出第一内容资源,将所述第一内容资源在对应的目标人群内进行冷启试探;根据冷启试探结果从所述第一内容资源中筛选出第二内容资源,将所述第二内容资源在多语言人群间进行传播扩散。本申请的方案基于机器翻译与相似人群扩散,能够实现多语种/方言的匹配推荐,达到了特定语言资源在特定语言人群中进行扩散的目标,在精准性和泛化性之间实现个性化均衡。
-
-
-
-
-
-
-
-
-