-
公开(公告)号:CN118965279A
公开(公告)日:2024-11-15
申请号:CN202411435306.X
申请日:2024-10-15
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F18/25 , G06F40/211 , G06F40/30 , G06V20/70 , G06F16/35 , G06F18/2433
摘要: 本申请提供了一种基于大模型的金融内容风控方法及系统,首先对目标金融文档进行多模态语义特征提取,得到文本语义空间和图像语义空间;根据文本语义空间中各个文本语义特征在上下文的关系语义和文本语义特征的句法结构关系确定文本模态的语义关联图;再通过图像的整体语义特征和图像内视觉对象的句法特征将图像语义空间的语义结构关系转换为图像模态的语义关联图;对文本模态的语义关联图和图像模态的语义关联图进行模态间细粒度结构融合,得到多模态融合图;基于多模态融合图,对提取的多模态特征进行异常分类,判断目标金融文档是否存在风险。采用本申请的方案,可实现金融文档的细粒度多模态特征融合,从而提高风控检测的准确性。
-
公开(公告)号:CN116361445B
公开(公告)日:2023-08-08
申请号:CN202310530158.9
申请日:2023-05-12
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F16/335 , G06F16/33 , G06F40/58 , G06F40/205 , G06F16/35 , G06N3/0475 , G06N3/08
摘要: 本发明涉及一种藏汉双语用户兴趣标签的预测方法及装置,所述方法包括获取用户行为日志,通过用户行为日志确定用户的兴趣数据;其中,用户行为日志为藏汉双语行为日志;根据兴趣数据得到用户兴趣标签,将用户兴趣标签作为训练样本,并对训练样本进行处理,得到左边塔输入向量和右边塔输入向量;利用左边塔输入向量和右边塔输入向量对初始预测模型进行训练,得到用户兴趣标签预测模型;其中,初始预测模型为双塔深度神经网络结构,包括左边塔和右边塔。本发明直接使用模型中已有的兴趣点来预测用户可能感兴趣的潜在未知兴趣点,从来源上能够覆盖大部分的待探索兴趣点和待探索资源,从而能够取得更好的探索效果。
-
公开(公告)号:CN118313462A
公开(公告)日:2024-07-09
申请号:CN202410732521.X
申请日:2024-06-07
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
摘要: 一种基于大语言模型的文章评分方法、装置及电子设备,涉及数据处理领域;能够自动对文章进行打分,减少人工操作。该基于大语言模型的文章评分方法包括:获取用户输入的待评分文章的评分特征;获取输入模板,所述输入模板中包括多个输入字段,所述输入字段与所述评分特征一一对应;采用所述评分特征替换所述输入模板中对应的所述输入字段,得到输入信息;将所述输入信息输入大语言模型中,得到所述待评分文章的评分。
-
公开(公告)号:CN117893862A
公开(公告)日:2024-04-16
申请号:CN202311856803.2
申请日:2023-12-29
申请人: 网智天元科技集团股份有限公司 , 北京网智天元大数据科技有限公司
IPC分类号: G06V10/80 , G06F40/284
摘要: 本申请提供了一种多模态文章内容处理系统及其控制方法,通过获取目标多模态文章的图像模态特征向量集和文本模态词特征向量集,根据图像模态特征向量集中各个图像模态特征向量之间的图像主题敏感因子确定图像模态主题特征界定域,确定文本模态词特征向量集中每个文本模态词特征向量的核心分词度量因子,根据所述文本模态词特征向量集和所有的核心分词度量因子确定文本模态核心词特征界定域,通过所述图像模态主题特征界定域和所述文本模态核心词特征界定域确定目标多模态文章的模态融合评价熵集,根据所述模态融合评价熵集和所有的核心分词度量因子对目标多模态文章进行主题划分,可提高多模态文章中各模态之间的信息融合度。
-
公开(公告)号:CN118709147B
公开(公告)日:2024-11-12
申请号:CN202411201040.2
申请日:2024-08-29
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F18/25 , G06F18/213 , G06F18/21 , G06F40/284 , G06F40/30 , G06V30/18 , G06V30/186 , G06V30/19 , G06V30/28
摘要: 本申请提供了一种汉藏语多模态的图文处理方法及处理系统,通过提取汉藏语图文信息中汉藏语图像模态的图像特征和汉藏语文本模态的文本特征以确定第一汉藏语图文交互特征信息,根据第一汉藏语图文交互特征信息确定第一交互特征量;将汉藏语图像模态的图像切分重组得到汉藏语图像副本,根据汉藏语图像副本的图像副本特征和文本特征确定第二汉藏语图文交互特征信息,根据第二汉藏语图文交互特征信息确定第二交互特征量;基于第一交互特征量和第二交互特征量输出所述汉藏语图文交互的交互结果。上述方案基于第一交互特征量和第二交互特征量输出交互结果,可实现汉藏语图文跨模态交互的语义关联,从而提高汉藏语图文跨模态交互处理结果的真实性。
-
公开(公告)号:CN117494732A
公开(公告)日:2024-02-02
申请号:CN202311535656.9
申请日:2023-11-17
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F40/58 , G06F40/126 , G06F40/289
摘要: 本申请涉及语种翻译技术领域,尤其涉及一种融合藏文构件元素特征的藏汉神经机器翻译方法及设备,方法包括:获取待翻译藏文数据;将待翻译藏文数据输入预先训练的翻译模型,得到汉文翻译结果。其中,翻译模型的训练过程,包括:获取藏文语料数据;对藏文语料数据进行分词;遍历分词后的藏文语料数据中的每个词汇,对每个词汇逐字进行构件元素提取;将同一词汇内每个字的构件元素按照字的前后顺序进行拼接,得到词汇对应的构件元素字符串;对每个词汇及其对应的构件元素字符串进行向量的训练和获取,得到词向量和词构件元素向量;将词向量和词构件元素向量进行融合,将融合向量作为训练数据训练翻译模型。本申请可以大幅提升翻译模型的翻译质量。
-
公开(公告)号:CN116089726B
公开(公告)日:2023-07-14
申请号:CN202310200016.6
申请日:2023-03-06
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F16/9535 , G06F40/58
摘要: 本申请涉及一种汉藏语多方言多模态的资源推荐方法和装置,所述方法包括如下步骤:识别出每一条内容资源所属的语种/方言类型,根据识别结果给所述内容资源打上相应的资源‑语言类型标签;提取用户的语言类型和兴趣点;从各种类型的内容资源中筛选出第一内容资源,将所述第一内容资源在对应的目标人群内进行冷启试探;根据冷启试探结果从所述第一内容资源中筛选出第二内容资源,将所述第二内容资源在多语言人群间进行传播扩散。本申请的方案基于机器翻译与相似人群扩散,能够实现多语种/方言的匹配推荐,达到了特定语言资源在特定语言人群中进行扩散的目标,在精准性和泛化性之间实现个性化均衡。
-
公开(公告)号:CN116089726A
公开(公告)日:2023-05-09
申请号:CN202310200016.6
申请日:2023-03-06
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F16/9535 , G06F40/58
摘要: 本申请涉及一种汉藏语多方言多模态的资源推荐方法和装置,所述方法包括如下步骤:识别出每一条内容资源所属的语种/方言类型,根据识别结果给所述内容资源打上相应的资源‑语言类型标签;提取用户的语言类型和兴趣点;从各种类型的内容资源中筛选出第一内容资源,将所述第一内容资源在对应的目标人群内进行冷启试探;根据冷启试探结果从所述第一内容资源中筛选出第二内容资源,将所述第二内容资源在多语言人群间进行传播扩散。本申请的方案基于机器翻译与相似人群扩散,能够实现多语种/方言的匹配推荐,达到了特定语言资源在特定语言人群中进行扩散的目标,在精准性和泛化性之间实现个性化均衡。
-
公开(公告)号:CN118709147A
公开(公告)日:2024-09-27
申请号:CN202411201040.2
申请日:2024-08-29
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F18/25 , G06F18/213 , G06F18/21 , G06F40/284 , G06F40/30 , G06V30/18 , G06V30/186 , G06V30/19 , G06V30/28
摘要: 本申请提供了一种汉藏语多模态的图文处理方法及处理系统,通过提取汉藏语图文信息中汉藏语图像模态的图像特征和汉藏语文本模态的文本特征以确定第一汉藏语图文交互特征信息,根据第一汉藏语图文交互特征信息确定第一交互特征量;将汉藏语图像模态的图像切分重组得到汉藏语图像副本,根据汉藏语图像副本的图像副本特征和文本特征确定第二汉藏语图文交互特征信息,根据第二汉藏语图文交互特征信息确定第二交互特征量;基于第一交互特征量和第二交互特征量输出所述汉藏语图文交互的交互结果。上述方案基于第一交互特征量和第二交互特征量输出交互结果,可实现汉藏语图文跨模态交互的语义关联,从而提高汉藏语图文跨模态交互处理结果的真实性。
-
公开(公告)号:CN116361445A
公开(公告)日:2023-06-30
申请号:CN202310530158.9
申请日:2023-05-12
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F16/335 , G06F16/33 , G06F40/58 , G06F40/205 , G06F16/35 , G06N3/0475 , G06N3/08
摘要: 本发明涉及一种藏汉双语用户兴趣标签的预测方法及装置,所述方法包括获取用户行为日志,通过用户行为日志确定用户的兴趣数据;其中,用户行为日志为藏汉双语行为日志;根据兴趣数据得到用户兴趣标签,将用户兴趣标签作为训练样本,并对训练样本进行处理,得到左边塔输入向量和右边塔输入向量;利用左边塔输入向量和右边塔输入向量对初始预测模型进行训练,得到用户兴趣标签预测模型;其中,初始预测模型为双塔深度神经网络结构,包括左边塔和右边塔。本发明直接使用模型中已有的兴趣点来预测用户可能感兴趣的潜在未知兴趣点,从来源上能够覆盖大部分的待探索兴趣点和待探索资源,从而能够取得更好的探索效果。
-
-
-
-
-
-
-
-
-