-
公开(公告)号:CN118965441A
公开(公告)日:2024-11-15
申请号:CN202411419450.4
申请日:2024-10-12
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F21/62
摘要: 本申请提供了一种基于大模型的金融数据隐私保护方法及系统,在获取当前金融贸易中的金融数据后,确定金融隐私数据簇中每个金融隐私数据的隐私敏感度;根据各个隐私敏感度和所有的隐私损失量确定金融隐私数据簇中所有金融隐私数据的关联隐私损失,由所有的关联隐私损失和当前金融贸易中差分隐私模型的总隐私预算确定金融隐私数据簇的差分隐私约束;通过差分隐私指数和各个关联隐私损失确定金融隐私数据簇中每个金融隐私数据在历史金融贸易中的动态隐私界限,进而通过动态隐私界限对当前金融贸易中的金融数据进行动态保护。上述方案基于隐私预算的动态适应性分配对金融数据进行隐私保护,可提高金融数据隐私保护时的隐私保护适配能力。
-
公开(公告)号:CN118865416A
公开(公告)日:2024-10-29
申请号:CN202411243554.4
申请日:2024-09-05
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06V30/246 , G06F40/58 , G06N3/0464 , G06V10/82 , G06V30/14 , G06V30/148 , G06V30/19
摘要: 本申请提供了一种基于藏语字符结构的翻译装置及其图像读取方法,通过对目标藏语文本图像执行卷积识别操作得到的藏文字符结构序列进行音节向量抽取,得到多个音节向量;根据各个音节向量之间的置信距离确定音节之间的内联关系,进而由所有的内联关系和各个音节向量之间共同出现的概率确定音节向量抽取过程中的音节损失量;由环境的光照强度数据和藏文字符结构序列确定字符识别的卷积干扰量,再由卷积干扰量和音节损失量确定识别藏语字符时的字符识别损失;进而由字符识别损失对各个音节向量进行读取补偿,得到多个音节补偿向量,基于所有的音节补偿向量完成图像读取。采用本申请的方案,可实现藏语字符结构识别过程中识别损失的自适应补偿。
-
公开(公告)号:CN118761389A
公开(公告)日:2024-10-11
申请号:CN202411243510.1
申请日:2024-09-05
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F40/166 , G06F40/151 , G06F40/284 , G06F40/30 , G06F40/58 , G06N3/0442 , G06N3/08
摘要: 本申请提供了一种藏语机翻系统及藏语文本自动分段方法,通过获取藏语文本信息;进而对藏语文本信息中所有的藏语语句进行语句表征提取,得到多个藏语语句表征序列;进一步确定每个藏语语句的语句粒度,从而对所有的藏语语句进行主题划分,得到多个语义主题簇;从藏语文本信息提取出不同藏语关键词的词性向量,从而确定每个藏语语句中各个藏语关键词的词间转移特征,进一步确定不同藏语关键词的词间转移度;进而确定藏语文本信息的段落分界特征,从而基于段落分界特征对藏语文本信息进行自适应分段。采用本申请的方案,可增强藏语的语义内容与段落之间的逻辑结构变化的关联,从而提高藏语文本段落划分的准确性。
-
公开(公告)号:CN118133972B
公开(公告)日:2024-07-19
申请号:CN202410571235.X
申请日:2024-05-10
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
摘要: 本发明涉及一种基于知识图谱的内容检索生成方法、装置及存储介质,应用于数据检索技术领域,包括:通过对文档进行拆分后,根据文档之间的关联关系,构建具有文档关联关系的知识图谱,以丰富文档间的互联和上下文理解,提升检索的准确性和信息的全面性,通过对用户问题进行拓展改写,以提高对问题的理解和回答的复杂性,充分理解用户的需求的同时提供更精准、更具相关性的答案;本申请中基于知识图谱的检索,使得本方案可以应用于多种领域,而不仅限于特定的领域,可以处理更多种类的查询和数据类型,能够更有效地处理和分析复杂文本数据,提供更全面和精确的信息,特别是在需要广泛文档处理和深入分析的场景中。
-
公开(公告)号:CN118313462A
公开(公告)日:2024-07-09
申请号:CN202410732521.X
申请日:2024-06-07
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
摘要: 一种基于大语言模型的文章评分方法、装置及电子设备,涉及数据处理领域;能够自动对文章进行打分,减少人工操作。该基于大语言模型的文章评分方法包括:获取用户输入的待评分文章的评分特征;获取输入模板,所述输入模板中包括多个输入字段,所述输入字段与所述评分特征一一对应;采用所述评分特征替换所述输入模板中对应的所述输入字段,得到输入信息;将所述输入信息输入大语言模型中,得到所述待评分文章的评分。
-
公开(公告)号:CN118035526B
公开(公告)日:2024-06-25
申请号:CN202410410822.0
申请日:2024-04-08
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
IPC分类号: G06F16/953 , G06F16/36
摘要: 本发明提供了一种社交媒体精英节点识别方法及系统,其中方法包括:收集精英活动数据;基于所述精英活动数据构建精英受众关系图;计算所述精英受众关系图中各节点的中心性指标,基于所述中心线指标识别所述精英受众关系图中的关键节点;分析各所述关键节点的动员性能指标,基于所述动员性能指标筛选所述关键节点中的精英节点。通过本发明,基于大数据分析和机器学习,能够有效地从海量信息中,快速、准确地识别出舆论中具有影响力和代表性的精英群体,对于理解网络舆论的形成、传播和演变具有重要意义。
-
公开(公告)号:CN118133973A
公开(公告)日:2024-06-04
申请号:CN202410571237.9
申请日:2024-05-10
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
摘要: 一种基于大语言模型的报告生成方法及装置,涉及数据处理领域;能够提高自动生成报告的准确性。该基于大语言模型的报告生成方法包括:接收用户输入的报告要点信息,采用大语言模型生成所述报告要点信息对应的文本问题;将所述报告要点信息与文本问题转化成向量,并采用所述向量在向量数据库中进行检索,得到近似报告;根据所述近似报告的目录,生成待处理目录;采用待处理目录从文献知识库中检索,得到各个章节的检索结果,基于所述待处理目录与所述检索结果生成报告。
-
公开(公告)号:CN118095252A
公开(公告)日:2024-05-28
申请号:CN202410015603.2
申请日:2024-01-04
申请人: 网智天元科技集团股份有限公司 , 北京网智天元大数据科技有限公司
IPC分类号: G06F40/211 , G06N3/0442 , G06N3/08
摘要: 本申请涉及数据处理技术领域,具体涉及舆情关联企业识别模型的训练方法、识别方法及装置。其中,方法包括:获取舆情数据;使用依存句法分析对舆情数据中的组织机构进行句法分析,得到分析结果;基于所述分析结果,得到舆情数据强相关的组织机构和不相关组织机构;基于所述舆情数据强相关的组织机构和不相关组织机构对所述舆情数据进行批注得到训练数据;采用双向LSTM进行上下文关联信息建模,得到舆情关联企业识别模型;利用所述训练数据对所述舆情关联企业识别模型进行训练。如此,舆情关联企业识别模型自动进行舆情关联企业的识别。
-
公开(公告)号:CN118051583A
公开(公告)日:2024-05-17
申请号:CN202410423981.4
申请日:2024-04-10
申请人: 北京网智天元大数据科技有限公司 , 网智天元科技集团股份有限公司
摘要: 本申请提供一种基于大型语言模型的数据可视化交互方法、装置及设备。其中,通过语音输入的方式,可以提高用户体验和操作效率,用户可以更自然、快速地与系统交互,而且转换得到的文本信息更加准确、清晰。同时,结合用户的查询记录和上下文,可以更精确地理解用户的查询意图,提高精准性,避免用户多次修改或调整查询问题。此外,通过大型语言模型来确定当前查询结果数据最合适的可视化方式,可以保证可视化选项与数据的匹配度,提高可视化展示的效果。因此,采用本申请的方案,在数据可视化交互时,可以提高用户的使用体验且保证可视化展示的效果。
-
公开(公告)号:CN117893862A
公开(公告)日:2024-04-16
申请号:CN202311856803.2
申请日:2023-12-29
申请人: 网智天元科技集团股份有限公司 , 北京网智天元大数据科技有限公司
IPC分类号: G06V10/80 , G06F40/284
摘要: 本申请提供了一种多模态文章内容处理系统及其控制方法,通过获取目标多模态文章的图像模态特征向量集和文本模态词特征向量集,根据图像模态特征向量集中各个图像模态特征向量之间的图像主题敏感因子确定图像模态主题特征界定域,确定文本模态词特征向量集中每个文本模态词特征向量的核心分词度量因子,根据所述文本模态词特征向量集和所有的核心分词度量因子确定文本模态核心词特征界定域,通过所述图像模态主题特征界定域和所述文本模态核心词特征界定域确定目标多模态文章的模态融合评价熵集,根据所述模态融合评价熵集和所有的核心分词度量因子对目标多模态文章进行主题划分,可提高多模态文章中各模态之间的信息融合度。
-
-
-
-
-
-
-
-
-