-
公开(公告)号:CN109409529A
公开(公告)日:2019-03-01
申请号:CN201811069882.1
申请日:2018-09-13
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N20/00 , G06N3/04 , G06N3/08 , G06F16/9535
Abstract: 本发明涉及一种事件认知分析方法、系统及存储介质,分析方法包括:实时获取互联网数据,对互联网数据进行处理得到特征向量;建立多维分类标签库,基于多维分类标签库和机器学习算法训练得到数据标签模型;将特征向量输入数据标签模型得到分类标签;基于分类标签进行事件认知分析。本发明实施例通过对互联网数据进行处理得到互联网数据的特征向量,基于机器学习算法得到数据标签模型,通过数据标签模型对特征向量进行分析,得到相应的分类标签,通过对互联网数据进行智能处理,形成内容关系网络,通过机器学习算法实现事件认知分析。
-
公开(公告)号:CN109408632A
公开(公告)日:2019-03-01
申请号:CN201811069854.X
申请日:2018-09-13
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 相比现有技术,本发明实施例提出的一种信息安全识别方法,通过区分待识别数据的类型,对待识别数据进行预处理,然后选择与待识别数据类型对应的安全识别模型,对待识别数据进行自动安全识别,无需人为操作即可自动完成信息的安全识别,降低了成本,方便快速,且模型识别的精准度比人工监测识别的精准度高。
-
公开(公告)号:CN109299082A
公开(公告)日:2019-02-01
申请号:CN201811068797.3
申请日:2018-09-13
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/215 , G06F16/248
Abstract: 本发明涉及一种大数据分析方法及系统,包括:采集大数据;根据预设的分析组件对所述大数据进行预处理;分析预处理后的大数据,得到可视化的分析组件;根据用户需求选择分析组件的类型;将所述分析组件进行合成,得到整个分析场景。本发明提供的技术方案可以自由选择所需要的分析组件,解决各种数据分析问题,适应各种应用场景。
-
公开(公告)号:CN119917641A
公开(公告)日:2025-05-02
申请号:CN202411988650.1
申请日:2024-12-31
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/334 , G06F16/3329 , G06T11/20 , G06F40/284 , G06N3/006 , G06F40/205
Abstract: 本发明提供了一种Agent自主规划多模态大模型内容创作方法、装置及系统,涉及大模型内容创作技术领域,包括:根据写作要求及参考文件生成待创作内容的脉络结构骨架;根据每一段落信息对应的若干待检索问题进行相关信息资料收集,生成每一段落信息对应的段落内容;根据每一锚点信息生成每一锚点信息对应的图表或图片;获取每一段落内容中的每一需要做引用计算的句子,以得到引用句子列表A;遍历相似度列表η,若ηi>η’,则确定Ai无异常;生成用户输入的写作要求对应的多模态长文;对写作内容的校对;本发明中,通过创新性地结合动态知识获取、多模态生成、长篇写作规划及内容可信度保障,显著提升了AI写作的智能性、可靠性及多样性。
-
公开(公告)号:CN119884278A
公开(公告)日:2025-04-25
申请号:CN202510070908.8
申请日:2025-01-16
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/31 , G06F40/284 , G06F16/353
Abstract: 本发明提供了大模型驱动的树索引结构在RAG内容解析中的应用方法,所述方法根据原始文本的长度和预设文本长度获取初始文本;根据初始文本对应的中间文本列表,获取中间文本列表对应的树状存储数据,其中,中间文本包括中间段落文本和中间段落文本对应的中间标题路径,中间标题路径中包括若干个标题级别不同的标题文本;获取树状存储数据中的每一个节点对应的属性信息,并将节点对应的属性信息存储到节点中,以使得对树状存储数据进行更新并给树状存储数据分配一个唯一的ID;将树状存储数据和树状存储数据的ID上传到RAG对应的数据库中,能够保证文本的整体结构和初始文本之间的语义联系不被破坏,能够提高RAG的检索效率和生成质量。
-
公开(公告)号:CN119849626A
公开(公告)日:2025-04-18
申请号:CN202411916870.3
申请日:2024-12-24
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N5/04 , G06N3/0499 , G06N3/08
Abstract: 本申请实施例提供了一种针对大语言模型的推理过程的优化方法及装置,涉及大语言模型技术领域,该方法具体为:接收用户输入的问题文本;获取所述问题文本对应的目标特征集合,并基于所述目标特征集合对所述问题文本进行复杂度量化评估,以获取所述问题文本对应的目标复杂度;所述目标特征集合中的特征用于表征所述问题文本的复杂性;基于所述目标复杂度确定待激活的解码层的目标数量M,并将所述目标数量的解码层进行激活;其中,M为大于等于1的整数;待M个解码层激活之后,利用所述M个解码层对所述问题文本进行解码分析,获取所述问题文本对应的目标答复文本。本申请能够提高大语言模型的推理效率,同时避免资源浪费。
-
公开(公告)号:CN119849625A
公开(公告)日:2025-04-18
申请号:CN202411916264.1
申请日:2024-12-24
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种基于对偶复数的知识图谱推理方法、装置、设备及介质,该方法包括:从待推理的知识图谱中提取样本三元组;对样本三元组进行负采样,得到负样本三元组;将样本三元组和负样本三元组确定为训练数据输入至用于将实体和关系嵌入至对偶复数空间的向量转换模型,基于向量转换模型输出的第一头实体向量、第一关系向量、第一尾实体向量、第二头实体向量、第二关系向量和第二尾实体向量构建损失函数,并对向量转换模型进行训练;基于训练后的向量转换模型对知识图谱进行推理补全。本公开通过将对偶复数空间应用于知识图谱的向量表示并训练向量转换模型,能够在不牺牲模型表现力的情况下减少参数量,提高知识图谱推理补全任务的运算效率。
-
公开(公告)号:CN119830345A
公开(公告)日:2025-04-15
申请号:CN202411915119.1
申请日:2024-12-24
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开实施例涉及一种基于大模型的隐私保护方法、装置、设备及介质,该方法包括:获取用户输入文本中的隐私信息以及隐私信息的实体类型标识;根据用户输入文本和实体类型标识,对隐私信息进行基于上下文的编码处理和基于类型的解码处理,得到隐私信息对应的替代信息;基于隐私信息和替代信息之间的对应关系,对用户输入文本进行基于问答模型的脱敏问答并恢复隐私信息,生成用户输入文本的应答文本。从而,提高了替代信息上下文语义的连贯性和完整性,以及替代信息与隐私信息的实体类型一致性,降低了将隐私信息替换为替代信息对脱敏问答的影响,在脱敏问答过程中保护了用户隐私,又使得最终生成的应答文本具有更好的准确性以及文本连贯性。
-
公开(公告)号:CN119760369A
公开(公告)日:2025-04-04
申请号:CN202411808970.4
申请日:2024-12-10
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F18/21 , G06F18/2431 , G06N3/0455 , G06N3/08 , G06N5/04
Abstract: 本发明涉及大模型评测领域,特别是涉及一种多模态图表问答大模型的评价测试方法、介质及设备。包括:将判断类测试数据集,输入待评测大模型,以获取判断类模型输出结果。判断类问答对中的问题信息包括对问题本体文本及对回答信息只能是正面或反面信息的提示信息。将所有填空类模型输出结果、选择类模型输出结果及判断类模型输出结果的准确性信息进行统计,生成待评测大模型的执行评价信息。本发明中鉴于多模态大模型对指令的遵循可能存在潜在的变异性,所以在针对低阶任务性能的评价中,使用的指令类型包括从正面和负面角度提出的判断题、填空题和选择题三种题型来对待评测模型进行提问,由此来更加全面的对待评测大模型进行评测。
-
公开(公告)号:CN119692472A
公开(公告)日:2025-03-25
申请号:CN202411760334.9
申请日:2024-12-03
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N5/04 , G06N20/00 , G06F40/284
Abstract: 本发明提供了一种多模态图表问答大模型构建方法、电子设备和存储介质,包括:基于第一样本数据集对图文对齐模型进行训练,得到训练好的图文特征对齐模型;其中,第一样本数据集中包括图像样本和对应的文本内容;基于第二样本数据集对具有训练好的图文特征对齐模型的多模态图表问答大模型进行训练,得到训练后的多模态图表问答大模型,作为最终的多模态图表问答大模型,第二样本数据集包括图表样本的上下文表示信息、图像和问答对数据。本发明得到的多模态图表问答大模型相对于现有的多模态图表问答大模型的图表问答能力能够得到进一步提升,且具有较强的中文理解能力。
-
-
-
-
-
-
-
-
-