一种基于全局信息增强的脱离上下文虚假信息检测方法

    公开(公告)号:CN119670729B

    公开(公告)日:2025-04-25

    申请号:CN202510180111.3

    申请日:2025-02-19

    Inventor: 廖勇 沈梦 罗梓恒

    Abstract: 本发明公开了一种基于全局信息增强的脱离上下文虚假信息检测方法,涉及人工智能技术领域,包括:获取图像和两个标题组成三元组,将三元组输入到多模态语言推理模型中,将类别索引为中立的三元组输入到视觉语义推理模型中,将类别索引为蕴含的三元组判定为未脱离上下文的真实信息,将类别索引为矛盾的三元组判定为脱离上下文的虚假信息;基于视觉语义推理模型输出图像分别和两个标题之间的关系分数#imgabs0#和#imgabs1#;基于预训练语言模型计算两个标题之间的相似度#imgabs2#,将#imgabs3#和#imgabs4#均大于预设图文阈值#imgabs5#且#imgabs6#小于预设文本阈值#imgabs7#的三元组判定为脱离上下文的虚假信息;该虚假信息检测方法,能更好的检测出脱离上下文的虚假信息,检测准确度高。

    一种跨域矛盾纠纷数据归集方法
    2.
    发明公开

    公开(公告)号:CN118445558A

    公开(公告)日:2024-08-06

    申请号:CN202410556531.2

    申请日:2024-05-07

    Abstract: 本发明涉及隐私计算技术领域,公开了一种跨域矛盾纠纷数据归集方法,包括:提取矛盾纠纷数据的纠纷文本内容和纠纷类别标签;客户端本地使用预训练语言模型对采集的矛盾纠纷数据进行建模,得到特征向量;利用本地数据训练本地模型,并将本地模型当前的预测准确率和扰动后的梯度上传给中心服务器,中心服务器进行加权聚合,将全局模型的参数分发给客户端,各客户端更新本地模型继续训练;在验证集上测试全局模型,并根据测试结果调整全局模型的超参,得到最终的跨域矛盾纠纷分类模型;本发明避免了直接共享隐私敏感的原始数据,有效解决了数据分散和隐私保护的问题;通过联合各方的矛盾纠纷数据资源和建模能力,最终得到了跨域矛盾纠纷归集模型。

    一种多元社会矛盾纠纷多模态数据归集方法

    公开(公告)号:CN118379746A

    公开(公告)日:2024-07-23

    申请号:CN202410335439.3

    申请日:2024-03-22

    Abstract: 本发明公开了一种多元社会矛盾纠纷多模态数据归集方法,将目标图像输入到目标预测模型中以输出矛盾纠纷的预测结果;目标预测模型的训练过程如下:S1:获取矛盾纠纷类型的文本以及图像,构建包括文本以及图像的训练集;S2:将训练集中的图像输入到Vision Transformer模型中,得到图像特征;S3:将训练集中的文本输入到RoBERTa模型中,得到文本特征;S4:计算一组文本特征与矛盾纠纷不同场景的图像特征之间的余弦相似度,取相似度得分最大的对应类型作为目标预测模型对矛盾纠纷相关图像的预测结果;该多模态数据归集方法提高了海量多源异构矛盾纠纷数据归集方法对复杂多样的数据环境的适应性。

    一种知识图谱可视化动态交互工具构建方法及系统

    公开(公告)号:CN118036735A

    公开(公告)日:2024-05-14

    申请号:CN202311693993.0

    申请日:2023-12-08

    Abstract: 本发明公开了一种知识图谱可视化动态交互工具构建方法及系统,包括如下步骤:S1:构建知识图谱的数据支撑集,采用自上而下的方式设计矛盾纠纷领域的知识图谱模型;S2:以实体、关系以及其属性信息的目标,基于数据支撑集和知识图谱模型,形成三元组知识数据;S3:以人员和事件为中心,对三元组知识数据进行融合,形成知识图谱雏形;S4:基于知识图谱雏形中已有的实体及关系,得到多元矛盾纠纷知识图谱并储存;S5:用图谱可视化工具对多元矛盾纠纷知识图谱的节点与关系进行展示并生成可视化交互;该构建方法及系统旨在改进现有技术在知识图谱可视化和动态交互领域中存在的问题,并满足用户对于数据探索、分析和决策支持的需求。

    一种基于混合文本和代码预训练编码的漏洞检测方法

    公开(公告)号:CN119622747A

    公开(公告)日:2025-03-14

    申请号:CN202411801688.3

    申请日:2024-12-09

    Inventor: 廖勇 李健健

    Abstract: 本发明涉及漏洞检测技术领域,公开了一种基于混合文本和代码预训练编码的漏洞检测方法,包括:通过预训练的CodeBERT模型对输入的代码进行编码,得到代码特征向量;通过预训练的codeGPT模型对输入的提示词进行编码,得到提示词特征向量;将代码特征向量和提示词特征向量映射到相同维度后,进行拼接,得到拼接特征向量;利用低秩适应方法对大语言模型进行微调;将拼接特征向量输入到微调后的大语言模型进行推理,得到漏洞检测结果,即代码是否存在对应漏洞。本发明创新性地结合CodeBERT模型和codeGPT模型的优势,分别对代码和提示词进行特征编码,有效融合代码深层结构与提示词语义信息。

    一种基于尺度注意力的人群计数方法

    公开(公告)号:CN119274125A

    公开(公告)日:2025-01-07

    申请号:CN202411285399.2

    申请日:2024-09-13

    Abstract: 本发明涉及人群计数技术领域,公开了一种基于尺度注意力的人群计数方法,包括:对输入的图像进行特征提取;将多尺度级别特征经过尺度注意力模块和特征融合模块,在最高尺度级别分辨率层聚合并继承来自各低分辨率层的信息;在各个分辨率层级上,将融合特征输入至密度图生成模块,以获取不同尺度级别下的预测密度图;设计基于多专家思想的损失函数,对人群计数模型进行训练;将待预测的人群图像经过预处理后,输入至训练好的人群计数模型,在最高尺度级别分辨率层输出预测密度图,实现人群数量的预测。本发明通过探索不同特征层次与不同行人头部尺度之间的内在联系,以充分利用和整合不同特征级别下的尺度感知能力,实现准确的人群计数。

    基于三维高斯的三维场景生成与编辑方法、系统

    公开(公告)号:CN118570353A

    公开(公告)日:2024-08-30

    申请号:CN202410689870.8

    申请日:2024-05-30

    Abstract: 本发明涉及三维建模技术领域,公开了一种基于三维高斯的三维场景生成与编辑方法。其中,三维场景生成方法包括:将用户指定的文本内容扩展为对应场景中所包含物体的指示文本和场景的详细描述;通过基于三维高斯的三维物体生成方法生成各指示文本对应的物体的三维高斯模型;完成整个场景的初始化;对场景三维高斯模型进行中期迭代优化;通过得到的一组相机位姿将中期迭代优化后的场景三维高斯模型渲染一组二维图像;使用伪真实图像对中期迭代优化后的场景三维高斯模型进行监督优化。通过多时间步采样对二维文生图扩散模型进行蒸馏,在优化中能够兼顾场景中的物体特征与空间特征,保证场景一致的优化。

    一种基于图表征学习的实体共性挖掘方法

    公开(公告)号:CN118396095A

    公开(公告)日:2024-07-26

    申请号:CN202410577102.3

    申请日:2024-05-10

    Abstract: 本发明涉及知识图谱数据挖掘技术领域,公开了一种基于图表征学习的实体共性挖掘方法;包括:对矛盾纠纷知识图谱的实体和关系进行提取,得到图结构数据;通过关系图卷积网络和深度神经网络组成的分类模型,对图结构数据中的节点所对应的实体进行分类训练;最后通过钩子技术对训练完成的数据进行处理,在分类模型计算过程中截获中间输出向量,作为知识图谱的实体共性向量;本发明采用了结合了关系图神经网络和深度神经网络的模型,以获取知识图谱实体的共性特征,能够实现对多源头、多元化矛盾纠纷数据的实体进行共性挖掘。

    一种基于无监督方式的小众领域英文关系抽取方法

    公开(公告)号:CN118377910A

    公开(公告)日:2024-07-23

    申请号:CN202410806214.1

    申请日:2024-06-21

    Abstract: 本发明公开了一种基于无监督方式的小众领域英文关系抽取方法,包括S1、获取小众领域的英文文本数据;S2、对所述英文文本数据进行预处理;S3、利用E2E模型进行指代消解;S4、通过T5模型从预处理后的英文文本数据中抽取不同种类的实体内容;S5、在依存句法分析的基础上,抽取英文文本数据中的关系三元组;S6、将抽取的关系三元组与步骤S4中提取的实体内容进行匹配;S7、根据用户提供的实体字典,对匹配的关系三元组进行过滤;S8、对获取的关系三元组进行规则过滤;S9、对过滤后的关系三元组进行无监督聚类分析;S10、形成最终的关系抽取结果。本发明采用无监督学习方法,避免了对大量标注数据的依赖,减少了人工标注的高昂费用。

Patent Agency Ranking