-
公开(公告)号:CN119416776A
公开(公告)日:2025-02-11
申请号:CN202411417954.2
申请日:2024-10-11
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 燕溪智能(无锡)技术有限公司
IPC: G06F40/258 , G06F40/30 , G06F40/166 , G06F16/31
Abstract: 本发明属于自然语言处理技术领域,公开了一种面向知识检索的政务文档增强生成方法、电子设备和介质,面向知识检索的政务文档增强生成方法包括:识别出政务文档的标题;将文本按标题进行切分,得到多个语义完整的文本块;对语义完整的文本块进行语义切分,得到多个中粒度文本块,中粒度文本块为符合预设长度的文本块;根据多个中粒度文本块建立索引。本发明通过识别出标题,以标题结构切分文本,能够有效地将文本按照篇章结构进行第一层级的语义切分,保证了内部的语义关联性和完整性,提高了检索的准确性。
-
公开(公告)号:CN119416878A
公开(公告)日:2025-02-11
申请号:CN202411417952.3
申请日:2024-10-11
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 燕溪智能(无锡)技术有限公司
Abstract: 本发明属于计算机自然语言技术领域,公开了一种面向政务领域大语言模型的训练数据筛选法、电子设备和存储介质,面向政务领域大语言模型的训练数据筛选法包括:获取基于政务领域的原始数据集;基于原始数据集训练得到打分模型;调用打分模型对原始数据集进行质量评估,得到质量数据集;根据质量数据集得到种子数据集;根据种子数据集得到训练数据集。本发明基于原始数据集训练打分模型,使得打分模型对大语音模型有更好的适应性,通过打分模型用于评估指令的质量,使得筛选出的训练数据更为精准。
-
公开(公告)号:CN119762062A
公开(公告)日:2025-04-04
申请号:CN202411831545.7
申请日:2024-12-12
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 博雅正链(北京)科技有限公司 , 北京国信云服科技有限公司
Abstract: 本发明公开了一种支持细粒度监管的数据跨域交易系统,包括跨链信息校验模块、监管模块、交易验证模块、跨链支付模块和跨域信息传递模块,本发明涉及区块链技术领域。该支持细粒度监管的数据跨域交易系统,通过基于中继链技术作为跨域数据交易的可信中介,可以保证跨域数据交易的去中心化、可用性、防篡改性,本发明首先通过中继链传递用户的身份信息,并在交易模块中嵌入基于身份属性信息的监管机制,可以保证数据跨域交易的细粒度可监管性,本发明的设计了交易回滚机制,当数据交易出现异常时,例如违反监管规则、资金不足等问题时,可以安全地保证资金安全和数据安全。
-
公开(公告)号:CN119760790A
公开(公告)日:2025-04-04
申请号:CN202411821511.X
申请日:2024-12-11
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 博雅正链(北京)科技有限公司 , 北京国信云服科技有限公司 , 博雅信安科技(北京)有限公司
Abstract: 本发明公开了基于区块链和知识图谱的多源异构安全情报数据融合系统,包括情报数据采集清洗模块、情报数据安全分享模块、情报知识图谱构建模块和情报数据融合展示模块,本发明涉及信息数据处理技术领域。该基于区块链和知识图谱的多源异构安全情报数据融合系统,现有技术中,情报数据通常分散在多个孤立的系统中,难以进行跨机构共享。本发明利用区块链技术的去中心化和分布式账本特性,构建了一个统一的情报数据共享平台。通过区块链,多个机构之间可以安全、可靠地共享情报数据,打破了数据孤岛,提高了数据的可访问性和流通性,本发明通过将情报数据存储在区块链上,利用区块链的不可篡改性,确保了数据的完整性。
-
公开(公告)号:CN119696757A
公开(公告)日:2025-03-25
申请号:CN202411831548.0
申请日:2024-12-12
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 北京国信云服科技有限公司
IPC: H04L9/00 , H04L9/32 , H04L67/104 , H04L67/1023
Abstract: 本发明公开了一种去中心化身份跨域解析协议,本发明涉及区块链技术领域。包括以下步骤:步骤一、数据准备阶段;步骤二、跨域请求及响应阶段以及步骤三、解析结果验证阶段。该一种去中心化身份跨域解析协议,通过边缘节点和区块链的结合,确保跨域解析过程中数据的一致性、正确性和实时性,通过边缘节点定期同步外域区块链的根哈希,并将其写入本域区块链,确保域内用户可以验证域外DID标识符的解析结果,保证了跨域解析结果的可信度和不可抵赖性,设计了基于TTL和LRU的缓存结构,结合区块链根哈希和本地缓存数据进行动态更新,以提高解析效率,减少跨域请求的频率,并确保缓存数据的实时性和准确性。
-
-
-
-