-
公开(公告)号:CN117744661A
公开(公告)日:2024-03-22
申请号:CN202410193318.X
申请日:2024-02-21
Applicant: 中国铁道科学研究院集团有限公司电子计算技术研究所 , 中国铁道科学研究院集团有限公司 , 北京经纬信息技术有限公司
Inventor: 张轩铭 , 王伟萌 , 朱韦桥 , 刘承亮 , 张向阳 , 樊春雷 , 惠伟 , 马龙 , 刘帅龙 , 孙晶 , 麻磊 , 李健 , 蒲照欣 , 王喆 , 解辰辉 , 蔡宇晶 , 刘辰
IPC: G06F40/295 , G06F40/284 , G06F18/214 , G06F16/35
Abstract: 本申请实施例公开了一种基于提示词工程的文本生成模型训练方法和文本生成方法,涉及大语言模型技术领域,包括:获取文本数据集;确定文本数据集中每个文本数据的公文种类;针对每一种类型的文本数据,按照对应的标注维度进行标注;构建第一模型,包括多种语言模型和特定任务层;使用标注好的文本数据对第一模型进行训练;评估每种语言模型的输出结果,选择每种类型的文本数据对应的语言模型,得到训练好的文本生成模型。通过选择具有明显各类公文特征的数据,并根据公文类型,对特定的内容特点、类型标志、涵盖要素等能够区分公文类型的特征进行标注,使模型能够学习电子公文领域的特定语言风格、词汇、句式和模板,以输出精确严谨的公文文本。
-
公开(公告)号:CN118094019B
公开(公告)日:2024-08-27
申请号:CN202410524940.4
申请日:2024-04-29
Applicant: 中国铁道科学研究院集团有限公司电子计算技术研究所 , 中国铁道科学研究院集团有限公司 , 北京经纬信息技术有限公司
Inventor: 王伟萌 , 朱韦桥 , 张轩铭 , 刘承亮 , 张向阳 , 麻磊 , 孙晶 , 惠伟 , 贾晓非 , 樊春雷 , 马龙 , 刘帅龙 , 刘辰 , 春意 , 解辰辉 , 郝伟俊 , 阎胜勇 , 曲左阳 , 杨扬 , 蔡宇晶 , 蒲照欣
IPC: G06F16/9535 , G06F18/22 , G06F18/2431
Abstract: 本申请实施例涉及大模型技术领域,尤其涉及一种文本关联内容推荐方法、装置及电子设备。所述方法包括:获取待推荐公文文本;将所述待推荐公文文本输入至预训练生成式大模型,得到与所述待推荐公文文本相关的关键词;对所述关键词进行加权排序;根据所述关键词检索数据库,得到相关公文文本;将所述相关公文文本输入至摘要生成模型,得到多段摘要信息;根据所述关键词的加权排序对所述多段摘要信息进行排序并输出。通过增加关键词权重信息,为生成的摘要信息的文本重要性以及相关性等综合排序,实现用户可能最关心的摘要信息展现在最重要的位置,且仅展示某些关键信息,其他冗余或不相关的信息则被过滤掉。
-
公开(公告)号:CN117744633A
公开(公告)日:2024-03-22
申请号:CN202410193183.7
申请日:2024-02-21
Applicant: 中国铁道科学研究院集团有限公司电子计算技术研究所 , 中国铁道科学研究院集团有限公司 , 北京经纬信息技术有限公司
Inventor: 朱韦桥 , 刘承亮 , 张轩铭 , 王伟萌 , 张向阳 , 马龙 , 樊春雷 , 刘帅龙 , 李健 , 刘辰 , 麻磊 , 惠伟 , 孙晶 , 解辰辉 , 曲左阳 , 杨扬 , 王喆 , 常灿 , 蔡宇晶 , 蒲照欣
IPC: G06F40/232 , G06F40/226 , G06F18/214 , G06N3/0455 , G06N3/08
Abstract: 本申请实施例涉及大模型技术领域,具体公开了一种文本纠错方法、装置及电子设备,方法包括:获取预训练大模型;获取公文数据集;根据标点符号对公文数据集进行切分;使用切分后的公文数据集基于低秩适配器方法LoRA对预训练大模型进行微调,得到文本纠错模型;将待纠错文本输入文本纠错模型,得到纠错后的文本;将纠错后的文本与待纠错文本比较,得到纠错位置和错误文本;对纠错后的文本进行校正,输出目标文本。通过LoRA能够减少内存占用,简化计算需求,加速了大模型的训练和微调过程,同时对硬件要求较低。基于生成式大模型能够根据上下文信息进行纠错,处理语法、语义等多种类型的错误,全面地考虑句子的结构和含义,更好地纠正不同层次的错误。
-
公开(公告)号:CN119364360A
公开(公告)日:2025-01-24
申请号:CN202411896024.X
申请日:2024-12-23
Applicant: 中国铁道科学研究院集团有限公司电子计算技术研究所 , 中国铁道科学研究院集团有限公司 , 北京经纬信息技术有限公司
Inventor: 王伟萌 , 朱韦桥 , 刘承亮 , 春意 , 曲左阳 , 解辰辉 , 惠伟 , 麻磊 , 孙晶 , 王喆 , 张向阳 , 姚剑 , 郝明哲 , 常灿 , 郝伟俊 , 杨扬 , 支宇 , 樊春雷 , 范立
IPC: H04W12/065 , H04W12/069 , H04W12/033 , H04W12/106 , H04W12/40 , H04W4/42
Abstract: 本发明涉及一种铁路机辆作业智能移动终端安全防护系统,包括:安全芯片,集成于智能移动终端内部,用于执行智能移动终端内外部的数据加密、解密及防篡改检测,安全芯片采用国家密码标准算法进行数据加密和解密操作;数据加密模块,用于通过安全芯片对智能移动终端传输过程中的所有数据进行加密处理;身份认证模块,用于将智能移动终端在与外部设备或系统通信前对通信双方进行双向身份认证;防拆检测模块,连接在安全芯片与智能移动终端之间,且用于当智能移动终端检测到物理篡改时,安全芯片自动触发保护机制,清除所有敏感数据并锁定设备。该系统基于国密安全芯片的安全防护能力,全面提升智能移动终端的安全性能,保障数据和通信的安全。
-
公开(公告)号:CN117744633B
公开(公告)日:2024-08-27
申请号:CN202410193183.7
申请日:2024-02-21
Applicant: 中国铁道科学研究院集团有限公司电子计算技术研究所 , 中国铁道科学研究院集团有限公司 , 北京经纬信息技术有限公司
Inventor: 朱韦桥 , 刘承亮 , 张轩铭 , 王伟萌 , 张向阳 , 马龙 , 樊春雷 , 刘帅龙 , 李健 , 刘辰 , 麻磊 , 惠伟 , 孙晶 , 解辰辉 , 曲左阳 , 杨扬 , 王喆 , 常灿 , 蔡宇晶 , 蒲照欣
IPC: G06F40/232 , G06F40/226 , G06F18/214 , G06N3/0455 , G06N3/08
Abstract: 本申请实施例涉及大模型技术领域,具体公开了一种文本纠错方法、装置及电子设备,方法包括:获取预训练大模型;获取公文数据集;根据标点符号对公文数据集进行切分;使用切分后的公文数据集基于低秩适配器方法LoRA对预训练大模型进行微调,得到文本纠错模型;将待纠错文本输入文本纠错模型,得到纠错后的文本;将纠错后的文本与待纠错文本比较,得到纠错位置和错误文本;对纠错后的文本进行校正,输出目标文本。通过LoRA能够减少内存占用,简化计算需求,加速了大模型的训练和微调过程,同时对硬件要求较低。基于生成式大模型能够根据上下文信息进行纠错,处理语法、语义等多种类型的错误,全面地考虑句子的结构和含义,更好地纠正不同层次的错误。
-
公开(公告)号:CN117744661B
公开(公告)日:2024-05-17
申请号:CN202410193318.X
申请日:2024-02-21
Applicant: 中国铁道科学研究院集团有限公司电子计算技术研究所 , 中国铁道科学研究院集团有限公司 , 北京经纬信息技术有限公司
Inventor: 张轩铭 , 王伟萌 , 朱韦桥 , 刘承亮 , 张向阳 , 樊春雷 , 惠伟 , 马龙 , 刘帅龙 , 孙晶 , 麻磊 , 李健 , 蒲照欣 , 王喆 , 解辰辉 , 蔡宇晶 , 刘辰
IPC: G06F40/295 , G06F40/284 , G06F18/214 , G06F16/35
Abstract: 本申请实施例公开了一种基于提示词工程的文本生成模型训练方法和文本生成方法,涉及大语言模型技术领域,包括:获取文本数据集;确定文本数据集中每个文本数据的公文种类;针对每一种类型的文本数据,按照对应的标注维度进行标注;构建第一模型,包括多种语言模型和特定任务层;使用标注好的文本数据对第一模型进行训练;评估每种语言模型的输出结果,选择每种类型的文本数据对应的语言模型,得到训练好的文本生成模型。通过选择具有明显各类公文特征的数据,并根据公文类型,对特定的内容特点、类型标志、涵盖要素等能够区分公文类型的特征进行标注,使模型能够学习电子公文领域的特定语言风格、词汇、句式和模板,以输出精确严谨的公文文本。
-
公开(公告)号:CN119357271A
公开(公告)日:2025-01-24
申请号:CN202411895962.8
申请日:2024-12-23
Applicant: 中国铁道科学研究院集团有限公司电子计算技术研究所 , 中国铁道科学研究院集团有限公司 , 北京经纬信息技术有限公司
Inventor: 王伟萌 , 刘承亮 , 朱韦桥 , 张向阳 , 张轩铭 , 麻磊 , 惠伟 , 孙晶 , 解辰辉 , 王喆 , 贾晓非 , 春意 , 郝伟俊 , 姚剑 , 常灿 , 杨扬 , 支宇
IPC: G06F16/25 , G06F16/2458 , G06F16/27
Abstract: 本发明公开了一种基于数据转换技术的铁路办公系统异构数据库集成方法,涉及数据集成技术领域,该方法通过统一设计路线数据标准模型,结合AI智能映射算法,实现铁路办公系统中异构数据库的无缝集成;方案采用分布式架构并行处理数据转换任务,动态监控节点负载、转换速度和并行加速比,确保高负载场景下的系统稳定性;通用适配层支持多协议、多接口的集成,有效提升整体性能;同时,方案引入多层次安全机制与一致性校验,结合动态加密、权限管理和数据冗余备份,保障数据流转的完整性与安全性,解决了数据整合复杂、兼容性差及性能瓶颈问题。
-
公开(公告)号:CN119135375A
公开(公告)日:2024-12-13
申请号:CN202411093216.7
申请日:2024-08-09
Applicant: 中国铁道科学研究院集团有限公司 , 中国铁道科学研究院集团有限公司电子计算技术研究所 , 北京经纬信息技术有限公司
IPC: H04L9/40
Abstract: 本发明提供一种基于软件定义边界的数据访问方法及装置,将软件定义边界控制器与微服务网关进行结合,且独立在网关外部运行的方式,能够通过无限扩展的方式实现持续演进的安全防护,为微服务架构下的系统提供了更多的安全支持。通过建立黑白名单核查、设备认证、用户身份认证和用户权限认证,多层次确保只有合法设备和用户能够访问资源。在核查通过后对访问请求进行限流控制,防止因过多请求导致的网络拥塞和资源滥用。利用对比引擎对访问特征数据和行为特征数据进行比对,及时检测和阻止潜在的攻击行为和风险操作。通过预训练的风险评估模型计算访问请求的风险等级,高风险访问流被拦截并记录,有效控制潜在威胁。
-
公开(公告)号:CN118094019A
公开(公告)日:2024-05-28
申请号:CN202410524940.4
申请日:2024-04-29
Applicant: 中国铁道科学研究院集团有限公司电子计算技术研究所 , 中国铁道科学研究院集团有限公司 , 北京经纬信息技术有限公司
Inventor: 王伟萌 , 朱韦桥 , 张轩铭 , 刘承亮 , 张向阳 , 麻磊 , 孙晶 , 惠伟 , 贾晓非 , 樊春雷 , 马龙 , 刘帅龙 , 刘辰 , 春意 , 解辰辉 , 郝伟俊 , 阎胜勇 , 曲左阳 , 杨扬 , 蔡宇晶 , 蒲照欣
IPC: G06F16/9535 , G06F18/22 , G06F18/2431
Abstract: 本申请实施例涉及大模型技术领域,尤其涉及一种文本关联内容推荐方法、装置及电子设备。所述方法包括:获取待推荐公文文本;将所述待推荐公文文本输入至预训练生成式大模型,得到与所述待推荐公文文本相关的关键词;对所述关键词进行加权排序;根据所述关键词检索数据库,得到相关公文文本;将所述相关公文文本输入至摘要生成模型,得到多段摘要信息;根据所述关键词的加权排序对所述多段摘要信息进行排序并输出。通过增加关键词权重信息,为生成的摘要信息的文本重要性以及相关性等综合排序,实现用户可能最关心的摘要信息展现在最重要的位置,且仅展示某些关键信息,其他冗余或不相关的信息则被过滤掉。
-
公开(公告)号:CN117786013A
公开(公告)日:2024-03-29
申请号:CN202410041274.9
申请日:2024-01-11
Applicant: 中国铁道科学研究院集团有限公司电子计算技术研究所 , 中国铁道科学研究院集团有限公司 , 北京经纬信息技术有限公司
Inventor: 王伟萌 , 刘承亮 , 朱韦桥 , 张轩铭 , 张向阳 , 曲左阳 , 樊春雷 , 马龙 , 刘帅龙 , 李健 , 刘辰 , 惠伟 , 孙晶 , 麻磊 , 解辰辉 , 王喆 , 杨扬 , 蔡宇晶 , 蒲照欣
IPC: G06F16/27 , G06F16/242 , G06F16/2452 , G06F16/25 , G06F16/28
Abstract: 本申请实施例公开了一种异构数据库的数据同步方法、装置及设备,涉及数据库技术领域,具体包括:接收用户输入的数据库语句,所述数据库语句符合源数据库的语法结构;对所述数据库语句进行翻译和逻辑转换,得到转换后的数据库语句,所述转换后的数据库语句符合目标数据库的语法结构;将所述转换后的数据库语句写入目标数据库;将所述数据库语句写入源数据库。通过处理引擎将用户输入的数据库语句从源数据库的语法结构转换为目标数据库能够识别的语法结构,并分别将对应的语句双写至两个数据库中,实现两端数据一致。通过异步写入的方式减少对数据库系统性能的影响,提供更好的数据一致性和性能。
-
-
-
-
-
-
-
-
-