文本生成方法、装置、主机设备、系统、程序产品和介质

    公开(公告)号:CN119005135A

    公开(公告)日:2024-11-22

    申请号:CN202411481072.2

    申请日:2024-10-23

    Inventor: 申冲 王超 吴韶华

    Abstract: 本发明提供一种文本生成方法、装置、主机设备、系统、程序产品和介质,涉及人工智能领域,方法包括:获取输入文本;输入文本包括内容概述文本和词语参考文本,词语参考文本包含指定词语;利用预训练语言模型根据输入文本执行文本生成操作,得到与生成式文本中的单词对应的逻辑矩阵;预训练语言模型具有包含候选单词的词表,逻辑矩阵用于确定候选单词的选择概率,选择概率为候选单词被选为生成式文本中的单词的概率;利用预训练概率转移模型中的神经网络层对逻辑矩阵进行处理,以增大候选单词中的指定候选单词的选择概率,得到已调整逻辑矩阵;指定词语由至少一个指定候选单词组成;利用已调整逻辑矩阵确定生成式文本;可优化文本生成效果。

    一种基于检索增强生成的检索方法、产品、设备及介质

    公开(公告)号:CN119003795A

    公开(公告)日:2024-11-22

    申请号:CN202411481538.9

    申请日:2024-10-23

    Abstract: 本发明公开了一种基于检索增强生成的检索方法、产品、设备及介质,涉及自然语言处理技术领域。方案具体通过识别初始查询信息中的实体,能够帮助系统捕获用户查询中的关键信息和语义结构,从而提升查询理解的准确率;基于知识图谱对初始查询信息中的实体进行扩展,能够补充隐含的背景信息,使系统更好地处理不完整或模糊的查询;并且知识图谱的引入使系统能够利用领域特定的结构化知识,更好地理解和处理专业领域的查询;同时,知识图谱可以便捷地扩展或替换为不同领域的专业知识库,提高了系统的适应性。在语义匹配过程中,将关键词匹配与语义匹配相结合,多层语义匹配能够更全面地理解用户查询意图和待检索的文本块内容,显著地提升了检索精度。

    一种数据传输方法、计算机程序产品、设备及计算机介质

    公开(公告)号:CN118467455A

    公开(公告)日:2024-08-09

    申请号:CN202410620044.8

    申请日:2024-05-17

    Abstract: 本发明公开了一种数据传输方法、计算机程序产品、设备及计算机介质,涉及分布式训练技术领域,应用于分布式训练中的数据发送端,确定数据发送端在分布式训练中所需传输的目标数据;获取存储的映射信息,映射信息用于存储数据及对应的接收端间的映射关系;确定目标数据的目标信息;根据目标信息在映射信息中进行查找,得到在分布式训练中接收目标数据的数据接收端;对目标数据进行序列化编码,得到目标编码数据;通过远程直接数据存取的写操作,并行将目标编码数据传输至数据接收端的存储区。解除了数据发送端与数据接收端的异构现象对数据传输的限制,降低了网络传输的延迟,减少了CPU性能开销,提高了分布式训练中的数据传输效率。

    一种预训练模型文件管理方法、程序产品、装置及介质

    公开(公告)号:CN118427159A

    公开(公告)日:2024-08-02

    申请号:CN202410889279.7

    申请日:2024-07-04

    Inventor: 张磊 王超 吴韶华

    Abstract: 本发明公开一种预训练模型文件管理方法、程序产品、装置及介质,涉及文件管理技术领域,用于实现模型文件管理,针对传统方案不支持文件断点续传的问题,提供了一种预训练模型文件管理方法,通过将文件分片传输,并在本地实时记录上传进度,当出现异常后重新上传文件时,可从断点数据块处重新进行上传,无需从头上传,可以有效地解决大模型文件的断点续传问题,避免大文件无法从中断处继续下载而严重影响效率和数据处理能力。并且,本方案实现的断点续传功能可直接部署在上传文件的客户端本地,通过额外设置的数据库文件即可实现,无需额外部署下载工具,也无需考虑到下载工具与管理系统之间的适配等问题,更易实施。

    一种多进程同时操作相同文件的安全性方法

    公开(公告)号:CN104021355B

    公开(公告)日:2017-03-29

    申请号:CN201410278171.0

    申请日:2014-06-20

    Inventor: 王超 赵孝军

    Abstract: 本发明提供一种多进程同时操作相同文件的安全性方法,其具体实现过程为:在文件内核与应用程序之间加入一个文件安全模块,该文件安全模块通过钩子截获用户的每次操作,再根据文件操作主体及操作读写标志相应的操作,其具体操作过程为:用户添加关联程序;关联程序读取文件;关联程序读写文件;任务列表维护。该一种多进程同时操作相同文件的安全性方法和现有技术相比,实现多进程自动完整性检查并在出现错误时报警用户,实用性强,适用范围广泛,易于推广。

    一种在linux下自动配置multipth的方法

    公开(公告)号:CN106339225A

    公开(公告)日:2017-01-18

    申请号:CN201610722756.6

    申请日:2016-08-25

    Inventor: 曲洪磊 王超

    CPC classification number: G06F8/31

    Abstract: 本发明提供一种在linux下自动配置multipth的方法,属于系统测试领域,本方法使用linux下的shell脚本,完成对fc host的wwwn的读取,系统下所有存储设备的分区隔离以及相应scsi number的提取,通过交互的方式确认灵活参数配置,最终生成一份multipath的配置文件,并根据这份配置文件自动部署环境。使用本方法,无需用户有太多的技术支持或者经验即可完成环境搭建,节省了大量的人力以及高人才成本。

    一种监控CPU核心频率的方法及装置

    公开(公告)号:CN106155866A

    公开(公告)日:2016-11-23

    申请号:CN201610625871.1

    申请日:2016-08-01

    Inventor: 曲洪磊 王超

    CPC classification number: G06F11/3024 G06F11/3058

    Abstract: 本发明提供了一种监控CPU核心频率的方法及装置,该方法包括:获取至少一个CPU的第一物理地址,其中每一个所述CPU包括至少一个核心;针对于每一个所述CPU,根据该CPU的第一物理地址,获取该CPU包括的各个核心的第二物理地址;每经过一个预设的间隔时间,根据各个所述核心的第二物理地址,分别获取每一个所述核心的频率;根据各个所述核心的频率,形成对应于每一个所述核心的频率状态表,并将所述频率状态表输出。该装置包括:第一获取单元、第二获取单元、频率监控单元及表格形成单元。本方案能够提高对服务器性能进行评价的准确性。

    一种自动化开关机测试方法

    公开(公告)号:CN104375910A

    公开(公告)日:2015-02-25

    申请号:CN201410679397.1

    申请日:2014-11-24

    Inventor: 王超

    Abstract: 本发明公开了一种自动化开关机测试方法,其具体实现过程为:将BMC下的自动开关机脚本上传,操作系统下的测试脚本上传;自动开关机脚本运行,服务器开机;操作系统的测试脚本运行,无错误发生时,服务器关机,有错误时,停止测试,保留测试环境,生成相应日志;自动开关机脚本将服务器自动关机,有错误时,停止测试,保留测试环境,生成相应日志,完成测试。该一种自动化开关机测试方法与现有技术相比,可以减小人力的投入,更能确保测试结果的准确性,同时加入日志收集功能,使问题的分析和定位变得更加便捷。

    一种结合多路决策树和哈希表进行网络包快速分类的方法

    公开(公告)号:CN103746919A

    公开(公告)日:2014-04-23

    申请号:CN201410015602.4

    申请日:2014-01-14

    Abstract: 本发明涉及网络包分类技术领域,特别涉及一种结合多路决策树和哈希表进行网络包快速分类的方法。本发明的一种结合多路决策树和哈希表进行网络包快速分类的方法,网络数据包采用Splay多路决策树和哈希表结合的方法快速定位规则,网络包分类方法首先对数据包作协议判断,对TCP、UDP和ICMP等协议分别建立哈希表,哈希表根据IP协议的地址和端口计算,再找到相应的哈希表值后,遍历对应的Splay伸展树节点,查找符合的规则,Splay伸展树具有最近访问的节点为Root节点的特点,故能较多的提高包分类的速度。

    一种混合专家模型路由网络优化方法、产品、装置及介质

    公开(公告)号:CN118410851B

    公开(公告)日:2024-10-15

    申请号:CN202410882266.7

    申请日:2024-07-03

    Abstract: 本发明公开一种混合专家模型路由网络优化方法、产品、装置及介质,涉及语言模型训练技术领域,针对混合专家模型在实际应用中的负载不均衡问题,提供一种混合专家模型路由网络优化方法。本方案可以保证各专家网络具有最基础的语言理解能力,并将数据集进行分解,根据数据特征动态选择激活的专家网络,从而针对性的选取部分样本数据对特定专家模型进行迭代训练,从根本上解决由于负载不均衡导致某些专家网络无法得到有效训练的问题,以增加训练过程的灵活性,提升模型整体的训练性能,可以更好地应用于下游任务。

Patent Agency Ranking