一种领域适应医学文献神经机器翻译模型的训练方法

    公开(公告)号:CN112989848B

    公开(公告)日:2022-12-16

    申请号:CN202110332815.X

    申请日:2021-03-29

    Abstract: 本发明公开了一种领域适应医学文献神经机器翻译模型的训练方法,包括:1)对域内外数据集进行数据预处理;2)基于域外子词化训练集进行域外子词化神经机器翻译模型进行动态递减训练集训练;3)使用改进的数据选择法,从域外数据集中挑选出与域内平行数据集相似的数据集来增强域内数据集;4)基于高质量的人工纠错的子词化医学数据集,训练小型的分类器或语言模型,获得域内子词化训练集句子对的训练权重,将权重作为训练参数加入到继续训练过程中;5)结合上一步骤处理得到的域内子词化训练集和训练权重文件,基于已训练域外子词化神经机器翻译模型,在域内子词化训练集上继续训练。本发明可节省总体训练时间,提高最终翻译训练效果。

    一种利用多视角信息的自动回答文本生成方法

    公开(公告)号:CN114692649A

    公开(公告)日:2022-07-01

    申请号:CN202210286420.5

    申请日:2022-03-23

    Abstract: 本发明公开了一种利用多视角信息的自动回答文本生成方法,包括:获取基础数据;对数据进行预处理和搭建多视角自动回答生成模型;利用预处理好的数据对多视角自动回答生成模型进行训练,得到一个生成结果最优的模型;在用户提问题后,收集相关的信息,利用训练好的多视角自动回答生成模型生成结果,并将结果反馈给用户。本发明通过训练好一个能理解多方面视角信息,并将这些信息融合生成自然流畅准确回答的模型,当用户提出问题时,用该模型自动生成文本,回答用户的问题,提高用户对目标的认知。本发明方法在问答社区、医疗问答、客服自动回答等场景中具有广泛的使用空间。

    一种基于图像特征增强数字体图像相关法的变形测量方法

    公开(公告)号:CN114526682A

    公开(公告)日:2022-05-24

    申请号:CN202210034810.3

    申请日:2022-01-13

    Abstract: 本发明公开了一种基于图像特征增强数字体图像相关法的变形测量方法,首先,构造尺度间空并对其中的每个像素点进行检测、筛选,得到最终可用关键点;计算主方向及二进制描述符进而匹配得到关键点对;使用IC‑GN算法迭代式计算高精度变形结果。本发明基于图像特征增强数字体图像相关法,可以在不破坏试样的情况下进行非接触式测量,更加方便在测量试样内部的三维位移情况,针对图像的旋转、尺度以及亮度变化可以保持不变,从全局进行匹配,有效地进行解决了大而复杂的变形,同时也能应对小变形情况。

    基于深度学习的时序点云数据增强方法

    公开(公告)号:CN114373108A

    公开(公告)日:2022-04-19

    申请号:CN202111666209.8

    申请日:2021-12-31

    Abstract: 本发明公开了一种基于深度学习的时序点云数据增强方法,包括:1)按采集的时间顺序对点云进行排序;2)抽取k个点云作为原始样本,并指定网络的总共迭代次数为T,网络包含增强器和分类器;3)将原始样本输入到增强器中进行数据增强,得到增强样本;4)将原始样本与增强样本输入到分类器中,利用分类器的分类结果得到分类损失值与增强损失值;5)利用分类损失值与增强损失值,采用反向传播算法更新增强器与分类器的参数,若网络的迭代次数t小于网络的总共迭代次数T,则跳转至步骤2),否则终止训练,得到最终的分类器参数。本发明为使用时序点云作为输入样本的深度学习模型提供一种数据增强方法,缓解深度学习模型的过拟合情况,协助对点云进行分类的任务。

    一种基于改进Mask R-CNN的车辆智能定损方法

    公开(公告)号:CN114219757A

    公开(公告)日:2022-03-22

    申请号:CN202111311347.4

    申请日:2021-11-08

    Abstract: 本发明公开了一种基于改进Mask R‑CNN的车辆智能定损方法,包括:S1、对车辆损伤图片进行损伤类型标注和零部件标注后,制作成coco格式的标注数据集,并划分有训练集和测试集;S2、构建多检测模型,为改进的Mask R‑CNN;其中改进包括将特征提取网络部分的3*3卷积更换为DCNv2、将插值上采样方法更换为CARAFE采样方法、在RPN网络后面增加一个零部件分类的分支及将检测头部中用于边框回归的全连接头部更换为卷积头部;S3、将训练集送入多检测模型训练,得到权重文件;S4、基于权重文件对损伤车辆图片进行检测,得到最终的定损图片。本发明在使用一个模型的基础上可以同步输出损伤类型和零部件类型,十分高效和简洁,且通过改进提升模型的准确率和召回率。

    一种基于GPU并行加速的实时三维变形测量方法

    公开(公告)号:CN113052825A

    公开(公告)日:2021-06-29

    申请号:CN202110333748.3

    申请日:2021-03-29

    Abstract: 本发明公开了一种基于GPU并行加速的实时三维变形测量方法,包括以下步骤:1)通过立体标定获得投影矩阵;2)拍摄物体变形前后的图像;3)选择兴趣区域和兴趣点;4)传输投影矩阵、图像和兴趣点到GPU;5)计算兴趣点变形前的三维坐标;6)计算兴趣点在变形中各个时刻的三维变形;7)将三维变形数据传输回CPU。该方法通过将变形前左相机图像作为所有匹配中的参考图像,从而兴趣点对应的Hessian矩阵等IC‑GN预计算的数据得以复用;基于CUDA异构计算平台开发的GPU加速变形测量程序可以发挥GPU硬件设备的计算性能,针对GPU程序的访存等优化技术使得三维变形测量的计算速度大大提高,满足了实时三维变形测量的需求。

    一种基因测序数据质量分数的并行压缩方法

    公开(公告)号:CN110349635B

    公开(公告)日:2021-06-11

    申请号:CN201910499892.7

    申请日:2019-06-11

    Abstract: 本发明公开了一种基因测序数据质量分数的并行压缩方法,包括步骤:1)对FASTQ格式文件数据进行划分,获得质量分数部分的数据;2)以行为单位,计算每一行质量分数的得分,并根据得分对这一行数据进行分类;3)当一个分类中质量分数数量达到阈值,或者这个分类无更多的质量分数加入时,将这个分类中的质量分数作为一个数据块放入计算缓冲队列中,并清空这个分类中的数据;4)由一个空闲的计算单元取走计算缓冲队列中的一个数据块,进行变换,使用向量化优化的ZPAQ进行编码,完成后放入输出缓冲队列中;5)由输出处理单元处理的压缩数据输出,直到完成所有压缩数据的输出,然后加入维护信息。本发明的技术方案具有性能高、扩展性强的特点。

    一种基因变异数据分布式存储方法及系统

    公开(公告)号:CN108563923B

    公开(公告)日:2020-08-18

    申请号:CN201711267170.6

    申请日:2017-12-05

    Abstract: 本发明公开了一种基因变异数据分布式存储方法及系统,该方法包括分布式数据存储过程、分布式位图索引创建过程和分布式查询检索过程;该系统包括分布式列式存储模块、分布式位图索引模块和查询检索模块。本发明通过采用新的列式存储引擎kudu进行数据分布式存储,并针对各样本列建立分布式局部位图索引,有效解决现有的HDFS方案随机数据访问性能低的问题;解决HBase方案批量分析性能不佳的问题;简化存储架构模型;解决基因型查询工具对多个工具依赖的限制问题;同时本发明通过分布式的局部位图索引方案,实现了高并发,并提高了可拓展性。

    一种多领域非协作分布式检索结果融合系统及其融合方法

    公开(公告)号:CN106897736B

    公开(公告)日:2020-05-22

    申请号:CN201710041178.4

    申请日:2017-01-17

    Abstract: 本发明公开了一种多领域非协作分布式检索结果融合系统及其融合方法,该系统包括:数据处理模块,用于存储系统所需的语料数据和缓存数据,对外提供接口与其他模块交互;特征提取模块,用于从训练语料或者检索结果中提取多领域特征;模型训练模块,用于训练模型,包括模型初始化和模型学习;中央处理模块,负责分布式检索结果融合的流程处理,与其他模块进行交互,是系统核心逻辑的执行部分;相关性评分模块,用于对查询结果进行全局的相关性评分。本发明能解决非协作环境下不同检索结果因检索模型差异而无法直接比较的问题及启发式方法调参麻烦的问题。

    一种结合负载均衡的工作流回填方法

    公开(公告)号:CN106874112B

    公开(公告)日:2020-04-28

    申请号:CN201710034431.3

    申请日:2017-01-17

    Abstract: 本发明公开了一种结合负载均衡的工作流回填方法,首先,依据计算任务特性,对任务进行划分,可分为CPU资源消耗型或者IO资源消耗型;然后对回填策略进行改进,使回填调度策略以工作流为单位;最后是回填任务的投递,即回填策略在任务选择上的改进,回填的任务选择需要匹配主机负载和任务特性,负载高主机选择IO消耗型,负载低则选择CPU消耗型。本发明方法能够有效地调度任务流,减少任务流的执行时间,同时还能够实现高性能计算系统众多节点的负载均衡。

Patent Agency Ranking