一种基于深度协同哈希的图片标注方法

    公开(公告)号:CN108647295A

    公开(公告)日:2018-10-12

    申请号:CN201810429034.0

    申请日:2018-05-08

    Applicant: 南京大学

    Inventor: 李武军 崔雪

    Abstract: 本发明公开了一种基于深度协同哈希的图片标注方法,达到了图片和标签存储空间低且检索高效的效果。首先收集用户上传或者众包提供的有标注图片,利用图片和标注的对应关系构造相似性关系的二值矩阵。根据共享标注的个数定义图片的相似性。融合图片和标注间一致性信息与图片相似性信息作为监督目标,结合深度学习构造端到端的有互反馈的深度网络,离线训练图片和标注的离散二值编码。在线应用时,使用深度网络输出图片的二值编码,计算图片二值编码与标签二值编码的海明距离,根据海明距离从低到高对图片进行标注。

    一种基于大语言模型的医学影像报告辅助生成方法及装置

    公开(公告)号:CN119694475A

    公开(公告)日:2025-03-25

    申请号:CN202411113560.8

    申请日:2024-08-14

    Abstract: 一种基于大语言模型的医学影像报告辅助生成方法及装置,能够得到一个适用于影像报告辅助生成的医疗大语言模型,该模型根据患者的年龄、性别、检查项目以及诊断结果等信息辅助生成影像报告中的检查所见内容,有效提高了影像报告生成的效率,避免了不同医师书写报告不一致性的问题。方法包括:(1)构建医疗语料预训练数据集;(2)设计大语言模型架构;(3)对大语言模型进行预训练;(4)构建影像报告指令精调数据集;(5)对医疗大语言模型进行精调训练;(6)对精调好的医疗大语言模型进行部署;(7)运用部署好的医疗大语言模型进行推理。

    一种适用于异构集群的深度学习模型自动并行训练方法

    公开(公告)号:CN119440841A

    公开(公告)日:2025-02-14

    申请号:CN202411558728.6

    申请日:2024-11-04

    Applicant: 南京大学

    Abstract: 本发明公开一种适用于异构集群的深度学习模型自动并行训练方法,接受训练所需的异构集群与深度学习模型为输入;对于深度学习模型,获取其在训练系统上的执行性能信息;对于训练所需集群,获取集群的执行性能信息,并生成集群的最大同构节点集合与节点集合划分;随后遍历每种节点集合划分,对于其内部包含的所有节点集合,求解该节点集合的最大吞吐量;随后通过基于整数二次规划方法的负载均衡算法求解当前节点集合划分的最大吞吐量,从而求解出所有节点集合划分中的最优策略并输出。本发明支持在异构集群设置下求解给定深度学习模型的最优并行策略。可应用于由同构或异构设备组成的单机多卡、多机多卡等多种分布式训练环境。训练效率高,能耗少。

    基于稳定扩散模型将背部照片转换成脊柱X光影像的方法

    公开(公告)号:CN117689533B

    公开(公告)日:2024-12-27

    申请号:CN202311748637.4

    申请日:2023-12-19

    Abstract: 本发明公开了一种基于稳定扩散模型将背部照片转换成脊柱X光影像的方法,将背部照片输入到稳定扩散模型中,对背部照片和X光影像进行对齐处理,将X光影像输入到编码器中,使用UNet对纯噪声进行去噪,同时将使用全连接层提取背部照片的特征向量通过交叉注意力映射到UNet的中间层,最后用生成的X光影像自动计算Cobb角,预测脊柱侧凸的病情。本发明中数据仅需家用智能手机和相机拍摄的背部照片,无需使用X光设备,从而降低了就医成本和辐射风险;利用稳定扩散模型算法,生成与X光影像相似的图像,提高了图像的转换质量和准确性;可以实现对背部脊柱骨骼结构的检测,从而有助于评估和预防脊柱畸形等疾病。

    一种基于深度学习的促排卵结果预测方法和装置

    公开(公告)号:CN118173282A

    公开(公告)日:2024-06-11

    申请号:CN202410393522.6

    申请日:2024-04-02

    Abstract: 本发明公开了一种基于深度学习的促排卵结果预测方法和装置,在训练阶段:输入促排卵治疗数据集并选取批次数据,对时间戳进行时间向量化,基于变量间独立的注意力得到转化后数据,通过时序分块得到规范化时序块;基于时序块可分离卷积网络对时序块进行处理,将池化和展平后的结果通过预测层得到预测结果;使用均方误差计算损失,训练模型并判断训练是否结束。在部署阶段,加载训练好的模型,并基于变量间独立的时序块构建方法和时序块可分离卷积方法得到患者时序隐层表示,通过预测层得到促排卵预测结果。本发明能够有效利用治疗数据中不规则、多元和复杂的信息,改进了临床中对于促排卵治疗数据的处理方式,提升了取卵数目预测的准确水平。

    一种能提升数值处理能力的中文金融大语言模型构建方法

    公开(公告)号:CN118036747A

    公开(公告)日:2024-05-14

    申请号:CN202410177829.2

    申请日:2024-02-08

    Applicant: 南京大学

    Abstract: 本发明公开一种能提升数值处理能力的中文金融大语言模型构建方法,包括金融语料数据集构建阶段,基于低秩适配的增量预训练阶段,基于低秩适配的对数值敏感的选项微调阶段,低秩适配模块的混合与合并阶段,以及利用训练后的中文金融大语言模型进行推理阶段;提高了模型在中文金融问答任务上进行推理时的预测准确率,提高了在包含数值变量的问题上的准确率,也提高了在不包含数值变量的问题上的准确率。

    基于稳定扩散模型将背部照片转换成脊柱X光影像的方法

    公开(公告)号:CN117689533A

    公开(公告)日:2024-03-12

    申请号:CN202311748637.4

    申请日:2023-12-19

    Abstract: 本发明公开了一种基于稳定扩散模型将背部照片转换成脊柱X光影像的方法,将背部照片输入到稳定扩散模型中,对背部照片和X光影像进行对齐处理,将X光影像输入到编码器中,使用UNet对纯噪声进行去噪,同时将使用全连接层提取背部照片的特征向量通过交叉注意力映射到UNet的中间层,最后用生成的X光影像自动计算Cobb角,预测脊柱侧凸的病情。本发明中数据仅需家用智能手机和相机拍摄的背部照片,无需使用X光设备,从而降低了就医成本和辐射风险;利用稳定扩散模型算法,生成与X光影像相似的图像,提高了图像的转换质量和准确性;可以实现对背部脊柱骨骼结构的检测,从而有助于评估和预防脊柱畸形等疾病。

    一种基于深度学习的精子形态学分析方法

    公开(公告)号:CN117541612A

    公开(公告)日:2024-02-09

    申请号:CN202311596352.3

    申请日:2023-11-28

    Abstract: 本发明公开一种基于深度学习的精子形态学分析方法,属于计算机医疗图像处理领域,所述基于深度学习的精子形态学分析方法包括以下步骤:采集精液标本、制备形态学分析涂片、使用显微镜采集图像并依次进行精子形态学标注和精子头部空泡标注以构成数据集,对训练数据进行预处理,使用迁移学习和半监督学习结合的方式训练目标检测模型,以及使用模型对临床数据进行诊断。本发明提供的方法能够高效检测头部、中段、尾部以及ERC四种类别的精子形态学异常,从而对精液样本进行形态学分析,辅助临床诊断。

    一种基于深度学习辅助青少年特发性脊柱侧凸手术节段选择的方法

    公开(公告)号:CN117442334A

    公开(公告)日:2024-01-26

    申请号:CN202311293757.X

    申请日:2023-10-09

    Abstract: 本发明公开了一种基于深度学习辅助青少年特发性脊柱侧凸(Adolescent idiopathic scoliosis,AIS)手术节段选择的方法,包括以下步骤:训练数据的采集,根据标准采集数据,建成数据库;采用LabelMe对采集的图形进行标注和预处理;经过标注和预处理的图像作为输入,对网络模型进行训练,网络模型采用UNet和YOLOv8两种深度学习框架结合的方法;采用训练好的网络模型进行脊柱X线正位片的图像分割,给每个区域赋予一个类别标签;进行置信度修正,结合先验知识对网络模型给出的节段位置和类别计算出手术的置信度。该方法能够帮助医生快速准确地判断AIS的手术融合节段,从输入X线图像到计算置信度的整个过程无需人工干预。

    一种基于哈希学习的多文档机器阅读理解方法

    公开(公告)号:CN111460176B

    公开(公告)日:2023-11-07

    申请号:CN202010393230.4

    申请日:2020-05-11

    Applicant: 南京大学

    Inventor: 李武军 江悦

    Abstract: 本发明公开了一种基于哈希学习的多文档机器阅读理解方法,可以达到在线多文档阅读理解场景下预测准确率高、内存开销低的效果。该方法训练一个基于哈希学习的多文档阅读理解模型,机器在线预测时首先使用预训练自注意力模型提取问题和文档的文本特征信息,接着计算文档对应的二值矩阵表示,使用动态指针解码器预测各文档的答案及其概率,此外还预测各文档含有正确答案的概率,综合这两种概率对所有答案进行排序,选取最前面的答案输出。多文档动态指针解码器在每篇文档预测答案时考虑了其他文档的语义信息,提高了模型准确度。模型预测时将所有文档的二值矩阵表示存储在内存中,减少了存储开销。

Patent Agency Ranking