一种基于哈希学习的多文档机器阅读理解方法

    公开(公告)号:CN111460176A

    公开(公告)日:2020-07-28

    申请号:CN202010393230.4

    申请日:2020-05-11

    Applicant: 南京大学

    Inventor: 李武军 江悦

    Abstract: 本发明公开了一种基于哈希学习的多文档机器阅读理解方法,可以达到在线多文档阅读理解场景下预测准确率高、内存开销低的效果。该方法训练一个基于哈希学习的多文档阅读理解模型,机器在线预测时首先使用预训练自注意力模型提取问题和文档的文本特征信息,接着计算文档对应的二值矩阵表示,使用动态指针解码器预测各文档的答案及其概率,此外还预测各文档含有正确答案的概率,综合这两种概率对所有答案进行排序,选取最前面的答案输出。多文档动态指针解码器在每篇文档预测答案时考虑了其他文档的语义信息,提高了模型准确度。模型预测时将所有文档的二值矩阵表示存储在内存中,减少了存储开销。

    一种阶段性增大批量的机器学习方法

    公开(公告)号:CN111369008A

    公开(公告)日:2020-07-03

    申请号:CN202010143183.8

    申请日:2020-03-04

    Applicant: 南京大学

    Abstract: 本发明公开了一种阶段性增大批量的机器学习方法:首先将训练过程分成数个阶段,每个阶段增大批量大小到上一阶段批量大小的一定倍数。每个阶段运行的算法如下:初始化参数,计算参数更新次数,然后进行循环;每次循环从所有数据中随机选取该阶段对应的批量大小的数据,计算这些数据对应的梯度,然后解优化问题更新参数;最后从该阶段中所有循环的更新后的参数中选取一个作为下一个阶段的初始化参数。本发明基于阶段性训练框架,每个阶段增大批量大小,大的批量可以减少参数更新次数,并且可以更充分地利用GPU等计算资源,提升单机机器学习效率。也可以用来减少多机分布式机器学习中的通信次数和参数更新次数,提升分布式机器学习的效率。

    一种基于深度哈希的声纹检索方法

    公开(公告)号:CN110309343A

    公开(公告)日:2019-10-08

    申请号:CN201910574215.7

    申请日:2019-06-28

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于深度哈希的声纹检索方法,达到了声纹检索任务中存储空间低且检索高效的效果。该方法包括训练深度声纹哈希模型的步骤,构建哈希编码数据库的步骤,对查询语音在数据库中检索的步骤:首先构建端到端的深度神经网络结构,利用已标注过说话人身份的语音数据,训练深度神经网络模型,得到深度声纹哈希函数。之后通过深度声纹哈希函数计算训练集对应的哈希编码,构建数据库;对于新录入的语音数据,使用深度声纹哈希函数计算对应的哈希编码,实时增加到数据库。在检索过程中,对于给定的语音,使用深度声纹哈希函数计算对应的哈希编码,最后在数据库中基于索引或海明距离排序得到检索结果。

    一种基于深度学习的集装箱箱号检测与识别方法

    公开(公告)号:CN110210433A

    公开(公告)日:2019-09-06

    申请号:CN201910494473.4

    申请日:2019-06-10

    Applicant: 南京大学

    Inventor: 李武军 尤晶晶

    Abstract: 本发明公开了一种基于深度学习的集装箱箱号检测与识别方法,其使用深度学习的方法对集装箱进行实时检测和识别:在集装箱数据集构建阶段,对集装箱图片进行采集、过滤和标注得到集装箱数据集;在集装箱检测与识别网络构建阶段,构建轻量级检测与识别网络框架;在集装箱检测与识别网络训练阶段,训练数据预处理,使用真实标记训练检测与识别网络,保存模型参数;在集装箱检测与识别网络预测阶段,图像预处理,输入到检测网络和识别网络中,将检测识别出的集装箱箱号按序排列输出。

    一种基于聚类PU矩阵分解的个性化推荐方法

    公开(公告)号:CN107169830A

    公开(公告)日:2017-09-15

    申请号:CN201710338139.0

    申请日:2017-05-15

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于聚类PU矩阵分解的个性化推荐方法,包括使用聚类PU矩阵分解方法训练模型的步骤,对用户或商品进行推荐的步骤:首先收集已有的用户或商品的特征数据,根据用户对商品的行为构建二值关系矩阵,在二值关系矩阵中只有正例被观察到,定义基于聚类PU矩阵分解方法的学习模型,训练推荐算法模型;最后在推荐时,用训练得到的模型预测用户和商品的关系,得到预测值,根据预测值从高到低对用户或商品进行推荐。

    一种基于人工智能的肠镜合格退镜时间评估方法及系统

    公开(公告)号:CN119091206A

    公开(公告)日:2024-12-06

    申请号:CN202411153222.7

    申请日:2024-08-21

    Abstract: 本发明提出了一种基于人工智能的肠镜合格退镜时间评估方法,包括:构建基于ViT算法的检查图像质量评估模型及基于ViT算法的检查图像盲肠识别模型并分别对检查图像质量评估模型、盲肠识别模型进行预训练;通过内镜检查设备获取肠镜检查视频,将视频流解析为图片,并按照设定的速率截取图片;利用盲肠识别模型对截取图片进行盲肠帧识别,确定退镜开始时间;基于时序变化,检查图像质量评估模型对截取图片进行合格图像分类,计算肠镜退镜过程中合格图像的总数,确定实时合格退镜时间,及退镜结束时间。本发明可以自动分类肠镜检查图像,实时识别合格退镜图像,判断肠镜退镜开始与结束时间,从而计算合格退镜时间。

    一种基于低秩字典的大模型量化算法

    公开(公告)号:CN118095371A

    公开(公告)日:2024-05-28

    申请号:CN202410239722.6

    申请日:2024-03-04

    Applicant: 南京大学

    Inventor: 李武军 蔡文朴

    Abstract: 本发明公开一种基于低秩字典的大模型量化算法,采用训练后权重量化算法对大模型进行压缩。为了解决在量化比特较低时大模型量化性能下降明显的问题,本发明引入低秩的量化字典量化权重,设置量化字典的秩大于1,不再限制量化字典的秩为1,从而增强了量化字典的表达能力,减小了模型的量化损失。基于梯度的优化算法优化量化字典参数。通过二次量化的方法进一步压缩量化字典参数,使得增大字典的秩带来的额外存储开销很小。本发明可以适用现有主流大模型的压缩,可以把大模型权重从原有的16比特量化到小于4比特。在自然语言生成任务上和零样本推理任务上可以取得较小的性能损失,且在3比特时可以取得接近原模型的性能。

    一种基于哈希学习的问答系统构建方法

    公开(公告)号:CN110110063B

    公开(公告)日:2023-07-18

    申请号:CN201910361175.8

    申请日:2019-04-30

    Applicant: 南京大学

    Inventor: 李武军 徐栋

    Abstract: 本发明公开了一种基于哈希学习的问答系统构建方法,可以达到在线问答场景下模型精度高、内存开销低且响应时间短的效果。该方法首先根据问答系统的应用场景收集问答训练集,再结合深度学习技术构造端到端的问答系统网络模型,在训练集上通过机器学习优化算法训练模型。在系统部署前,通过答案收集算法收集答案知识库,使用训练好的问答系统网络模型计算答案知识库中答案的二值矩阵表示。在线部署时,对于收到的问题,首先使用问答系统网络模型进行问题编码,然后问答系统网络模型根据问题的编码和答案的二值矩阵表示计算问题和答案的匹配程度。最后根据答案知识库中的答案与问题的匹配程度对答案进行排序,将排在前面的答案作为响应返回给用户。

    基于轴向自注意力的胰腺超声内镜站点识别方法和系统

    公开(公告)号:CN116030243A

    公开(公告)日:2023-04-28

    申请号:CN202211655098.5

    申请日:2022-12-21

    Abstract: 本发明提供一种基于轴向自注意力的胰腺超声内镜站点识别方法和系统,其中方法包括获取扫查的标准站点组成的引导线以及标准站点的胰腺超声内镜图像;将胰腺超声内镜图像进行分类;构建基于空洞轴向自注意力的第一标准站点识别网络;将训练样本图像和测试样本图像依次输入至第一标准站点识别网络中,得到图像训练分类结果;根据训练分类结果和真实站点标签计算目标损失函数,并更新第一标准站点识别网络的参数,得到第二标准站点识别网络;采用第二标准站点识别网络按照引导线扫查标准站点并提示扫查盲区。本发明通过构建高效和准确的站点识别模型,能在胰腺超声内镜扫查过程中自动识别检查盲区,避免胰腺超声内镜检查的漏查漏诊。

    一种基于深度学习的集装箱箱号检测与识别方法

    公开(公告)号:CN110210433B

    公开(公告)日:2023-04-28

    申请号:CN201910494473.4

    申请日:2019-06-10

    Applicant: 南京大学

    Inventor: 李武军 尤晶晶

    Abstract: 本发明公开了一种基于深度学习的集装箱箱号检测与识别方法,其使用深度学习的方法对集装箱进行实时检测和识别:在集装箱数据集构建阶段,对集装箱图片进行采集、过滤和标注得到集装箱数据集;在集装箱检测与识别网络构建阶段,构建轻量级检测与识别网络框架;在集装箱检测与识别网络训练阶段,训练数据预处理,使用真实标记训练检测与识别网络,保存模型参数;在集装箱检测与识别网络预测阶段,图像预处理,输入到检测网络和识别网络中,将检测识别出的集装箱箱号按序排列输出。

Patent Agency Ranking