-
公开(公告)号:CN103735394A
公开(公告)日:2014-04-23
申请号:CN201410011174.8
申请日:2014-01-10
Applicant: 复旦大学
IPC: A61H3/06
Abstract: 本发明属于盲人用工具技术领域,具体为一种盲人用立体视觉指示器。该系统首先通过感受器模块,使用手机上内置的两个或多个照相机构成的立体照相机获得场景图像;然后利用特征提取模块,使用相应图像处理的算法,分析图像数据,提取图像特征;再利用效应器模块,得到图像中距离、形状的信息;最后利用转化输出模块,将距离和形状的信息转化成盲人可以接受的音频,并通过耳机输出给盲人以供识别。本发明将最新的立体视觉处理算法应用于低成本的稳定的立体视觉移动手机,有助于盲人的出行等日常生活。
-
公开(公告)号:CN101858977A
公开(公告)日:2010-10-13
申请号:CN201010197999.5
申请日:2010-06-10
Applicant: 复旦大学
Abstract: 本发明属于空间定位技术领域,具体为一种基于双红外系统的室内空间定位方法与系统。本发明的定位方法包括反射式定位和透射式定位两种。假设地面与天花板平行,信号源与接收端共同位于地面上,其基本原理是通过测量由信号源发射到天花板、再进一步反射到接收端的两束不同频率红外信号之间的相位差,得到两束信号的距离差信息,再通过公式计算,即得到接收点的坐标。本发明的定位系统分为二维平面定位系统和三维平面定位系统。与传统GPS等室外定位技术相比,本发明具有成本低、精度高、不需移动即可定位等优点,有广阔的应用前景。如在智能机器人、物联网等领域都可获应用。
-
公开(公告)号:CN101540891A
公开(公告)日:2009-09-23
申请号:CN200910048986.9
申请日:2009-04-09
Applicant: 复旦大学
IPC: H04N7/18 , G06K9/46 , G06K9/64 , G06K9/00 , G08B13/196
Abstract: 一种基于监控视频的行李传送仓人体检测系统,涉及一种视频监控技术,具体地说,涉及一种数字视频与图像的处理与应用。其应用例如,行李传送仓作为机场客运、货运系统当中的重点安全区域,有必要对进入仓体的人进行实时检测。本发明利用自主创新的计算机视觉特征构建实时视频监控检测模块,自动检测传送仓中出现的人体。该模块降低了对入侵人体检测的人力资源的消耗,避免了现有检测技术的种种弊端,利用监控视频,实现自动智能检测,从而提高了监控质量。
-
公开(公告)号:CN101036838A
公开(公告)日:2007-09-19
申请号:CN200710039652.6
申请日:2007-04-19
Applicant: 复旦大学
Abstract: 本发明属于机器人技术领域,具体涉及一种具备丰富的运动自由度、并能智能控制的机器人,是一种与智能机器人紧密结合的新型学习、娱乐平台。机器人本体结构包括头颈、手臂、躯体、底座等结构,具备9个独立的运动自由度。系统采用PID反馈控制,能够精确控制伺服电机的速度,从而控制各关节的速度、方向和位置。这是一个标准的机器人学习和游戏操作交互平台,能够运行多种不同的、能和这个控制台的标准接口相兼容的应用程序,主要包括学习、游戏程序和机器人本身的学习程序。本发明将移动式的拟人机器人与学习、娱乐等相结合,用户可以通过视频、音频等信息与机器人进行交互,在学习和娱乐的过程中,机器人可以进行肢体动作和语音交流。
-
公开(公告)号:CN119762419A
公开(公告)日:2025-04-04
申请号:CN202411495691.7
申请日:2024-10-25
Applicant: 复旦大学
IPC: G06T7/00 , G06V10/80 , G06V10/26 , G06V10/762 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种用于细粒度支气管气道分割的双阶段主动学习方法,方法包括以下步骤:S1、基于预训练的自适应支气管管状物分割模型生成未标注医学图像数据集的嵌入向量;S2、选择多样性最大的候选样本加入最终样本集;S3、判断最终样本集的样本数是否达到阈值,若是则执行S4,反之继续选择多样性最大的候选样本加入最终样本集;S4、对所述最终样本集进行标注,标注后的样本集作为预训练的自适应支气管管状物分割模型的训练集进行训练,得到优化的自适应支气管管状物分割模型,基于所述优化的自适应支气管管状物分割模型得到复杂支气管网络分割结果。与现有技术相比,本发明具有提升所选样本集的价值密度,提高细微支气管识别精度等优点。
-
公开(公告)号:CN118468278A
公开(公告)日:2024-08-09
申请号:CN202410488875.4
申请日:2024-04-23
Applicant: 复旦大学
Abstract: 本发明属于人工智能多模态模型安全技术领域,具体为一种基于协同多模态交互的AI模型安全评估方法。本发明聚焦于黑盒迁移攻击,使用强有力的对抗攻击手段,对目标多模态模型进行攻击,以模型在受到攻击后的性能表现来进一步评估其安全性;具体包括:选定待攻击的源模型和目标模型,选定评估模型所需的待攻击图片以及文本,对选定的攻击图片和文本进行预处理,根据协同多模态交互算法生成图片以及文本的对抗样本,评估模型性能;在协同多模态交互过程中,融合嵌入两种策略:嵌入引导,利用多模态特征空间中的相似嵌入进行文本攻击;交互增强,利用交互攻击中的梯度信息,生成更鲁棒的对抗样本,进行更有效评估AI多模态模型的安全性能。
-
公开(公告)号:CN116704198A
公开(公告)日:2023-09-05
申请号:CN202210174858.4
申请日:2022-02-24
Applicant: 复旦大学
IPC: G06V10/40 , G06V10/774 , G06V10/82 , G06N5/02 , G06N5/04 , G06N3/0464 , G06N3/042 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种基于多模态信息引导的知识增强视觉问答方法,具有这样的特征,包括以下步骤:步骤1,构建图像的全局视觉模态特征并提取视觉模态信息;步骤2,基于所述视觉模态信息的问题实体进行注意力操作,提取需要引入外部知识的所述问题实体,并对提取的所述问题进行知识引入,得到增强问题;步骤3,将增强问题的编码为推理指令,以图卷积网络的方法在图像生成的场景图中以推理指令为引导进行推理,最后获取相应的答案。
-
公开(公告)号:CN111275172B
公开(公告)日:2023-09-01
申请号:CN202010068826.7
申请日:2020-01-21
Applicant: 复旦大学
Inventor: 张文强
IPC: G06N3/0499 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及一种基于搜索空间优化的前馈神经网络结构搜索方法,包括以下步骤:S1:按照搜索空间的定义随机生成设定数量的搜索空间并转化为离散编码,构建搜索空间初始种群;S2:利用超网络对初始种群中的所有搜索空间进行性能评估;S3:根据性能评估结果对搜索空间进行优化,输出最优搜索空间;S4:对应搜索算法在最优搜索空间中,搜索设定模型评估算法下最优的前馈神经网络结构,并利用该神经网络结构完成需求数据集下的需求任务,与现有技术相比,本发明具有提高神经网络结构搜索的效率和性能等优点。
-
公开(公告)号:CN113218435B
公开(公告)日:2023-01-17
申请号:CN202110496234.X
申请日:2021-05-07
Applicant: 复旦大学
IPC: G01D18/00
Abstract: 本发明提供一种多传感器时间同步方法,包括如下步骤:步骤1,对多传感器的时间误差进行补偿,将时间同步到相同的基准时标下,得到同一基准时标下的多传感器;步骤2,对同一基准时标下的多传感器的硬件和软件分别进行硬同步和软同步,得到硬件同步和软件同步的多传感器,即得到同步后的多传感器,其中,步骤2中,进行硬同步的方法为全局时间同步算法、本地时间同步算法以及多传感器联合外参标定算法。本发明的多传感器时间同步方法通过对因各传感器时钟精度不同形成的时间偏差进行研究,从硬件和软件两方面对时间误差进行补偿,将时间同步到统一基准时标下,实现了基于多源传感器的硬同步和软同步。
-
公开(公告)号:CN108376387B
公开(公告)日:2021-09-17
申请号:CN201810008937.1
申请日:2018-01-04
Applicant: 复旦大学
Abstract: 本发明属于计算机数字图像处理技术领域,具体为一种基于聚合膨胀卷积网络的图像去模糊方法。本发明包括构建深度神经网络:基于条件对抗生成网络,包含生成器与鉴别器,生成器结构使用堆叠的自编码器模块,自编码器模块使用自编码器结构与跳跃连接,在构建模块上使用残差模块,残差模块使用残差网络以及多路聚合膨胀卷积,鉴别器使用5层卷积神经网络;训练深度神经网络:使用公开的、真实场景下的模糊图像数据集,利用图像内容损失函数与对抗损失函数,训练前一步中构建的深度神经网络;利用训练好的网络模型对模糊图像进行去模糊处理。本发明方法能够保证去模糊效果,并快速高效地将模糊图像恢复成清晰图像,可极大地提高图像去模糊的效率。
-
-
-
-
-
-
-
-
-