基于大语言模型的视障人群文档视觉问答指令生成方法和装置

    公开(公告)号:CN118410869A

    公开(公告)日:2024-07-30

    申请号:CN202410511790.3

    申请日:2024-04-26

    Applicant: 浙江大学

    Abstract: 基于大语言模型的视障人群文档视觉问答指令生成方法,其方法包括如下步骤:S110,基于公开文档数据集筛选候选文档;S120,对候选文档进行文字识别;S130,将文字识别结果处理为结构化文字信息;S140,根据结构化文字信息通过大语言模型生成面向视障人群问答指令数据。本发明提供的基于大语言模型的视障人群文档视觉问答指令生成方法,其中,所述方法通过筛选公开文档数据集,并通过其文字识别结果,构建结构化文字信息,并通过不同的面向视障人群的问答示例,利用大语言模型低成本高效率地生成了大量的文档视觉问答指令数据,改进了现有技术无法简单高效生成文档视觉文档指令数据的问题,从而帮助对面向视障人群的文档视觉问答模型的优化。

    一种基于逐位计算的存内计算方法以及存内计算阵列

    公开(公告)号:CN116663474A

    公开(公告)日:2023-08-29

    申请号:CN202310376046.2

    申请日:2023-04-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于逐位计算的存内计算方法以及存内计算阵列。方法中,按照高位到低位的次序,依次将单位特征矩阵中特征向量作为输入并与权重向量相乘获得对应的乘加结果,根据每次输入对应的乘加结果进行一次输出结果的计算,直至计算至最低位,根据最后一次的暂存变量直接进行计算,从而实现单位特征矩阵的乘加运算。存内计算阵列中,按照高位到低位的次序依次将单位特征矩阵中特征向量输入到积分器中,积分器将输入特征向量与权重向量相乘后的结果转换为电流后并发送给逐位模数转换器,逐位模数转换器中依次计算并输出各位的输出结果。本发明提高了计算并行度,并具备提前终止计算的能力,提高计算效率,也能够降低片上缓存的设计需求。

    一种数据库同步中实现数据缓存的方法

    公开(公告)号:CN103942259B

    公开(公告)日:2017-10-13

    申请号:CN201410108047.X

    申请日:2014-03-21

    Applicant: 浙江大学

    Abstract: 本发明公开了一种数据库同步中实现数据缓存的方法,包括插入步骤和消费步骤;插入步骤包括:11)在内存中开辟一个固定长度内存空间,用于存储监测到的源数据库同步数据;12)在数据库中新建一个表,用于存储监测到的源数据库同步数据和同步数据的新加属性;消费步骤包括:13)当一个数据消费请求到来时,首先从内存空间中读取,如果读取失败则从数据库表中检索,在读取的过程中,如果发现内存空间中不存在数据,此时从数据库表将数据拷贝到内存中,然后从内存中进行读取,利用数据库记录同步记录和缓解了内存空间的压力,避免了由于同步数据瞬时急剧增加导致的系统崩溃问题;实现了系统重启动后同步数据可恢复。

    一种数据库同步中实现数据缓存的方法

    公开(公告)号:CN103942259A

    公开(公告)日:2014-07-23

    申请号:CN201410108047.X

    申请日:2014-03-21

    Applicant: 浙江大学

    CPC classification number: G06F17/30575

    Abstract: 本发明公开了一种数据库同步中实现数据缓存的方法,包括插入步骤和消费步骤;插入步骤包括:11)在内存中开辟一个固定长度内存空间,用于存储监测到的源数据库同步数据;12)在数据库中新建一个表,用于存储监测到的源数据库同步数据和同步数据的新加属性;消费步骤包括:13)当一个数据消费请求到来时,首先从内存空间中读取,如果读取失败则从数据库表中检索,在读取的过程中,如果发现内存空间中不存在数据,此时从数据库表将数据拷贝到内存中,然后从内存中进行读取,利用数据库记录同步记录和缓解了内存空间的压力,避免了由于同步数据瞬时急剧增加导致的系统崩溃问题;实现了系统重启动后同步数据可恢复。

    一种基于词频逆文档频率的视频字幕显示优化方法和系统

    公开(公告)号:CN118317160A

    公开(公告)日:2024-07-09

    申请号:CN202410428196.8

    申请日:2024-04-10

    Abstract: 本发明提供了一种基于词频逆文档频率的视频字幕显示优化方法和系统,所述方法包括:获取语料库;基于TF‑I DF算法计算语料库中的每个词的逆文档频率;获取音视频文件中的文本信息和时间戳集合;统计所述文本信息中每个分词的词频;基于所述语料库中的每个词的逆文档频率和文本信息中的词频计算所述音视频文件中每句话的理解成本;基于所述理解成本动态调整所述音视频文件中不同句子的显示时长。利用词频逆文档频率计算视频中每个语句的理解成本;根据理解成本大小顺序分段,根据不同的语句所处分段不同,动态调整语句的显示时间。由此降低听障用户在学习网络课程中的困难,减少听障用户因为字幕显示时间较短而导致频繁地拖动进度条回看的操作。

    一种基于背景文字增强的视频字幕生成方法和系统

    公开(公告)号:CN118317159A

    公开(公告)日:2024-07-09

    申请号:CN202410428195.3

    申请日:2024-04-10

    Abstract: 本发明提供了一种基于背景文字增强的视频字幕生成方法和系统,包括:基于人声检测模型确定视频信息中文字出现的时间戳集合;基于所述时间戳集合获取与之对应的视频画面;提取所述视频画面中的文字信息;对所述文字信息进行分词和词性标注;基于TextRank算法计算每个分词的得分;基于所述每个分词的得分以及与之对应的词性标注生成与之对应的词性标注列表;依据预设的分配比例选取不同的词性标注列表中的分词组成热词表;根据分词的得分排序等比例设置热词表中不同分词的生效权重;基于所述热词表和视频信息生成视频字幕。利用热词表和音频数据,通过语音识别软件获取视频字幕信息,通过以上流程从而达到减少人工干预且提高视频字幕识别准确率的效果。

    基于同步串行接口信号的绝对值编码器模拟系统

    公开(公告)号:CN106679698A

    公开(公告)日:2017-05-17

    申请号:CN201710041757.9

    申请日:2017-01-20

    Applicant: 浙江大学

    CPC classification number: G01D5/2497

    Abstract: 本发明公开了一种基于同步串行接口信号的绝对值编码器模拟系统,该系统包括设置终端和绝对值编码器模拟板卡;设置终端通过蓝牙搜索绝对值编码器模拟板卡,并将其显示在设备列表中;用户通过设置终端设定SSI信号参数,并将这些参数发送到绝对值编码器模拟板卡;绝对值编码器模拟板卡接收设置终端发送的参数,根据这些参数生成SSI信号,并由板卡上的串行接口输出SSI信号。系统模拟绝对编码器输出可靠的SSI信号,用于解决SSI信号采集装置故障在实际生产中难以被检测的问题,减少了SSI信号采集装置的检测成本。

    面向纯定向自组织网络的分簇组网方法及装置

    公开(公告)号:CN119629700A

    公开(公告)日:2025-03-14

    申请号:CN202411603208.2

    申请日:2024-11-11

    Applicant: 浙江大学

    Abstract: 本申请提出一种面向纯定向自组织网络的分簇组网方法及装置,涉及网络技术领域,其中,方法包括:初始化节点,通过分簇及簇首共识机制,将节点划归入各簇并选出各簇的簇首节点;通过宽窄波束结合的快速组网机制,以各个所述簇首节点为中心节点构建星型网;响应于所述簇首节点无法继续担任簇首,重新选择簇首节点并重构网络。通过确定簇首节点并构建星型网,提高了网络的健壮性、抗毁性和通信效率。采用定向天线提高了网络容量和通信距离,增强隐蔽性、安全性和抗干扰能力的同时,也保证了一定的健壮性和抗毁性。

    基于深度学习目标检测算法的蓝莓灰霉病检测方法及系统

    公开(公告)号:CN111967385B

    公开(公告)日:2023-11-14

    申请号:CN202010824752.5

    申请日:2020-08-17

    Inventor: 陈杨 何勇 张艳超

    Abstract: 本发明涉及一种基于深度学习目标检测算法的蓝莓灰霉病检测方法及系统。该方法包括:获取蓝莓图片;采用ResNet‑50深度学习网络对蓝莓图像进行初步特征提取,得到多尺度的初步特征图像;利用卷积层和池化层进一步进行特征提取,得到每个尺度的初步特征图像对应的新特征图像;利用候选区域生成网络计算全部候选框;利用RoIAlign层将候选框与新特征图像上的特征进行匹配,得到每个尺度对应的匹配候选框的特征图;将所有尺度对应的匹配候选框的特征图融合,输入图像分类层,输出蓝莓灰霉病检测结果,包括健康的蓝莓花朵、健康的蓝莓果实、感染灰霉病的蓝莓花朵和感染灰霉病的蓝莓果实。本发明可以提高蓝莓灰霉病检测精度。

Patent Agency Ranking