一种基于大模型领域迁移的医疗影像报告生成方法

    公开(公告)号:CN117174240A

    公开(公告)日:2023-12-05

    申请号:CN202311401131.6

    申请日:2023-10-26

    Abstract: 本发明涉及影像报告生成技术领域,公开了一种基于大模型领域迁移的医疗影像报告生成方法;生成模型的训练过程包括:使用视觉编码模块,将放射性图像编码为视觉向量;将视觉向量以及生成提示,输入大模型领域实例迁移模块,得到中间报告以及实例迁移损失;将视觉向量、精细化提示和中间报告,输入大模型精细解码模块,得到最终的影像报告以及交叉熵损失;计算总损失,并使用反向传播算法更新大模型领域实例迁移模块以及大模型精细解码模块的参数。本发明通过域内实例排序的过程,能够实现在少量数据样本前提下,快速地实现将大语言模型向专有领域内特定任务信息的对齐;能够进一步提升大语言模型在医疗影像报告生成任务上的文本生成能力。

    一种基于视觉概念词关联结构化建模的图像描述方法

    公开(公告)号:CN116204674B

    公开(公告)日:2023-07-18

    申请号:CN202310475627.1

    申请日:2023-04-28

    Abstract: 本发明涉及计算机视觉和自然语言处理领域。本发明提出了一种基于视觉概念词关联结构化建模的图像描述方法,通过图像描述模型对输入的图像,生成所述图像的描述语句。图像描述模型的训练过程包括:将训练数据输入视觉特征提取和编码模块,得到视觉特征;将视觉特征输入视觉概念预测模块,得到对应的视觉概念词,将视觉概念词输入视觉概念关联结构化建模模块,得到结构化视觉语义概念词特征;将视觉特征和结构化视觉语义概念词特征输入描述生成模块,得到描述语句。基于总体损失函数训练模型。本发明提供的方法对单词在文本模态中的语言学先验的提取做了有效的约束。

    一种基于去噪式问答的对话摘要方法

    公开(公告)号:CN115905513B

    公开(公告)日:2023-07-14

    申请号:CN202310151490.4

    申请日:2023-02-22

    Abstract: 本发明涉及面向角色的对话摘要技术领域,公开了一种基于去噪式问答的对话摘要方法;本发明通过使用基于问答式的建模方法生成客服摘要,不仅将用户摘要与客服摘要之间的关系考虑进来,还集成来自用户摘要的信息,使生成的客服摘要与用户摘要更加匹配,提升了客服摘要的质量;本发明通过去噪机制,使用用户摘要模块生成的用户摘要替换传统方法训练模型时使用的用户摘要作为问题,与对话拼接后送入客服摘要编码器;使得模型在训练的过程中使用的数据更加契合其实际使用的场景,提升了模型生成客服摘要的性能。

    一种虚拟网络数据处理系统、方法、设备及介质

    公开(公告)号:CN116170252A

    公开(公告)日:2023-05-26

    申请号:CN202310109610.4

    申请日:2023-01-31

    Abstract: 本申请公开了一种虚拟网络数据处理系统、方法、设备及介质,所述系统包括:中心云以及至少一个边缘云;其中,所述中心云中至少包括中心控制器以及虚拟交换机,所述边缘云中至少包括边缘控制器以及虚拟交换机;所述虚拟交换机,用于管理所述中心云或所述边缘云中的物理机、容器以及虚拟机在二层东西向进行数据交换通信;所述边缘控制器,用于基于隧道封装技术管理所述边缘云中的物理机、容器以及虚拟机与所述中心云中的物理机、容器以及虚拟机在三层南北向进行数据转发;所述中心控制器,用于管理调度位于所述中心云中的虚拟交换机以及各所述边缘控制器以实现虚拟网络控制面进行跨数据中心的统一调度管理。

    一种法语语音合成前端处理方法及装置

    公开(公告)号:CN115985292A

    公开(公告)日:2023-04-18

    申请号:CN202211660913.7

    申请日:2022-12-23

    Inventor: 江源 祝玉龙 宋彦

    Abstract: 本发明公开了一种法语语音合成前端处理方法及装置,方法包括:对待处理法语文本数据进行预处理,得到预处理数据,所述预处理包括文本切分和数据压缩;基于节奏组预测模型确定所述预处理数据的节奏组划分数据,所述节奏组预测模型以Transformer网络为基础的双向编码文本表示变换器BERT搭建而成;基于所述节奏组划分数据确定所述待处理数据的韵律信息。上述方案从法语节奏组这一特性出发,在进行语音合成前端处理时,首先通过模型预测出节奏组信息,然后在节奏组划分的基础上企业都能够法语文本韵律信息,从而能够得到更加准确的语音合成前端韵律信息,提升后续法语语音合成发音准确性和韵律效果。

    跨语种语料合成方法、语音合成模型训练方法及相关装置

    公开(公告)号:CN115985283A

    公开(公告)日:2023-04-18

    申请号:CN202211060290.X

    申请日:2022-08-31

    Abstract: 本申请提供了跨语种语料合成方法、语音合成模型训练方法及相关设备,跨语种语料合成方法包括:获取跨语种文本、目标发音人嵌入向量,以及跨语种文本包含的各语种分别对应的语种嵌入向量;确定跨语种文本包含的各字符分别对应的字符嵌入向量;根据跨语种文本包含的各语种分别对应的语种嵌入向量、跨语种文本包含的各字符分别对应的字符嵌入向量,以及目标发音人嵌入向量,确定跨语种文本对应的语音频谱;由语音频谱和跨语种文本组成跨语种语料。本申请能够合成同一发音人语种切换的语音频谱,由此得到该语音频谱和跨语种文本组成的跨语种语料,从而后续可基于得到的跨语种语料构建出合成语音的自然度更高的语音合成模型。

    面向租户的服务器集群资源配额的调整方法、装置及设备

    公开(公告)号:CN115981852A

    公开(公告)日:2023-04-18

    申请号:CN202211646735.2

    申请日:2022-12-21

    Abstract: 本发明提供了一种面向租户的服务器集群资源配额的调整方法、装置及设备,该方法包括:响应于当前配额调整指令,获取各租户组的资源配额数据;所述资源配额数据包括当前配额、已使用配额、配额下限和配额上限;若当前配额调整指令为包含目标租户组的新任务所需资源额的指令,则判断新任务所需资源额是否满足预设调整条件;若满足,则将目标租户组的已使用配额与新任务所需资源额之和,减去该目标租户组的当前配额,得到配额差值;从各拥有未使用配额的租户组的当前配额中,扣除配额差值大小的资源;将配额差值大小的资源分配给目标租户组。如此,避免了各租户组的当前配额之和远超服务器集群的总资源额,进而保证了服务器集群的服务效率。

    多语种文本识别方法、装置、设备及可读存储介质

    公开(公告)号:CN115880694A

    公开(公告)日:2023-03-31

    申请号:CN202211675304.9

    申请日:2022-12-26

    Abstract: 本申请公开了一种多语种文本识别方法、装置、设备及可读存储介质,获取文本图像,将文本图像输入预先训练的多语种文本识别模型,输出与文本图像对应的文本识别结果,多语种文本识别模型为基于预先构建的词汇表,以训练文本图像作为训练样本,以训练文本图像对应的文本作为训练标签训练得到,而该词汇表中包括256个单字节的Unicode码,且词汇表中的不同单字节的Unicode码的组合足以覆盖所有语种的不同字符单元,所有语种的不同字符单元均由不同单字节的Unicode码的组合来表示,在实现多语种文本识别的基础上,将词汇表的大小固定为256,极大程度上降低了词汇表中的词汇量,使得模型的训练将变得非常简单,提高了多语种文本识别的效率。

    一种使用句法信息的受控文本生成方法

    公开(公告)号:CN115600581B

    公开(公告)日:2023-03-31

    申请号:CN202211593665.9

    申请日:2022-12-13

    Abstract: 本发明涉及受控场景的文本生成领域,公开了一种使用句法信息的受控文本生成方法,用于通过给定的输入文本,以及时刻t已输出文本,预测受控条件下当前时刻t的下一个输出字;本发明采用了标准的基于Transformer的编码‑解码架构,对输入中的每个字,通过注意力模块,利用与其关联的句法知识的表征,从而增强模型对文本生成过程中的受控特征的理解,从而提升生成的受控文本的质量。

Patent Agency Ranking